Richard P. Feynman, Robert B. Leighton, Matthew Sands Feynman-Vorlesungen über Physik 5
Richard P. Feynman, Robert B. Leighton, Matthew Sands
Feynman-Vorlesungen über Physik 5
Quantenmechanik New Millennium-Edition
DE GRUYTER
Autoren Richard P. Feynman Robert B. Leighton Matthew Sands Deutsche Übersetzung: Dr. Henner Wessel, Dr. Karen Lippert Wissenschaftliche Beratung der Übersetzung: Prof. Dr. Peter Beckmann, Prof. Dr. Helmut Jarosch
ISBN 978-3-11-036773-7 e-ISBN (PDF) 978-3-11-036774-4 e-ISBN (EPUB) 978-3-11-039864-9 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/Boston Coverabbildung: generalfmv/istock/thinkstock Druck und Bindung: Hubert und Co. GmbH & Co. KG, Göttingen ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com
Über Richard Feynman Richard P. Feynman wurde 1918 in Brooklyn geboren und erlangte 1942 an der Princeton University, New Jersey, USA seinen Ph.D. Trotz seiner Jugend spielte er während des Zweiten Weltkriegs eine wichtige Rolle im Manhattan-Projekt des Los Alamos Laboratory. Anschließend lehrte er an der Cornell University, Ithaca, New York sowie am Caltech, dem California Institute of Technology in Pasadena, USA. 1965 erhielt er zusammen mit Shinichir¯ o Tomonaga und Julian Schwinger den Physik-Nobelpreis für seine Arbeiten zur Quantenelektrodynamik. Feynman erhielt den Nobelpreis für die erfolgreiche Lösung von Problemen im Zusammenhang mit der Theorie der Quantenelektrodynamik. Er entwickelte auch eine mathematische Theorie, die die Phänomene der Suprafluidität bei flüssigem Helium erklärte. Außerdem leistete er, zusammen mit Murray Gell-Mann, grundlegende Arbeiten zur schwachen Wechselwirkung und zum Beta-Zerfall. In späteren Jahren spielte Feynman eine Schlüsselrolle bei der Entwicklung der Quark-Theorie, indem er ein Partonen-Modell hochenergetischer Streuprozesse vorlegte. Zusätzlich zu diesen Leistungen führte Feynman grundlegende neue Berechnungstechniken und Darstellungsformen in die Physik ein, unter anderem die allgegenwärtigen Feynman-Diagramme, die – vielleicht mehr als irgendein anderer Formalismus in der jüngeren Wissenschaftsgeschichte – die Art und Weise veränderten, in der elementare physikalische Prozesse beschrieben und berechnet werden. Feynman war ein außerordentlich erfolgreicher Lehrer. Von all seinen zahlreichen Auszeichnungen war er auf die „Oersted Medal for Teaching“, die er 1972 erhielt, besonders stolz. Die „Feynman-Vorlesungen über Physik“, erstmals 1963 veröffentlicht, wurden von einem Rezensenten im „Scientific American“ wie folgt beschrieben: „Schwierig, aber nahrhaft und sehr appetitlich. Auch noch nach 25 Jahren sind sie der Leitfaden für Dozenten und besonders gute Physikstudenten.“ Mit dem Ziel, das physikalische Verständnis von Laien zu verbessern, schrieb Feynman die beiden Bücher „Vom Wesen physikalischer Gesetze“ und „QED. Die seltsame Theorie des Lichts und der Materie“. Er ist außerdem Autor vieler anspruchsvoller Veröffentlichungen, die zu klassischen Referenzen und Lehrbüchern für Forscher und Studenten wurden. Richard Feynman war eine geschätzte Persönlichkeit des öffentlichen Lebens. Seine Arbeit in der Untersuchungskommission zur Challenger-Katastrophe ist weithin bekannt, insbesondere seine berühmte Demonstration der Anfälligkeit der O-Ringe für Kälte – ein elegantes Experiment, das nichts weiter als ein Glas Eiswasser erfordert. Weit weniger bekannt sind seine Verdienste im „California State Curriculum Committee“, in dem er in den 1960ern gegen die Mittelmäßigkeit von Lehrbüchern polemisierte. Die bloße Aufzählung der unzähligen wissenschaftlichen und pädagogischen Leistungen Richard Feynmans kann das Wesen dieses Mannes nicht angemessen beleuchten. Wie jeder Leser – selbst eines seiner Fachartikel – bemerkt, strahlt Feynmans heitere und vielseitige Persönlichkeit durch sein gesamtes Werk hindurch. Neben seiner Profession als Physiker betätigte
VI
Über Richard Feynman
sich Feynman im Laufe seines Lebens als Panzerschrankknacker, Künstler, Tänzer und BongoSpieler, verdiente Geld mit dem Reparieren von Radios und wirkte sogar an der Entzifferung der Maya-Schrift mit. Immer neugierig auf die Welt, war er ein mustergültiger Empiriker. Richard Feynman starb am 15. Februar 1988 in Los Angeles.
Vorwort zur New Millennium Edition1 Mehr als 50 Jahre sind vergangen, seit Richard Feynman seine einführenden Physikvorlesungen hielt, aus denen die drei2 Bände der „Feynman-Vorlesungen über Physik“ entstanden sind. In diesen 50 Jahren hat sich unser physikalisches Verständnis grundlegend gewandelt, aber die „Feynman-Vorlesungen über Physik“ haben weiterhin Bestand. Sie sind heute noch genauso wertvoll wie damals, als sie erstmals veröffentlicht wurden – dank Feynmans einzigartigen Einsichten in die Physik und seines außergewöhnlichen pädagogischen Talents. Die FeynmanVorlesungen wurden weltweit studiert, von Anfängern ebenso wie von ausgebildeten Physikern; allein in englischer Sprache wurden über anderthalb Millionen Exemplare verkauft, außerdem wurde das Werk in mindestens ein Dutzend Sprachen übersetzt. Vermutlich hat kein anderes mehrbändiges Physikbuch so lange so großen Einfluss ausgeübt. Mit der vorliegenden New Millennium Edition beginnt ein neues Zeitalter für die FeynmanVorlesungen über Physik: das 21. Jahrhundert und damit das Zeitalter des elektronischen Publizierens. Das Manuskript wurde mit dem Satzsystem LATEX gesetzt, und sämtliche Abbildungen wurden mit moderner Software neu gezeichnet.3 Für die Printversion dieser Edition sind die Konsequenzen nicht besonders aufsehenerregend: Sie sieht fast genau so aus wie das Original, jene roten Bücher, die Physikstudenten seit Jahrzehnten kennen und lieben. Die beiden Hauptunterschiede sind zum einen der deutlich erweiterte und verbesserte Index und zum anderen die Korrektur von 885 Errata4 , die von Lesern in den fünf Jahren seit dem Erstdruck der vorherigen Ausgabe gefunden wurden. Auch wird es nun leichter möglich sein, Errata zu korrigieren, die von künftigen Lesern gefunden werden. Darauf werde ich später noch zurückkommen. Die E-Book-Version5 dieser Ausgabe sowie die Enhanced Electronic Version sind echte Innovationen. Im Gegensatz zu den meisten früheren E-Book-Versionen von Fachbüchern, in denen die Formeln und Abbildungen – und manchmal sogar der Text – verpixelt aussahen, wenn man versuchte, sie zu vergrößern, können alle Inhalte des E-Books der New Millennium Edition (außer den Fotos) dank der zugrunde liegenden LATEX-Kodierung ohne Qualitätsverluste beliebig vergrößert werden. Und die Enhanced Electronic Version mit ihren Audios und Tafelbildern aus Feynmans Originalvorlesungen sowie den Links zu weiteren Ressourcen ist eine Innovation, die Feynman sicher großes Vergnügen bereitet hätte. 1 2 3 4
5
Anmerkung des Verlags: Das Vorwort bezieht sich auf die amerikanische Originalauflage. Auf Abweichungen und Besonderheiten der deutschen Ausgabe wir in den folgenden Fußnoten hingewiesen. Die deutsche Übersetzung erscheint in fünf Bänden, da die ersten beiden Bände aufgrund ihres hohen Seitenumfangs geteilt wurden. Bereits die deutschen Vorauflagen wurden mit LATEX gesetzt und mit neu gezeichneten Abbildungen versehen. Der Großteil der Errata war für die Übersetzung irrelevant, da es sich um (englische) typografische Fehler handelte oder falsche Querverweise/fehlende Klammern etc. betraf, die in den meisten Fällen erkannt und korrigiert wurden. Alle auf www.feynmanlectures.info gelisteten Errata wurden berücksichtigt. Im Deutschen erscheint erstmalig die E-Book Version der „New Millennium Edition“.
VIII
Vorwort zur New Millennium Edition
Erinnerungen an die Feynman-Vorlesungen Diese drei Bände bilden eine in sich geschlossene pädagogische Abhandlung. Sie sind auch eine Zusammenstellung der einführenden Physikvorlesungen, die Feynman in den Jahren 1961 bis 1964 gehalten hat und die für alle Studienanfänger und Studenten des zweiten Studienjahres am Caltech unabhängig von ihren Hauptfächern obligatorisch waren. So wie ich fragen sich vielleicht die Leser, wie Feynmans Vorlesungen die Studierenden beeinflusst haben. Feynman selbst gibt in seinem Vorwort zu diesen drei Bänden eine eher pessimistische Einschätzung. „Ich glaube nicht, dass ich mit den Studenten sehr gut zurecht gekommen bin“, schreibt er. Matthew Sands dagegen äußerte sich im Vorwort zu Feynmans Tipps zur Physik sehr viel zuversichtlicher. Aus Neugier kontaktierte ich im Frühjahr 2005 eine quasi-zufällig ausgewählte Gruppe von 17 Studenten (von insgesamt ungefähr 150) aus dem 1961–63er Kurs – einige von ihnen hatten damals große Schwierigkeiten mit dem Kurs, andere hatten ihn mit Leichtigkeit bewältigt; ihre Hauptfächer waren Biologie, Chemie, Ingenieurwissenschaften, Geologie, Mathematik, Astronomie und natürlich auch Physik. Die Zeit mag ihre Erinnerung ein wenig verklärt haben, doch ungefähr 80% der Befragten gaben an, dass Feynmans Kurs ein Höhepunkt ihrer College-Zeit war. „Es war, als ginge man in die Kirche.“ Die Vorlesungen waren „eine grundlegende Erfahrung“, „die Erfahrung meines Lebens, wahrscheinlich das Wichtigste, das ich vom Caltech mitgenommen habe“. „Eigentlich war ich Biologie-Student, aber als Höhepunkt meiner Bachelor-Zeit stachen die Feynman-Vorlesungen hervor . . . obwohl ich zugeben muss, dass ich die Hausaufgaben selten rechtzeitig erledigen konnte und es mir schwer fiel, sie überhaupt zu bewältigen.“ „Ich gehörte zu den am wenigsten aussichtsreichen Studenten im Kurs und ich habe trotzdem nie eine Vorlesung versäumt . . . Ich erinnere mich und spüre immer noch Feynmans Freude an der Entdeckung . . . Seine Vorlesungen hatten eine emotionale Wucht, die vermutlich in den gedruckten Vorlesungen nicht mehr zu spüren ist.“ Einige Studenten haben jedoch auch negative Erinnerungen, und dafür wurden vor allem die beiden folgenden Gründe genannt. Erstens: „In der Vorlesung konnte man nicht lernen, wie man selbst Aufgaben löst. Feynman war zu geschickt – er kannte alle möglichen Tricks, er wusste, welche Näherungen man machen konnte, und er verfügte aufgrund seiner Erfahrung und seiner Genialität über eine Intuition, die ein Studienanfänger einfach nicht haben konnte.“ Feynman und seine Kollegen waren sich dieser Schwachstelle in ihrem Kurs bewusst und versuchten, durch eine Reihe von Exkursen Abhilfe zu schaffen, die später als Ergänzungsband mit dem Titel Feynman’s Tips on Physics6 veröffentlicht wurden. Der Band enthält drei Vorlesungen von Feynman über das Lösen von Problemen sowie eine Sammlung von Übungsaufgaben und Lösungen, die von Robert B. Leighton und Rochus Vogt zusammengestellt wurde. Der zweite Kritikpunkt war folgender: „Frustrierend war, dass man nie wusste, was in der nächsten Vorlesung besprochen wird, und die daraus resultierende Unsicherheit, das Fehlen eines Lehrbuchs oder einer Referenz, um eine Verbindung zu dem herzustellen, was wir in der Vorlesung gehört hatten. . . . Ich fand die Vorlesungen spannend, und im Vorlesungssaal schien auch alles verständlich, aber wenn ich später draußen versuchte, die Details zu rekonstruieren, war es als ob ich Sanskrit gehört hätte.“ Nun, dieses Problem wurde natürlich durch die drei gedruckten Bände der Feynman-Vorlesungen gelöst. Sie wurden das maßgebliche Lehrbuch, aus dem die Caltech-Studenten noch viele Jahre später lernten, und sie sind noch heute lebendig als einer der wichtigsten Teile von Feynmans Erbe. 6
Deutscher Titel: Tipps zur Physik.
Vorwort zur New Millennium Edition
IX
Zur Geschichte der Errata Die Feynman-Vorlesungen über Physik wurden von Feynman und seinen Koautoren, Robert B. Leighton und Matthew Sands, in sehr kurzer Zeit verfasst. Sie arbeiteten auf der Basis von Tonbandaufzeichnungen und Fotos der Tafelbilder, die in Feynmans Vorlesungen gemacht wurden7 (beides wurde in die Enhanced Electronic Version der New Millennium Edition aufgenommen). In Anbetracht des Zeitdrucks, unter dem Feynman, Leighton und Sands standen, war es unvermeidlich, dass sich in die erste Ausgabe viele Fehler eingeschlichen haben. Feynman führte in den Jahren nach der Veröffentlichung lange Listen von mutmaßlichen Errata – Errata, die von Studenten und Fakultatätsangehörigen gefunden wurden, aber auch von Lesern auf der ganzen Welt. In den 1960er- und den frühen 70er-Jahren nahm sich Feynman trotz seines aufregenden Lebens die Zeit, die meisten, wenn auch nicht alle, vermeintlichen Fehler in den Bänden I und II zu prüfen. In den Nachdrucken wurden entsprechende Korrekturen vorgenommen. Allerdings erreichte Feynmans Pflichtgefühl im Vergleich zu seiner Begeisterung für die Entdeckung neuer Dinge nie eine Dimension, die ihn dazu gebracht hätte, sich auch mit den Errata von Band III zu beschäftigen.8 Nach seinem viel zu frühen Tod im Jahr 1988 wurden die Listen der ungeprüften Errata in den Archiven des Caltech deponiert, wo sie in Vergessenheit gerieten. 2002 informierte mich Ralph Leighton (der Sohn Robert Leightons und ein Landsmann Feynmans) über die alten Errata und eine neue lange Liste, zusammengestellt von Ralphs Freund Michael Gottlieb. Leighton schlug dem Caltech vor, eine neue Ausgabe der Feynman-Vorlesungen in Angriff zu nehmen, in der sämtliche Errata korrigiert sind, und diese zusammen mit einem Ergänzungsband, den Tipps zur Physik, zu veröffentlichen, die er selbst zusammen mit Gottlieb vorbereiten wollte. Feynman war mein Held und ein enger persönlicher Freund. Als ich die Listen der Errata und den Stoff des vorgeschlagenen Ergänzungsbandes sah, erklärte ich mich sofort bereit, das Projekt im Auftrag des Caltech zu betreuen (dem langjährigen akademischen Zuhause Feynmans, an das er und seine Koautoren Leighton und Sands alle Rechte an den Feynman-Vorlesungen übertragen hatten). Nach einem Jahr der sorgfältigen Überarbeitung durch Gottlieb und genauer Prüfung der Errata sowie des Ergänzungsbandes durch Michael Hartl (einem herausragenden Postdoc am Caltech) waren 2005 die Definitive Edition der Feynman-Vorlesungen über Physik und der Ergänzungsband mit Feynmans Tipps zur Physik fertig. Jedenfalls dachte ich, dass diese Ausgabe „definitiv“ – im Sinne von abschließend – sein würde. Womit ich nicht gerechnet hatte, war die enthusiastische Reaktion der Leser in aller Welt auf einen Aufruf von Gottlieb, weitere Errata zu identifizieren und sie über die Website www.feynmanlectures.info zu melden, die er zu diesem Zweck eingerichtet hatte und die noch immer existiert. In den fünf Jahren, die seitdem vergangen sind, wurden 965 neue Errata gemeldet, die der sorgfältigen Überprüfung durch Gottlieb, Hartl und Nate Bode (ein herausragender Physikstudent am Caltech und Hartls Nachfolger bei der Überprüfung der Errata) standgehalten haben. Von diesen 965 geprüften Errata wurden 80 bereits im vierten Nachdruck der Definitive Edition (August 2006) korrigiert. Die übrigen 885 wurden im Erstdruck der New Millennium Edition korrigiert (332 in Band I, 263 in Band II und 200 in Band III). Die Einzelheiten zu den Errata sind auf der Website www.feynmanlectures.info dokumentiert. 7 8
Zur Entstehung der Feynman Lectures on Physics siehe „Feynmans Vorwort“ sowie die Vorworte von Robert B. Leighton und Matthew Sands in den einzelnen Bänden. 1975 begann er mit der Überprüfung der Errata von Band III, wurde aber durch andere Aufgaben aufgehalten und konnte diese Arbeit nicht beenden. Deshalb wurden in Band III keine Korrekturen vorgenommen.
X
Vorwort zur New Millennium Edition
Offensichtlich ist es zu einem weltweiten Community-Projekt geworden, die Feynman Lectures fehlerfrei zu machen. Im Namen des Caltech danke ich den 50 Lesern, die seit 2005 Beiträge geliefert haben, und den vielen weiteren, die in den kommenden Jahren zur Verbesserung beitragen werden. Die Namen aller bekannten Einsender sind unter www.feynmanlectures. info/flp_errata.html angegeben. Die Errata lassen sich im Wesentlichen drei Typen zuordnen: (i) typografische Fehler im Text; (ii) typografische und mathematische Fehler in Formeln, Tabellen und Abbildungen – falsche Vorzeichen, falsche Ziffern (z. B. eine „5“, die eigentlich eine „4“ sein sollte), fehlende Indizes oder Exponenten, fehlende Klammern oder Gleichungsterme usw.; (iii) falsche Querverweise auf Kapitel, Tabellen und Abbildungen. Solche Fehler können, auch wenn sie für erfahrene Physiker nicht sonderlich gravierend sind, für Studierende frustrierend und verwirrend sein, und gerade diese sind ja die Leserschaft, die Feynman erreichen wollte. Es ist bemerkenswert, dass unter den 1165 Errata, die unter meiner Obhut korrigiert wurden, nur sehr wenige sind, die ich als echte physikalische Fehler bezeichnen würde. Ein Beispiel hierfür befand sich in Band II9 . Auf Seite 89 heißt es nun „keine statische Ladungsverteilung im Inneren eines geschlossenen geerdeten Leiters [kann] Felder außerhalb erzeugen“ (das Wort „geerdet“ fehlte in früheren Auflagen). Auf diesen Fehler wurde Feynman von etlichen Lesern hingewiesen, unter anderem von Beulah Elizabeth Cox, einer Studentin des College of William and Mary, die sich in einer Prüfung auf Feynmans fehlerhafte Passage verlassen hatte. An Beulah Cox schrieb Feynman 1975:10 „Ihr Dozent hatte recht, Ihnen keine Punkte zu geben, da Ihre Antwort falsch ist, wie er mithilfe des gaußschen Gesetzes zeigte. Sie sollten in der Wissenschaft der Logik und sorgfältig dargelegten Argumenten folgen, und nicht Autoritäten. Auch sollten Sie das Buch genau lesen und es verstehen. Ich habe einen Fehler gemacht, also steht im Buch etwas Falsches. Wahrscheinlich habe ich an eine geerdete leitende Kugel gedacht oder an die Tatsache, dass die sich an verschiedenen Orten im Inneren bewegenden Ladungen nicht die Dinge draußen beeinflussen. Ich bin mir nicht sicher warum, aber ich habe es vermasselt. Und Sie haben es auch vermasselt, weil Sie mir geglaubt haben.“
Wie es zur vorliegenden New Millennium Edition kam Zwischen November 2005 und Juli 2006 wurden über www.feynmanlectures.info 340 Errata gemeldet. Bemerkenswert war, dass der größte Teil dieser Einsendungen von ein und derselben Person stammten: Dr. Rudolf Pfeiffer, damals Postdoc an der Universität Wien. Der Verlag, Addison Wesley, brachte 80 Errata in Ordnung, scheute aber wegen der Kosten davor zurück, noch mehr zu korrigieren, denn die Bücher wurden im Offset-Verfahren gedruckt, wobei die Druckplatten aus den 1960er-Jahren verwendet wurden. Einen Fehler zu korrigieren bedeutete daher, jeweils die ganze Seite neu zu setzen – und um sicherzustellen, dass sich keine neuen Fehler einschleichen, wurde die betreffende Seite von zwei verschiedenen Personen, also doppelt, gesetzt. Die Ergebnisse mussten dann verglichen und wiederum von mehreren Personen Korrektur gelesen werden. Das Ganze wird eine sehr kostenintensive Angelegenheit, wenn es um Hunderte von Errata geht. 9 10
Band III der deutschen Ausgabe. Michelle Feynman (Ed.): Perfectly Reasonable Deviations from the Beaten Track, The Letters of Richard P. Feynman, Basic Books, New York 2005, S. 288f.
Vorwort zur New Millennium Edition
XI
Gottlieb, Pfeiffer und Ralph Leighton waren sehr unglücklich mit dieser Situation, und deshalb formulierten sie einen Plan, der darauf abzielte, alle Errata zu korrigieren und gleichzeitig ein E-Book und die Enhanced Electronic Version der Feynman Lectures herzustellen. Diesen Plan trugen sie im Jahr 2007 an mich als Vertreter des Caltech heran. Ich war vorsichtig begeistert. Nachdem ich die Details gesehen hatte, darunter ein Probekapitel der Enhanced Electronic Version, empfahl ich dem Caltech, Gottlieb, Pfeiffer und Leighton bei der Ausführung ihres Plans zu unterstützen. Der Plan wurde von drei aufeinanderfolgenden Leitern der Abteilung für Physik, Mathematik und Astronomie – Tom Tombrello, Andrew Lange und Tom Soifer – genehmigt. Die komplizierten vertragsrechtlichen Details wurden von Adam Cochran, dem Berater des Caltech in Fragen des Urheberrechts, ausgearbeitet. Mit der Veröffentlichung der vorliegenden New Millennium Edition wurde der Plan trotz seiner Komplexität erfolgreich in die Tat umgesetzt. Pfeiffer und Gottlieb haben alle drei Bände in LATEX konvertiert, ebenso mehr als 1000 Übungsaufgaben aus Feynmans Kurs, die in den Ergänzungsband Feynman’s Tips on Physics eingeflossen sind. Die Abbildungen waren zuvor für die deutsche Ausgabe unter Anleitung des deutschen Bearbeiters, Henning Heinze, in Indien in einem modernen elektronischen Format neu gezeichnet worden. Gottlieb und Pfeiffer haben diese neuen Bilder im Austausch gegen ihre neu gesetzten LATEX-Formeln erhalten. Sie haben den LATEX-Text, die Formeln und die Abbildungen sorgfältig geprüft und dort, wo es notwendig schien, Korrekturen vorgenommen. Nate Bode und ich haben den Text, die Formeln und die Abbildungen im Auftrag des Caltech stichprobenartig geprüft und erfreulicherweise keine Fehler gefunden. Pfeiffer und Gottlieb sind offenbar unglaublich sorgfältig und genau. Außerdem organisierten sie die Digitalisierung der Fotos von Feynmans Tafelbildern (dies besorgte John Sullivan von der Huntington Library) und der Tonbandaufnahmen (Tonstudio George Blood) – mit finanzieller Unterstützung und Ermutigung durch Professor Carver Mead vom Caltech, logistischer Unterstützung durch die Caltech-Archivarin Shelley Erwin und Unterstützung in Rechtsfragen durch Adam Cochran. Die zu klärenden Rechtsfragen waren nicht unerheblich: In den 1960er-Jahren hatte das Caltech das Veröffentlichungsrecht für die Printausgabe an Addison Wesley übertragen, in den 1990er-Jahren wurden auch die Rechte zur Veröffentlichung der Audios sowie einer Variante einer elektronischen Ausgabe erteilt. In den 2000er-Jahren waren in der Folge mehrerer Übernahmen die Printrechte an die Mediengruppe Pearson übergegangen, während die Rechte an der Audioversion und der elektronischen Version mittlerweile bei der Verlagsgruppe Perseus lagen. Cochran gelang es zusammen mit Ike Williams, einem auf Verlagsrecht spezialisierten Anwalt, alle Einzelrechte bei Perseus (Basic Books) zu vereinigen, wodurch die vorliegende New Millennium Edition möglich wurde.
Danksagungen Im Namen des Caltech danke ich den vielen Menschen, die die New Millennium Edition möglich gemacht haben. Besonders habe ich den Personen zu danken, deren Mitwirkung bereits erwähnt wurde: Ralph Leighton, Tom Tombrello, Michael Hartl, Rudolf Pfeiffer, Henning Heinze, Adam Cochran, Carl Mead, Nate Bode, Shelley Erwin, Andrew Lange, Tom Soifer, Ike Williams und den 50 Personen, die Errata gemeldet haben (sie sind namentlich genannt unter www.feynmanlectures.info/flp_errata.html). Und ich danke außerdem Michelle Feynman (der Tochter Richard Feynmans) für ihre fortwährende Unterstützung und Beratung,
XII
Vorwort zur New Millennium Edition
Alan Rice für sein hilfreiches Wirken hinter den Kulissen und Auskünfte am Caltech, Stephan Puchegger und Calvin Jackson für die Hilfestellung, die sie Pfeiffer bei der Konvertierung der Manuskripe in LATEX gaben, Michael Figl, Manfred Smolik und Andreas Stangl für die Diskussionen über die Korrektur von Errata sowie den Mitarbeitern von Perseus/Basic Books und (für frühere Ausgaben) den Mitarbeitern von Addison Wesley. Kip S. Thorne Inhaber der Feynman-Professur für Theoretische Physik California Institute of Technology
Oktober 2010
Feynmans Vorwort Dies sind die Vorlesungen über Physik, die ich im letzten und vorletzten Jahr für Anfänger und Fortgeschrittene am Caltech gehalten habe. Die Vorlesungen werden natürlich nicht wortwörtlich wiedergegeben – sie sind mehr oder weniger umfassend redigiert worden. Die Vorlesungen bilden nur einen Teil des vollständigen Kurses. Die Gruppe von 180 Studenten versammelte sich zweimal wöchentlich in einem großen Hörsaal, um diese Vorlesungen zu hören. Dann teilte sie sich auf in kleine Übungsgruppen von 15 bis 20 Studenten unter der Leitung jeweils eines Assistenten. Zusätzlich wurde einmal in der Woche ein Praktikum durchgeführt. Das Ziel, das wir mit diesen Vorlesungen verfolgten, war es, das Interesse der begeisterten und gescheiten Studenten aufrechtzuerhalten, die von den höheren Schulen ans Caltech kamen. Sie hatten viel davon gehört, wie aufregend und interessant die Physik ist – die Relativitätstheorie, die Quantenmechanik und andere moderne Ideen. Am Ende unseres vorhergehenden zweijährigen Kurses waren viele doch sehr entmutigt, weil ihnen nur sehr wenige große, neue und moderne Ideen geboten wurden. Man hatte sie schiefe Ebenen, Elektroakustik usw. studieren lassen, und im Laufe von zwei Jahren wurde das recht langweilig. Die Frage war, ob wir einen Kurs durchführen könnten, der den fortgeschritteneren und begeisterten Studenten ihren Enthusiasmus erhielte. Diese Vorlesungen sind nicht nur als eine Übersicht gedacht, sondern sind sehr ernst gemeint. Ich gedachte, sie an die Intelligentesten der Gruppe zu richten, und wollte, wenn möglich, errei-
XIV
Feynmans Vorwort
chen, dass auch der intelligenteste Student nicht alles Dargebotene vollständig erfassen kann. Deshalb wies ich auch auf Anwendungen der Ideen und Konzepte in verschiedenen Bereichen außerhalb der Hauptstoßrichtung hin. Aus diesem Grund habe ich mich auch sehr bemüht, alle Konzepte so genau wie möglich zu erklären und in jedem Fall aufzuzeigen, wie sich die Gleichungen und Ideen in den Aufbau der Physik einordnen und wie sich die Dinge beim weiteren Hinzulernen ändern würden. Ich dachte auch, dass es für solche Studenten wichtig sei, gezeigt zu bekommen, was sie sich aus dem bereits Gelernten herleiten können, wenn sie klug genug sind, und was als etwas Neues eingeführt wird. Wenn neue Gedanken aufkamen, wollte ich entweder versuchen, sie nach Möglichkeit herzuleiten oder klarzumachen, dass es eine neue Idee war, die nicht auf schon gelernten Dingen basierte, die nicht beweisbar sein sollte, sondern einfach hinzugefügt wurde. Zu Beginn dieser Vorlesungen habe ich vorausgesetzt, dass die Studenten nach dem Verlassen der Schule Gebiete wie die geometrische Optik, einfache chemische Begriffe usw. kannten. Ich sah auch nicht ein, dass die Vorlesungen unbedingt in einer bestimmten Reihenfolge gehalten werden mussten und dass ich etwas so lange nicht erwähnen durfte, bis es im Einzelnen behandelt wurde. Vielfach wurden Dinge ohne umfassende Diskussion erwähnt. Die umfassende Diskussion würde später, nach eingehenderer Vorbereitung, kommen. Beispiele dafür sind die Induktivität und die Energieniveaus, die anfangs nur in einer eher qualitativen Art erwähnt und erst später ausführlicher entwickelt wurden. Gleichzeitig mit dem aktiveren Studenten wollte ich auch denjenigen ansprechen, der das Extrafeuerwerk und die Nebenanwendungen nur beunruhigend findet und von dem man nicht erwarten kann, dass er den größten Teil des Vorlesungsstoffes überhaupt begreift. Für diesen Studenten wollte ich zumindest ein Kernstück des Stoffes herausarbeiten, das er erfassen konnte. Selbst wenn er eine Vorlesung nicht völlig verstand, hoffte ich doch, er würde nicht nervös werden. Ich erwartete gar nicht, dass er alles verstand, aber doch wenigstens, dass er die Hauptlinien nachvollziehen konnte. Natürlich braucht er eine gewisse Intelligenz, um zu unterscheiden, welches die zentralen Sätze und Grundgedanken und welches die weiterentwickelten Nebenergebnisse und Anwendungen sind, die er erst in späteren Jahren verstehen kann. Bei diesen Vorlesungen trat eine ernsthafte Schwierigkeit auf: Bei der Art, wie der Kurs abgehalten wurde, gab es keinen Kontakt zwischen Studenten und Dozenten, der angezeigt hätte, wie gut die Vorlesungen angenommen wurden. Das ist in der Tat eine sehr ernsthafte Schwierigkeit, und ich weiß nicht, wie gut die Vorlesungen wirklich sind. Das Ganze war im Wesentlichen ein Experiment. Und wenn ich es noch einmal machen würde, dann nicht auf die gleiche Art – ich hoffe, ich muss es nicht noch einmal machen! Dennoch glaube ich, dass sich die Dinge – soweit es die Physik anbelangt – im ersten Jahr ganz zufriedenstellend entwickelt haben. Im zweiten Jahr war ich nicht so zufrieden. Im ersten Teil der Vorlesungsreihe, die sich mit Elektrizität und Magnetismus befasste, fiel mir keine wirklich überragende oder andersartige Methode ein, jedenfalls keine, die erheblich fesselnder wäre als die übliche Darstellungsweise. Daher glaube ich nicht, dass ich in den Vorlesungen über Elektrizität und Magnetismus viel erreicht habe. Ursprünglich hatte ich vorgehabt, am Ende des zweiten Jahres nach Elektrizität und Magnetismus mit einigen Vorlesungen über die Eigenschaften der Materie fortzufahren, aber hauptsächlich wollte ich Themen wie Grundschwingungen, Lösungen der Diffusionsgleichung, Schwingungssysteme, Orthogonalfunktionen . . . aufgreifen, um die ersten Stufen der so genannten „mathematischen Methoden der Physik“ zu entwickeln. Rückblickend denke ich, dass ich auf diese ursprüngliche Idee zurückgreifen würde, wenn ich die Vorlesungen noch ein-
Feynmans Vorwort
XV
mal halten würde. Aber da eine Wiederholung der Vorlesungen nicht vorgesehen war, hielt man es für eine gute Idee zu versuchen, eine Einführung in die Quantenmechanik zu geben – Sie finden sie in Band III. Es ist ganz klar, dass Studenten, die Physik als Hauptfach gewählt haben, mit der Quantenmechanik bis zum dritten Jahr warten können. Andererseits wurde der Einwand erhoben, dass viele unserer Hörer Physik nur als Nebenfach bzw. Hintergrund zu ihrem Hauptinteresse auf anderen Gebieten studieren. Und die übliche Art, die Quantenmechanik zu behandeln, macht sie für die meisten Studenten nahezu unzugänglich, weil sie dafür zu viel Zeit brauchen. In ihren tatsächlichen Anwendungen jedoch – besonders den komplexeren wie in der Elektrotechnik und in der Chemie – ist der ganze Apparat der Differentialgleichungen gar nicht unbedingt erforderlich. Deshalb habe ich versucht, die Grundlagen der Quantenmechanik auf eine Weise zu beschreiben, die ohne die Kenntnis der Mathematik der partiellen Differentialgleichungen auskommt. Selbst für einen Physiker ist es, glaube ich, aus mehreren Gründen, die sich aus den Vorlesungen ergeben, ein interessanter Versuch, Quantenmechanik einmal auf diesem umgekehrten Wege darzustellen. Ich glaube jedoch, dass dieses Experiment mit der Quantenmechanik nicht ganz erfolgreich war – vor allem, weil ich am Schluss nicht genügend Zeit hatte. (Ich hätte z. B. drei oder vier Vorlesungen mehr benötigt, um Themen wie Energiebänder und die räumliche Abhängigkeit der Amplituden gründlicher zu behandeln.) Auch hatte ich dieses Thema so noch nie dargestellt, so dass der fehlende Kontakt mit den Studenten besonders problematisch war. Heute glaube ich, dass die Quantenmechanik zu einem späteren Zeitpunkt gelehrt werden sollte. Vielleicht habe ich eines Tages die Möglichkeit, es noch einmal zu versuchen. Dann werde ich es richtig machen. Vorlesungen über das Lösen von Aufgaben fehlen, weil es ja die Übungsgruppen gab. Obwohl ich im ersten Jahr drei Vorlesungen zu Übungsaufgaben und deren Lösungen hielt, sind sie in diesen Bänden nicht enthalten. Es gab auch eine Vorlesung über Trägheitsnavigation, die sich eigentlich an die Vorlesung über rotierende Systeme anschließen müsste, die aber leider weggelassen wurde. Die fünfte und die sechste Vorlesung sind in Wirklichkeit Matthew Sands zuzuschreiben, da ich verreist war. Es bleibt natürlich die Frage, wie gut dieses Experiment geglückt ist. Meine eigene Meinung – die allerdings von den meisten Leuten, die mit den Studenten arbeiten, anscheinend nicht geteilt wird – ist eher pessimistisch. Ich glaube nicht, dass ich mit den Studenten sehr gut zurechtgekommen bin. Wenn ich mir anschaue, wie die Mehrzahl der Studenten die Prüfungsaufgaben behandelt hat, glaube ich, dass das Experiment fehlgeschlagen ist. Zwar höre ich von befreundeten Kollegen, dass ein oder zwei Dutzend Studenten überraschenderweise in sämtlichen Vorlesungen fast alles verstanden haben, dass sie sehr gut mit dem Stoff umgehen konnten und sich über viele Fragen eifrig und interessiert Gedanken machten. Ich glaube, dass diese Leute jetzt ein erstklassiges Fundament in Physik haben – und sie waren es ja schließlich, die ich ansprechen wollte. Aber: „Die Kraft der Lehre ist selten von großer Wirksamkeit, außer unter jenen glücklichen Umständen, wo sie eigentlich überflüssig ist“ (Gibbon). Ich wollte jedoch keinen Studenten vollständig auf der Strecke lassen, wie ich es vielleicht getan habe. Ich glaube, es wäre eine Möglichkeit, den Studenten besser zu helfen, wenn wir uns intensiver damit beschäftigen würden, eine Aufgabenserie zu entwickeln, die einige Themen der Vorlesungen deutlich machen würde. Aufgaben bieten eine gute Gelegenheit, den Stoff der Vorlesungen abzurunden und die Konzepte, die vorgetragen wurden, realistischer, vollständiger und einprägsamer darzulegen.
XVI
Feynmans Vorwort
Ich glaube jedoch, dass die einzige Lösung für dieses Bildungsproblem die Erkenntnis ist, dass der beste Lehrerfolg dann erzielt wird, wenn eine direkte, persönliche Beziehung zwischen dem Studenten und einem guten Lehrer besteht – ein Zustand, bei dem der Student die Konzepte diskutiert, über die Dinge nachdenkt und darüber spricht. Es ist unmöglich, viel zu lernen, wenn man nur in einer Vorlesung sitzt oder selbst dann, wenn man nur die gestellten Aufgaben löst. Aber in unserer modernen Zeit haben wir so viele Studenten zu unterrichten, dass wir versuchen müssen, einen Ersatz für dieses Ideal zu finden. Vielleicht können meine Vorlesungen etwas dazu beitragen. Vielleicht können an einer kleinen Ausbildungsstätte, wo Lehrer und Studenten noch in persönlichem Kontakt stehen, diese aus meinen Vorlesungen Anregungen und Ideen beziehen. Vielleicht haben sie Spaß daran, sie zu durchdenken oder einige der Gedanken weiterzuentwickeln. Richard P. Feynman
Juni 1963
Vorwort Ein großer Triumph der Physik des 20. Jahrhunderts, die Theorie der Quantenmechanik, ist nun beinahe 40 Jahre alt, jedoch haben wir für unsere Studenten im Allgemeinen die Einführungsvorlesungen in Physik (für viele Studenten die letzten) mit kaum mehr als einer gelegentlichen Erwähnung dieses zentralen Teiles unserer Kenntnis der physikalischen Welt gehalten. Wir sollten es besser mit ihnen meinen. Diese Vorlesungen sind ein Versuch, ihnen die wesentlichen Grundgedanken der Quantenmechanik auf eine hoffentlich verständliche Art vorzustellen. Die Methode hier ist neuartig, besonders auf dem Niveau eines Kurses für Studenten des zweiten Jahres, und war vor allem als Experiment gedacht. Nachdem ich nun aber gesehen habe, wie mühelos manche Studenten sich ihr widmeten, glaube ich, dass das Experiment ein Erfolg war. Natürlich sind Verbesserungen möglich, und diese werden mit mehr Erfahrung im Unterricht kommen. Was Sie hier vorfinden, ist eine Wiedergabe dieses ersten Experiments. Im Laufe der zwei Jahre, von September 1961 bis Mai 1963, als die Feynman-Vorlesungen als Einführungskursus in Physik am Caltech gehalten wurden, brachte man die Begriffe der Quantenmechanik, wann immer sie für ein Verständnis der beschriebenen Phänomene notwendig waren. Zusätzlich wurden die letzten zwölf Vorlesungen des zweiten Jahres einer zusammenhängenderen Einführung in einige Begriffe der Quantenmechanik gewidmet. Gegen Ende der Vorlesungen wurde jedoch klar, dass nicht mehr genügend Zeit für die Quantenmechanik übrig war. Als der Stoff vorbereitet wurde, entdeckten wir laufend, dass andere wichtige und interessante Themen mit den elementaren Mitteln, die entwickelt waren, behandelt werden konnten. Wir fürchteten auch, dass die zu kurze Behandlung der Schrödingerschen Wellenfunktion, welche in der 12. Vorlesung vorkam, kein ausreichender Übergang zu den üblichen Abhandlungen vieler Bücher sein würde, die die Studenten vielleicht zu lesen hofften. Es wurde daher beschlossen, die Reihe um sieben zusätzliche Vorlesungen zu erweitern; sie wurden für die Studenten im 3. Jahr im Mai 1964 gehalten. Diese Vorlesungen erweiterten den Stoff, der in den früheren Vorlesungen entwickelt worden war, und rundeten ihn ab. In diesem Band haben wir die Vorlesungen beider Jahre mit einigen Änderungen der Reihenfolge zusammengestellt. Zusätzlich wurden zwei Vorlesungen, die ursprünglich für die Studenten im 1. Jahr als Einführung in die Quantenmechanik gehalten wurden, vollständig aus Band I (wo sie Kapitel 37 und 38 waren) übernommen und hier als Kapitel 1 und 2 eingesetzt, um diesen Band zu einer abgeschlossenen Einheit und verhältnismäßig unabhängig zu machen. Einige Gedanken über die Quantisierung des Drehimpulses (einschließlich einer Diskussion des SternGerlach-Versuchs) waren in Kapitel 34 und 35 von Band II eingeführt worden und werden als bekannt vorausgesetzt. Diese Vorlesungsreihe versucht von Anfang an, die grundlegenden und allgemeinen Züge der Quantenmechanik herauszustellen. Die ersten Vorlesungen nehmen den Begriff der Wahrscheinlichkeitsamplitude, die Interferenz von Amplituden, den abstrakten Begriff eines Zustandes und Überlagerung und Zerlegung von Zuständen in Angriff – die Dirac-Schreibweise
XVIII
Vorwort
wird von Anfang an benutzt. In jedem Fall werden die Begriffe zusammen mit einer ausführlichen Diskussion einiger spezieller Beispiele gebracht – ein Versuch, die physikalischen Ideen so wirklichkeitsnah wie möglich zu machen. Als Nächstes kommt die Zeitabhängigkeit von Zuständen einschließlich der Zustände mit bestimmter Energie, und diese Überlegungen werden sofort auf die Untersuchung von Zweizustandssystemen angewendet. Eine ausführliche Besprechung des Ammoniak-Masers bildet den Rahmen für die Einführung der Strahlungsabsorption und der induzierten Übergänge. Die Vorlesungen fahren dann mit der Betrachtung komplexerer Systeme fort und führen zu einer Diskussion der Elektronenwanderung in einem Kristall und zu einer ziemlich vollständigen Behandlung der Quantenmechanik des Drehimpulses. Unsere Einführung in die Quantenmechanik wird in Kapitel 20 mit einer Diskussion der Schrödingerschen Wellenfunktion, ihrer Differentialgleichung und der Lösung für das Wasserstoffatom abgeschlossen. Das letzte Kapitel dieses Bandes soll kein Teil des „Kurses“ sein. Es ist ein „Seminar“ über Supraleitfähigkeit und wurde im Geist der „Unterhaltungsvorlesungen“ der ersten beiden Bände gehalten. Es war beabsichtigt, den Studenten die Beziehung zwischen dem, was sie lernten, und der allgemeinen physikalischen Bildung deutlicher sichtbar zu machen. Feynmans „Epilog“ dient als Schlusspunkt der dreibändigen Serie. Wie im Vorwort zu Band I erwähnt wurde, sind diese Vorlesungen nur eine Seite eines Entwicklungsprogrammes für einen neuen Einführungskurs, der am California Institute of Technology unter der Leitung des Physics Course Revision Committee durchgeführt wurde (Robert Leighton, Victor Neher, Matthew Sands). Dieses Programm wurde durch eine Spende der Ford Foundation ermöglicht. Viele Leute halfen bei der technischen Vorbereitung dieses Bandes: Marylon Clayton, Julie Curcio, James Hartle, Tom Harvey, Martin Israel, Patricia Preuss, Fanny Warren und Barbara Zimmermann. Prof. Gerry Neugebauer und Prof. Charles Wilts trugen in großem Maße zur Genauigkeit und Klarheit des Stoffes bei, indem sie sorgfältig große Teile des Manuskripts durchsahen. Aber die hier vorliegende Darstellung der Quantenmechanik ist die Richard Feynmans. Unsere Arbeit ist gut angelegt, wenn es uns gelungen ist, anderen zumindest ein wenig von der geistigen Spannung zu vermitteln, die wir empfanden, als wir sahen, wie sich Feynmans Ideen während seiner Physikvorlesungen entfalteten. Matthew Sands
Dezember 1964
Inhaltsverzeichnis 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8
Quantenverhalten 1 Mechanik in atomaren Dimensionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Ein Experiment mit Kugeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Ein Experiment mit Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Ein Experiment mit Elektronen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Die Interferenz von Elektronenwellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Beobachtung der Elektronen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Grundprinzipien der Quantenmechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Das Unbestimmtheitsprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2 2.1 2.2 2.3 2.4 2.5 2.6
Die Beziehung zwischen dem Wellen- und dem Teilchenbild Wahrscheinlichkeitsamplituden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Messung von Ort und Impuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beugung an Kristallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Größe eines Atoms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Energieniveaus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Philosophische Konsequenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17 17 18 22 25 27 28
3 3.1 3.2 3.3 3.4
Wahrscheinlichkeitsamplituden Die Gesetze zur Kombination von Amplituden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Interferenzbild bei zwei Spalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Streuung an einem Kristall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Identische Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33 33 38 41 44
4 4.1 4.2 4.3 4.4 4.5 4.6 4.7
Identische Teilchen Bose-Teilchen und Fermi-Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zustände mit zwei Bose-Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zustände mit n Bose-Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Emission und Absorption von Photonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Spektrum des schwarzen Körpers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Flüssiges Helium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Ausschließungsprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49 49 52 56 58 60 66 66
5 5.1 5.2 5.3 5.4 5.5 5.6
Spin eins Das Filtern von Atomen mit einem Stern-Gerlach-Apparat . . . . . . . . . . . . . . . . . . . . Experimente mit gefilterten Atomen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stern-Gerlach-Filter in Serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Basiszustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interferierende Amplituden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Maschinerie der Quantenmechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73 73 79 81 82 85 88
XX
Inhaltsverzeichnis
5.7 5.8
Transformation auf eine andere Basis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Andere Situationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
6 6.1 6.2 6.3 6.4 6.5 6.6
Spin 1/2 95 Transformation von Amplituden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Transformation auf ein gedrehtes Koordinatensystem . . . . . . . . . . . . . . . . . . . . . . . . . 97 Drehungen um die z-Achse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 Drehungen um 180◦ und um 90◦ um die y-Achse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 Drehungen um die x-Achse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 Beliebige Drehungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7 7.1 7.2 7.3 7.4 7.5
Die Zeitabhängigkeit der Amplituden 117 Atome in Ruhe; stationäre Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Gleichförmige Bewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Potentielle Energie; Energieerhaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Kräfte und klassischer Grenzfall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Die „Präzession“ eines Spin-1/2-Teilchens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8 8.1 8.2 8.3 8.4 8.5 8.6
Die Hamilton-Matrix 135 Amplituden und Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 Zerlegung von Zustandsvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 Was sind die Basiszustände der Welt? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 Wie sich die Zustände mit der Zeit ändern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 Die Hamilton-Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Das Ammoniakmolekül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
9 9.1 9.2 9.3 9.4 9.5 9.6
Der Ammoniak-Maser 155 Die Zustände eines Ammoniakmoleküls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 Das Molekül in einem elektrostatischen Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 Übergänge in einem zeitabhängigen Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 Übergänge bei Resonanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 Übergänge in der Nähe der Resonanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Die Lichtabsorption . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
10 10.1 10.2 10.3 10.4 10.5 10.6 10.7
Andere Zweizustandssysteme 177 Das Ion des Wasserstoffmoleküls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 Kernkräfte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 Das Wasserstoffmolekül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Das Benzolmolekül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 Farbstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 Die Hamilton-Matrix für ein Spin-1/2-Teilchen im Magnetfeld . . . . . . . . . . . . . . . . . 194 Das rotierende Elektron im Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
11 11.1 11.2 11.3 11.4 11.5
Weitere Zweizustandssysteme 201 Die Pauli-Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 Die Spinmatrizen als Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 Die Lösung der Zweizustandsgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 Die Polarisationszustände des Photons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 Das neutrale K-Meson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
Inhaltsverzeichnis
XXI
11.6
Verallgemeinerung auf N-Zustandssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
12 12.1 12.2 12.3 12.4 12.5 12.6
Die Hyperfeinaufspaltung im Wasserstoff 233 Basiszustände für ein System mit zwei Spin- 21 -Teilchen . . . . . . . . . . . . . . . . . . . . . . . 233 Der Hamilton-Operator für den Grundzustand des Wasserstoffs . . . . . . . . . . . . . . . . 236 Die Energieniveaus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 Die Zeeman-Aufspaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 Die Zustände in einem magnetischen Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 Die Projektionsmatrix für Spin eins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
13 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8
Ausbreitung im Kristallgitter 257 Zustände des Elektrons im eindimensionalen Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 Zustände mit bestimmter Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 Zeitabhängige Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 Ein Elektron im dreidimensionalen Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 Weitere Zustände in einem Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 Streuung an Fehlerstellen in einem Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 Einfang durch eine Gitterfehlerstelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 Streuamplituden und gebundene Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
14 14.1 14.2 14.3 14.4 14.5 14.6
Halbleiter 277 Elektronen und Löcher in Halbleitern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 Unreine Halbleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 Der Hall-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286 Halbleiter-Übergänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288 Gleichrichtung an einem Halbleiter-Übergang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 Der Transistor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
15 15.1 15.2 15.3 15.4 15.5 15.6
Die Näherung unabhängiger Teilchen 297 Spinwellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 Zwei-Spin-Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 Unabhängige Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 Das Benzolmolekül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 Weitere organische Verbindungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 Andere Anwendungen der Näherung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
16 16.1 16.2 16.3 16.4 16.5 16.6
Die Ortsabhängigkeit der Amplituden 317 Amplituden auf einer Linie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 Die Wellenfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 Zustände mit bestimmtem Impuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 Normierung der x-Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 Die Schrödinger-Gleichung .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 Quantisierte Energieniveaus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
17 17.1 17.2 17.3 17.4
Symmetrien und Erhaltungssätze 339 Symmetrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 Symmetrie und Erhaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343 Die Erhaltungssätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348 Polarisiertes Licht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352
XXII
Inhaltsverzeichnis
17.5 17.6
Der Zerfall des Λ0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 Zusammenstellung der Drehmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
18 18.1 18.2 18.3 18.4 18.5 18.6 18.7 18.8
Drehimpuls 363 Elektrische Dipolstrahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 Streuung des Lichts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366 Die Vernichtung von Positronium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369 Drehmatrix für beliebige Spins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376 Messung eines Kernspins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381 Addition von Drehimpulsen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 Zusatz 1: Herleitung der Drehmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389 Zusatz 2: Erhaltung der Parität bei der Photonenemission . . . . . . . . . . . . . . . . . . . . . 393
19 19.1 19.2 19.3 19.4 19.5 19.6
Das Wasserstoffatom und das Periodensystem 395 Die Schrödinger-Gleichung für das Wasserstoffatom . . . . . . . . . . . . . . . . . . . . . . . . . . 395 Kugelsymmetrische Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397 Zustände mit Winkelabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402 Die allgemeine Lösung für Wasserstoff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408 Die Wasserstoff-Wellenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411 Das Periodensystem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
20 20.1 20.2 20.3 20.4 20.5 20.6 20.7
Operatoren 421 Operationen und Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421 Mittlere Energien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424 Die mittlere Energie eines Atoms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428 Der Ortsoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 Der Impulsoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432 Drehimpuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438 Die zeitliche Änderung der Mittelwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
21 21.1 21.2 21.3 21.4 21.5 21.6 21.7 21.8 21.9
Die Schrödinger-Gleichung in einem klassischen Kontext 445 Die Schrödinger-Gleichung im Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445 Die Kontinuitätsgleichung für Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . 448 Zwei Arten von Impuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450 Die Bedeutung der Wellenfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452 Supraleitfähigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453 Der Meissner-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455 Flussquantisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458 Die Dynamik der Supraleitfähigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461 Der Josephson-Übergang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464
Feynmans Epilog
471
Index Band V
473
Gesamtindex
477
Personenverzeichnis
493
1
Quantenverhalten
Anmerkung: Dieses Kapitel stimmt nahezu mit Kapitel 12 des zweiten Bandes überein.
1.1
Mechanik in atomaren Dimensionen
„Quantenmechanik“ ist die Beschreibung des Verhaltens von Materie und Licht in allen Einzelheiten, insbesondere der Vorgänge in atomaren Dimensionen. In atomaren Dimensionen verhalten sich die Objekte überhaupt nicht so wie etwas, von dem wir direkte Erfahrung haben. Sie verhalten sich nicht wie Wellen, nicht wie Teilchen, nicht wie Wolken oder Billardkugeln, Gewichte an Federn oder irgendetwas, was wir je gesehen haben. Newton dachte, das Licht bestehe aus Teilchen, doch dann entdeckte man, dass es sich wie eine Welle verhält. Später jedoch (zu Beginn des 20. Jahrhunderts) stellte man fest, dass sich das Licht tatsächlich manchmal wie ein Teilchen verhält. Ursprünglich glaubte man, das Elektron zum Beispiel verhielte sich wie ein Teilchen, dann aber erkannte man, dass es sich in vielerlei Hinsicht wie eine Welle verhält. In Wirklichkeit verhält es sich jedoch weder wie das eine noch wie das andere. Geben wir es also auf. Wir sagen: „Es ist wie keins von beiden.“ Wir haben jedoch Glück, denn die Elektronen verhalten sich genauso wie das Licht. Das Quantenverhalten von Objekten in atomaren Dimensionen (Elektronen, Protonen, Neutronen, Photonen usw.) ist für alle das gleiche, sie sind alle „Teilchenwellen“ oder wie auch immer man sie nennen möchte. Also ist das, was wir über die Eigenschaften des Elektrons (welches wir für unsere Beispiele heranziehen werden) kennenlernen, auch anwendbar auf alle „Teilchen“, einschließlich der Photonen des Lichts. Die allmähliche Ansammlung von Informationen über das Verhalten im atomaren und mikroskopischen Bereich während des ersten Viertels des 20. Jahrhunderts, die uns einige Hinweise gaben, wie sich kleine Objekte verhalten, rief eine wachsende Verwirrung hervor, die schließlich 1926/27 von Schrödinger, Heisenberg und Born aufgelöst wurde. Ihnen gelang schließlich eine konsistente Beschreibung des Verhaltens von Materie im mikroskopischen Bereich. Wir werden die Hauptpunkte dieser Beschreibung in diesem Kapitel aufgreifen. Weil das Verhalten der Atome so ganz außerhalb unserer normalen Erfahrung liegt, ist es sehr schwierig, sich daran zu gewöhnen, und es erscheint sowohl dem Neuling als auch dem erfahrenen Physiker seltsam und geheimnisvoll. Selbst die Experten verstehen es nicht so, wie sie es gerne möchten, und das ist nicht verwunderlich, da sich jede direkte menschliche Erfahrung und Intuition auf makroskopische Objekte bezieht. Wir wissen, wie sich große Objekte verhalten, aber die kleinen Objekte verhalten sich nicht so. Darum müssen wir unsere Erkenntnisse durch Abstraktion oder Imagination gewinnen und können nicht an unsere direkten Erfahrungen anknüpfen.
2
1 Quantenverhalten
In diesem Kapitel werden wir sogleich das Grundelement dieses mysteriösen Verhaltens in seiner seltsamsten Form in Angriff nehmen. Zur Untersuchung wählen wir ein Phänomen aus, das auf klassische Art zu erklären absolut unmöglich ist und das in sich den Kern der Quantenmechanik birgt. Eigentlich enthält es das einzige Geheimnis. Wir können das Geheimnis nicht aufdecken, indem wir „erklären“, wie es funktioniert. Wir können nur berichten, wie es funktioniert, und indem wir dies tun, erörtern wir die grundlegenden Eigentümlichkeiten der ganzen Quantenmechanik.
1.2
Ein Experiment mit Kugeln
Wir werden versuchen, das Quantenverhalten von Elektronen zu verstehen, indem wir in einem speziellen Versuchsaufbau ihr Verhalten mit dem vertrauteren Verhalten von Teilchen, wie Kugeln, und Wellen, wie Wasserwellen, vergleichen und gegenüberstellen. Wir betrachten zuerst das Verhalten von Kugeln in dem in Abbildung 1.1 schematisch dargestellten Versuchsaufbau.
beweglicher Detektor
1 Gewehr
P1
x
2
Wand (a)
P12
P2
Auffangwand
(b)
P12 = P1 + P2 (c)
Abb. 1.1: Interferenzexperiment mit Kugeln.
Wir haben ein Maschinengewehr, das eine Salve von Kugeln abschießt. Es ist kein sehr gutes Gewehr, weil es die Kugeln wahllos über einen ziemlich großen Winkelbereich, wie im Bild gezeigt, verstreut. Vor dem Gewehr ist eine Wand (aus Panzerplatten), in der zwei Spalte sind, gerade groß genug, um eine Kugel hindurchzulassen. Hinter der Wand ist eine Auffangwand (sagen wir eine dicke Holzwand), die die Kugeln beim Auftreffen „absorbiert“. Vor der Auffangwand befindet sich ein Objekt, das wir „Detektor“ für Kugeln nennen wollen. Es könnte ein Kasten mit Sand sein. Jede Kugel, die in den Detektor eintritt, wird abgebremst und gespeichert. Wenn wir wollen, können wir den Kasten leeren und die Kugeln, die eingefangen wurden, zählen. Der Detektor kann hin und her bewegt werden (wir nehmen an in x-Richtung). Mit dieser Vorrichtung können wir experimentell die Antwort auf folgende Frage finden: „Wie groß ist die Wahrscheinlichkeit, dass eine Kugel, die durch die Spalte in der Wand geht, im Abstand x vom Mittelpunkt auf der Auffangwand ankommt?“ Zunächst sollten Sie einsehen, dass wir von Wahrscheinlichkeiten sprechen müssen, weil wir nicht mit Bestimmtheit sagen können, welchen Weg die individuelle Kugel nehmen wird. Eine Kugel, die zufällig einen der Spalte trifft, kann an dem Rand des Spalts abprallen und irgendwo auftreffen. Mit „Wahrscheinlichkeit“ meinen wir die Chance, dass eine Kugel im Detektor landet. Diese Chance können wir messen, indem wir die Kugeln zählen, die in einer bestimmten Zeiteinheit im Detektor ankommen,
1.3 Ein Experiment mit Wellen
3
und dann das Verhältnis dieser Anzahl zur Gesamtzahl der in dieser Zeit auf der Auffangwand angekommenen Kugeln berechnen. Oder wenn wir annehmen, dass das Gewehr während der Messung immer im gleichen Zeitabstand schießt, ist die gesuchte Wahrscheinlichkeit direkt proportional zur Anzahl der Kugeln, die den Detektor in einem Standard-Zeitintervall erreichen. Für unsere Zwecke wollen wir uns einen etwas idealisierten Versuch vorstellen, in welchem die Kugeln keine echten Kugeln, sondern unzerstörbare Kugeln sind – sie können nicht entzweibrechen. In unserem Versuch stellen wir fest, dass die Kugeln immer als Klumpen ankommen, und wenn wir etwas in dem Detektor finden, ist es immer eine ganze Kugel. Wenn der Zeitabstand, mit dem das Maschinengewehr feuert, stark verringert wird, sehen wir, dass zu irgendeinem gegebenen Moment entweder keine oder genau eine Kugel auf der Auffangwand ankommt. Auch ist die Größe des Klumpens sicherlich unabhängig von der Feuerfrequenz des Gewehrs. Wir sagen also: „Kugeln kommen immer als gleiche Klumpen an.“ Was wir mit unserem Detektor messen, ist die Wahrscheinlichkeit für das Ankommen eines Klumpens. Und wir messen die Wahrscheinlichkeit als Funktion von x. Das Ergebnis solcher Messungen mit diesem Apparat (wir haben das Experiment noch nicht durchgeführt, deshalb stellen wir uns das Ergebnis eigentlich nur vor) ist in Abbildung 1.1 (c) graphisch dargestellt. In der Zeichnung tragen wir die Wahrscheinlichkeit nach rechts und x vertikal auf, sodass die x-Skala zur Abbildung des Apparats passt. Wir nennen die Wahrscheinlichkeit P12 , weil die Kugeln entweder durch Spalt 1 oder Spalt 2 gekommen sein können. Es wird Sie nicht überraschen, dass P12 zur Mitte des Diagramms hin groß ist, aber für sehr große x klein wird. Es mag jedoch verwundern, dass P12 den Maximalwert bei x = 0 hat. Diesen Sachverhalt können wir verstehen, wenn wir unser Experiment wiederholen und dabei einmal Spalt 2 und einmal Spalt 1 abdecken. Wenn Spalt 2 abgedeckt ist, können die Kugeln nur durch Spalt 1 gehen und wir erhalten die Kurve, die in Teil (b) der Abbildung mit P1 bezeichnet ist. Wie erwartet, tritt das Maximum von P1 bei dem x-Wert auf, der auf gerader Linie mit dem Gewehr und Spalt 1 liegt. Wenn Spalt 1 geschlossen ist, bekommen wir die symmetrische Kurve P2 , die in der Abbildung eingezeichnet ist. P2 ist die Wahrscheinlichkeitsverteilung für Kugeln, die durch Spalt 2 hindurchgehen. Wenn wir die Teile (b) und (c) der Abbildung 1.1 vergleichen, finden wir als wichtiges Ergebnis P12 = P1 + P2 .
(1.1)
Die Wahrscheinlichkeiten addieren sich einfach. Der Effekt bei zwei geöffneten Spalten ist die Summe der Effekte, die bei je einem geöffneten Spalt auftreten. Wir werden dieses Resultat eine Beobachtung „ohne Interferenz“ nennen. Den Grund dafür werden Sie später verstehen. So viel über Kugeln. Sie kommen in Klumpen, und ihre Ankunftswahrscheinlichkeit zeigt keine Interferenz.
1.3
Ein Experiment mit Wellen
Jetzt wollen wir uns einen Versuch mit Wasserwellen ansehen. Die Vorrichtung ist in Abbildung 1.2 schematisch dargestellt. Wir verwenden ein flaches Gefäß mit Wasser. Ein kleiner Gegenstand, als „Wellenquelle“ bezeichnet, wird von einem Motor auf und nieder bewegt und erzeugt kreisförmige Wellen. Rechts von der Quelle befindet sich wieder eine Wand mit zwei Spalten, und dahinter ist eine zweite Wand, welche der Einfachheit halber ein „Absorber“ sei,
4
1 Quantenverhalten x
1 Wellenquelle
Detektor
(a)
I1
I12
I2
2
Wand
x
Absorber
I1 = |h1 |2 I2 = |h2 |2
(b)
I12 =|h1 +h2 |2
(c)
Abb. 1.2: Interferenzexperiment mit Wasserwellen.
sodass die Wellen, die dort ankommen, nicht reflektiert werden. Das kann man erreichen, indem man einen langsam ansteigenden „Sandstrand“ baut. Vor diesen Strand setzen wir einen Detektor, der wie zuvor in der x-Richtung hin und her bewegt werden kann. Der Detektor ist jetzt ein Gerät, das die „Intensität“ der Wellenbewegung misst. Man stelle sich eine raffinierte Vorrichtung vor, die die Höhe der Wellenbewegung ausmisst, deren Skala jedoch proportional zum Quadrat der ermittelten Höhe geeicht ist, sodass der abgelesene Wert proportional zur Intensität der Welle ist. Die Anzeige unseres Detektors ist dann proportional zur Energie, die von der Welle mitgeführt wird – oder richtiger: zur Energierate, die zum Detektor gelangt. Das Erste, was wir mit unserem Wellenapparat feststellen, ist, dass die Intensität jede beliebige Größe haben kann. Wenn die Quelle sich nur sehr wenig bewegt, dann ist die Wellenbewegung am Detektor eben sehr gering. Wenn die Bewegung an der Quelle größer ist, ist die Intensität am Detektor höher. Die Intensität der Welle kann jeden Wert annehmen. Wir würden nicht sagen, dass irgendetwas von „Klumpigkeit“ in der Wellenintensität ist. Nun wollen wir die Wellenintensität für verschiedene x-Werte messen (wobei wir die Wellenquelle immer gleichmäßig arbeiten lassen). Wir erhalten die interessant aussehende Kurve, die in Abbildung 1.2 (c) mit I12 bezeichnet ist. Wir haben schon erklärt, wie solche Bilder entstehen, als wir in Band II die Interferenz elektromagnetischer Wellen studierten. In diesem Falle würden wir beobachten, dass die ursprüngliche Welle an den Spalten gebeugt wird und neue kreisförmige Wellen sich von jedem Spalt ausbreiten. Wenn wir jeweils einen Spalt abdecken und die Intensitätsverteilung am Absorber messen, so erhalten wir die ziemlich einfachen Intensitätskurven, die in Abbildung 1.2 (b) dargestellt sind. I1 ist die Intensität der Wellen aus Spalt 1 (die wir durch Messung bei zugehaltenem Spalt 2 finden) und I2 ist die Intensität der Wellen aus Spalt 2 (wenn Spalt 1 blockiert ist). Sicher ist die Intensität I12 , die wir beobachten, wenn beide Spalte offen sind, nicht die Summe von I1 und I2 . Wir sagen, dass „Interferenz“ zwischen beiden Wellen vorliegt. An einigen Stellen (den Maxima der Kurve I12 ) sind die Wellen „in Phase“ und die Wellenberge addieren sich dort zu einer großen Amplitude und haben daher eine große Intensität. Wir sagen, dass die Wellen an solchen Stellen „konstruktiv interferieren“. Eine solche konstruktive Interferenz wird es immer dort geben, wo der Abstand vom Detektor zu einem Spalt um ein ganzes Vielfaches der Wellenlänge größer (oder kleiner) als der Abstand vom Detektor zum anderen Spalt ist.
1.4 Ein Experiment mit Elektronen
5
An den Stellen, wo die beiden Wellen am Detektor mit einer Phasendifferenz von π ankommen (wo sie „außer Phase“ sind), ist die resultierende Wellenbewegung am Detektor gleich der Differenz der beiden Amplituden. Die Wellen „interferieren destruktiv“ und wir erhalten einen niedrigen Wert für die Wellenintensität. Wir erwarten solche niedrigen Werte überall da, wo der Abstand zwischen Spalt 1 und dem Detektor sich um ein ungerades Vielfaches der halben Wellenlänge vom Abstand zwischen Spalt 2 und dem Detektor unterscheidet. Die niedrigen Werte von I12 in Abbildung 1.2 entsprechen den Stellen, wo die beiden Wellen destruktiv interferieren. Sie werden sich erinnern, dass die quantitative Beziehung zwischen I1 , I2 und I12 folgendermaßen ausgedrückt werden kann: Die momentane Höhe der Wasserwelle am Detektor für die Welle aus Spalt 1 kann als (Realteil von) h1 eiωt geschrieben werden, wobei die „Amplitude“ h1 im Allgemeinen eine komplexe Zahl ist. Die Intensität ist proportional zum mittleren Quadrat der Höhe oder, wenn wir komplexe Zahlen benutzen, zum Quadrat des absoluten Betrages |h1 |2 . Entsprechend ist für Spalt 2 die Höhe h2 eiωt und die Intensität proportional zu |h2 |2 . Wenn beide Spalte offen sind, addieren sich die Wellenhöhen zur Höhe (h1 + h2 ) eiωt und zur Intensität |h1 + h2 |2 . Wenn wir die Proportionalitätskonstante für unser jetziges Vorhaben weglassen, sind die richtigen Relationen für interferierende Wellen I1 = |h1 |2 ,
I2 = |h2 |2 ,
I12 = |h1 + h2 |2 .
(1.2)
Sie werden feststellen, dass das Ergebnis ganz anders ist als die Beziehung (1.1), die für Kugeln gilt. Wenn wir |h1 + h2 |2 ausschreiben, sehen wir, dass |h1 + h2 |2 = |h1 |2 + |h2 |2 + 2 |h1 | |h2 | cos δ ,
(1.3)
wobei δ die Phasendifferenz zwischen h1 und h2 ist. In Intensitäten ausgedrückt, können wir schreiben I12 = I1 + I2 + 2 I1 I2 cos δ . (1.4)
Der letzte Term in (1.4) ist der „Interferenzterm“. So viel über Wasserwellen. Die Intensität kann jeden Wert annehmen und sie zeigt Interferenz.
1.4
Ein Experiment mit Elektronen
Wir stellen uns jetzt ein ähnliches Experiment mit Elektronen vor. Es ist in Abbildung 1.3 schematisch dargestellt. Wir bauen uns eine Elektronenkanone, die aus einem elektrisch geheizten Wolframdraht besteht, der von einem Metallgehäuse mit einem Loch darin umgeben ist. Wenn der Draht eine negative Spannung gegenüber dem Gehäuse hat, werden die von dem Draht emittierten Elektronen zu den Wänden hin beschleunigt und es gehen einige durch das Loch. Alle Elektronen, die aus der Kanone kommen, haben ungefähr dieselbe Energie. Vor der Kanone befindet sich wieder eine Wand (einfach eine dünne Metallplatte) mit zwei Spalten. Hinter der Wand ist noch eine Platte, die als „Auffangwand“ dient. Vor der Auffangwand bringen wir einen beweglichen Detektor an. Der Detektor kann ein Geigerzähler oder vielleicht besser ein Elektronenvervielfacher sein, der mit einem Lautsprecher verbunden ist. Wir wollen von vornherein sagen, dass Sie nicht versuchen sollten, diesen Versuch aufzubauen (wie Sie es mit den beiden vorher beschriebenen Versuchen hätten tun können). Auf diese Weise ist dieses Experiment noch nie durchgeführt worden. Das Unangenehme dabei ist nämlich, dass
6
1 Quantenverhalten x Detektor
x P1
P12
1 Elektronenkanone
P2
2
Wand (a)
Auffangwand
P1 = |φ1 |2 P2 = |φ2 |2
(b)
P12 =|φ1 +φ2 |2
(c)
Abb. 1.3: Interferenzexperiment mit Elektronen.
man den Apparat undurchführbar klein aufbauen müsste, um die uns interessierenden Effekte zu demonstrieren. Wir führen ein „Gedankenexperiment“ durch, das wir gewählt haben, weil es leicht zu durchdenken ist. Wir kennen die Ergebnisse, die wir erhalten würden, weil es viele schon durchgeführte Experimente gibt, bei denen der Maßstab und die Größenverhältnisse so sind, dass sie die Effekte sichtbar machen, die wir beschreiben werden. Das Erste, was wir bei unserem Elektronenversuch feststellen, sind die scharfen „Klicks“, die wir von dem Detektor (d. h. aus dem Lautsprecher) hören. Alle „Klicks“ sind gleich. Es gibt keine „Halbklicks“. Wir werden auch bemerken, dass die „Klicks“ sehr ungleichmäßig kommen. Ungefähr so: klick . . . klick-klick . . . klick . . . . . . klick . . . klick-klick . . . klick . . . usw., genauso wie Sie zweifellos schon einen Geigerzähler haben arbeiten hören. Wenn wir die Klicks zählen, die in einer hinreichend langen Zeit ankommen – etwa während mehrerer Minuten –, und dann noch einmal während einer gleich langen Zeitspanne zählen, stellen wir fest, dass die beiden Zahlen ziemlich genau gleich sind. Daher können wir von der durchschnittlichen Rate der gehörten Klicks sprechen (durchschnittlich soundso viele Klicks in der Minute). Wenn wir den Detektor auf und ab bewegen, wird die Rate, mit der die Klicks auftreten, größer oder kleiner, aber die Lautstärke jedes Klicks ist immer gleich. Wenn wir die Temperatur des Drahtes in der Kanone verringern, wird das Klicken seltener, aber jeder Klick hört sich noch gleich an. Wenn wir zwei unabhängige Detektoren an die Auffangwand stellen, werden wir feststellen, dass entweder der eine oder der andere klickt, aber nie beide gleichzeitig. (Es sei denn, dass ab und zu unser Ohr einmal keine Trennung wahrnimmt, wenn zwei Klicks zeitlich sehr dicht aufeinander folgen.) Wir schließen daraus, dass alles, was auch immer an der Auffangwand ankommt, in „Klumpen“ ankommt. Alle „Klumpen“ sind gleich groß: Nur ganze „Klumpen“ kommen an, und immer kommt nur einer auf einmal an der Auffangwand an. Wir sagen also: „Elektronen kommen immer als identische Klumpen an.“ Genau wie bei unserem Experiment mit Kugeln können wir jetzt darangehen, experimentell die Antwort auf folgende Frage zu finden: „Wie groß ist die relative Wahrscheinlichkeit, dass ein „Elektronenklumpen“ an der Auffangwand in verschiedenen Abständen x von der Mitte ankommt?“ Wie zuvor erhalten wir die relative Wahrscheinlichkeit, indem wir die Rate der Klicks registrieren und dabei die Ausstoßfrequenz der Kanone konstant halten. Die Wahrscheinlichkeit, dass Klumpen bei einem bestimmten x ankommen, ist zur durchschnittlichen Rate von Klicks bei diesem x proportional. Das Ergebnis unseres Experiments ist die interessante Kurve, die in Teil (c) von Abbildung 1.3 mit P12 bezeichnet ist. Ja! So laufen Elektronen.
1.5 Die Interferenz von Elektronenwellen
1.5
7
Die Interferenz von Elektronenwellen
Nun wollen wir versuchen, die Kurve P12 von Abbildung 1.3 zu analysieren, um zu sehen, ob wir das Verhalten der Elektronen verstehen können. Da sie in Klumpen kommen, würden wir zuerst sagen, dass jeder Klumpen, welchen wir genauso gut ein Elektron nennen können, entweder durch Spalt 1 oder durch Spalt 2 gekommen ist. Wir wollen als Behauptung schreiben: Behauptung A: Jedes Elektron geht entweder durch Spalt 1 oder durch Spalt 2. Wenn Behauptung A gilt, dann können alle Elektronen, die an der Auffangwand ankommen, in zwei Gruppen unterteilt werden: (1) die, die durch Spalt 1 gehen, und (2) die, die durch Spalt 2 gehen. Daher muss die Kurve, die wir registrieren, die Summe der Effekte der Elektronen durch Spalt 1 und der Elektronen durch Spalt 2 sein. Wir wollen diese Vermutung mit einem Experiment prüfen. Als Erstes führen wir eine Messung für die Elektronen durch, die durch Spalt 1 kommen. Wir schließen Spalt 2 und zählen die Klicks aus dem Detektor. Aus der Rate der Klicks erhalten wir P1 . Das Ergebnis der Messung ist in der mit P1 bezeichneten Kurve in Teil (b) von Abbildung 1.3 dargestellt. Das Resultat scheint ganz vernünftig. Entsprechend messen wir die Wahrscheinlichkeitsverteilung P2 für Elektronen, die durch Spalt 2 kommen. Das Ergebnis dieser Messung ist als Kurve P2 in die Abbildung eingezeichnet. Das Ergebnis P12 , das man erhält, wenn beide Spalte offen sind, ist offensichtlich nicht die Summe von P1 und P2 , den Wahrscheinlichkeiten für die einzelnen Spalte. In Analogie zu unserem Wasserwellenversuch sagen wir: „Es gibt Interferenz.“ Für Elektronen:
P12 P1 + P2 .
(1.5)
Wie kann eine solche Interferenz entstehen? Vielleicht sollten wir sagen: „Nun ja, das bedeutet vermutlich, dass es nicht wahr ist, dass die Klumpen entweder durch Spalt 1 oder durch Spalt 2 gehen, denn wenn sie es täten, müssten sich die Wahrscheinlichkeiten addieren. Vielleicht laufen sie auf einem komplizierteren Weg. Sie teilen sich in Hälften und . . . “ Aber halt! Das können sie ja nicht. Sie kommen immer in Klumpen an . . . Gut, vielleicht gehen einige von ihnen durch 1 und dann gehen sie herum durch 2 und dann gehen sie noch ein paarmal herum oder auf einem anderen komplizierten Weg . . . und dadurch, dass wir Spalt 2 geschlossen haben, hat sich die Wahrscheinlichkeit geändert, dass ein Elektron, das von Spalt 1 ausging, schließlich zur Auffangwand gelangt . . . “ Aber Vorsicht! Es gibt da einige Stellen, an denen sehr wenig Elektronen ankommen, wenn beide Spalte offen sind, die aber viele Elektronen empfangen, wenn wir einen Spalt schließen, sodass das Schließen eines Spaltes ein Anwachsen der Anzahl aus dem anderen bewirkt. Beachten Sie jedoch, dass P12 in der Mitte des Bildes mehr als doppelt so groß ist wie P1 + P2 . Es ist, als ob das Schließen eines Spaltes die Elektronenanzahl aus dem anderen Spalt zurückgehen lässt. Die Annahme, dass die Elektronen komplizierte Wege laufen, scheint beide Effekte nur schwer erklären zu können. Das ist alles recht mysteriös. Und je länger man es sich anschaut, umso mysteriöser erscheint es. Viele Theorien sind ausgetüftelt worden, um zu versuchen, durch einzelne Elektronen, die auf komplizierten Wegen durch die Spalte laufen, die Kurve P12 zu erklären. Keine von ihnen hatte Erfolg. Keine kann die richtige Kurve für P12 aus den Kurven für P1 und P2 herleiten. Doch überraschenderweise ist die Mathematik zur Verknüpfung von P12 mit P1 und P2 außerordentlich einfach. Denn P12 ist genau gleich der Kurve I12 aus Abbildung 1.2, und das war einfach. Was an der Auffangwand passiert, kann durch zwei komplexe Zahlen, die wir φ1 und
8
1 Quantenverhalten
φ2 nennen wollen, beschrieben werden (sie sind natürlich Funktionen von x). Das Absolutquadrat von φ1 ergibt den Effekt, wenn nur Spalt 1 offen ist. Das bedeutet P1 = |φ1 |2 . Der Effekt, wenn nur Spalt 2 offen ist, ergibt sich analog aus φ2 . Das heißt, P2 = |φ2 |2 . Und der Effekt für beide Spalte zusammen ist dann eben P12 = |φ1 + φ2 |2 . Die Mathematik ist die gleiche wie bei den Wasserwellen! (Es ist schwer vorstellbar, dass man ein so einfaches Ergebnis aus einem komplizierten Vorgang erhalten könnte, bei dem die Elektronen auf seltsamen Bahnen durch die Spalte hin und her laufen.) Wir schließen daraus Folgendes: Die Elektronen kommen als Klumpen an, wie Teilchen, und die Ankunftswahrscheinlichkeit dieser Klumpen ist verteilt wie die Intensität einer Welle. Dass ist damit gemeint, wenn man sagt, dass sich ein Elektron „manchmal wie ein Teilchen und manchmal wie eine Welle“ verhält. Übrigens, als wir uns mit klassischen Wellen beschäftigten, haben wir die Intensität als das über die Zeit gemittelte Quadrat der Wellenamplitude definiert, und wir benutzten als mathematischen Trick die komplexen Zahlen zur Vereinfachung der Rechnung. In der Quantenmechanik stellt sich nun heraus, dass die Amplituden durch komplexe Zahlen dargestellt werden müssen. Die Realteile allein genügen nicht. Das ist im Moment ein technischer Aspekt, denn die Formeln sehen gleich aus. Da sich nun die Ankunftswahrscheinlichkeit aus beiden Spalten so einfach ergibt, wenn auch nicht als (P1 + P2 ), so ist das wirklich alles, was zu sagen wäre. Aber in der Tatsache, dass sich die Natur so verhält, stecken noch viele Feinheiten. Wir möchten Ihnen jetzt einige von diesen Feinheiten vor Augen führen. Da die Anzahl der Elektronen, die an einem bestimmten Punkt ankommen, nicht gleich der Anzahl aus Spalt 1 plus der Anzahl aus Spalt 2 ist, wie wir aus Behauptung A geschlossen hätten, müssen wir zweifellos als Erstes folgern, dass Behauptung A falsch ist. Es ist nicht wahr, dass die Elektronen entweder durch Spalt 1 oder durch Spalt 2 gehen. Aber diese Folgerung kann durch einen anderen Versuch überprüft werden.
1.6
Beobachtung der Elektronen
Wir werden jetzt folgendes Experiment betrachten. Unseren Versuchsaufbau ergänzen wir durch eine starke Lichtquelle. Wir stellen sie hinter die Wand zwischen die beiden Spalte, wie aus Abbildung 1.4 ersichtlich. Wir wissen, dass elektrische Ladungen Licht streuen. Daher wird ein Elektron beim Vorbeifliegen auf seinem Weg zum Detektor, wie immer es auch vorbeifliegt, etwas Licht in unser Auge streuen, und wir können sehen, wo das Elektron entlangfliegt. Wenn zum Beispiel ein Elektron seinen Weg durch Spalt 2 nimmt (siehe Abbildung 1.4), sehen wir einen Lichtblitz aus der Umgebung der Stelle, die in der Abbildung mit A bezeichnet ist. Wenn ein Elektron durch Spalt 1 geht, sehen wir den Blitz aus der Umgebung des oberen Spalts. Kann es passieren, dass wir Licht von beiden Stellen zur selben Zeit sehen, weil sich das Elektron halbiert . . .? Am besten führen wir das Experiment durch! Wir sehen Folgendes: Jedes Mal, wenn wir einen „Klick“ von unserem Elektronendetektor (an der Auffangwand) hören, sehen wir auch einen Lichtblitz, entweder bei Spalt 1 oder bei Spalt 2, aber niemals bei beiden zugleich! Und wir beobachten dasselbe Ergebnis, ganz gleich, wo wir den Detektor hinstellen. Aus dieser Beobachtung schließen wir, dass wir, wenn wir die Elektronen beobachten, tatsächlich feststellen, dass sie entweder durch den einen oder durch den anderen Spalt gegangen sind. Experimentell ist Behauptung A notwendigerweise richtig.
1.6 Beobachtung der Elektronen
9 x
x
P1
Licht1 quelle Elektronenkanone
2
A
P12
P2
P12 = P1 +P2
(a)
(b)
(c)
Abb. 1.4: Ein modifiziertes Elektronenexperiment.
Was ist dann aber falsch an unserem Argument gegen Behauptung A? Warum ist P12 nicht gleich P1 + P2 ? Zurück zum Versuch! Behalten wir die Elektronen im Auge und finden wir heraus, was sie machen. Für jede Position (x-Lage) des Detektors wollen wir die ankommenden Elektronen zählen und auch registrieren, durch welchen Spalt sie gegangen sind, indem wir die Blitze beobachten. Wir können die Geschehnisse auf diese Weise verfolgen: Jedes Mal, wenn wir einen „Klick“ hören, vermerken wir das Ereignis in der Rubrik 1, wenn wir den Blitz bei Spalt 1 sehen, und wenn wir den Blitz bei Spalt 2 sehen, vermerken wir ein Ereignis in der Rubrik 2. Jedes ankommende Elektron wird in einer von zwei Rubriken registriert: solche, die durch Spalt 1 kommen, und solche, die durch Spalt 2 kommen. Aus der Anzahl, die in Rubrik 1 vermerkt ist, erhalten wir die Wahrscheinlichkeit P1 , dass ein Elektron durch Spalt 1 am Detektor ankommt, und aus der Anzahl, die in Rubrik 2 vermerkt ist, erhalten wir P2 , die Wahrscheinlichkeit dafür, dass ein Elektron am Detektor durch Spalt 2 ankommt. Wenn wir jetzt solche Messungen für viele x-Werte wiederholen, erhalten wir die Kurven für P1 und P2 , die in Teil (b) von Abbildung 1.4 dargestellt sind. Nun ja, das Ergebnis ist nicht allzu überraschend! Wir erhalten für P1 etwas ganz Ähnliches wie das, was wir vorher für P1 bekamen, wenn wir Spalt 2 zuhielten; und P2 ist dem ähnlich, was wir bei geschlossenem Spalt 1 erhielten. Wir haben also keinen komplizierten Vorgang, wie etwa den Durchgang durch beide Spalte. Wenn wir sie beobachten, dann laufen die Elektronen hindurch, wie wir es von ihnen erwarten. Ganz gleich, ob die Spalte geschlossen oder offen sind, diejenigen, die wir durch Spalt 1 kommen sehen, haben immer die gleiche Verteilung, egal, ob Spalt 2 offen oder geschlossen ist. Aber halt! Was haben wir jetzt als Gesamtwahrscheinlichkeit, als Wahrscheinlichkeit, dass ein Elektron am Detektor auf irgendeinem Wege ankommt? Diese Information haben wir schon. Wir tun so, als hätten wir die Lichtblitze nie gesehen, und fassen die Detektorklicks, die wir in zwei Rubriken gegliedert haben, zusammen. Wir müssen die Zahlen einfach addieren. Als Wahrscheinlichkeit dafür, dass ein Elektron an der Auffangwand durch irgendeinen Spalt ankommt, erhalten wir P12 = P1 + P2 . Das heißt, obwohl wir nun beobachten konnten, durch welchen Spalt unsere Elektronen kamen, so erhalten wir trotzdem nicht mehr die alte Interferenzkurve P12 , sondern eine neue, P12 , die keine Interferenz zeigt! Wenn wir das Licht ausschalten, ist P12 wiederhergestellt. Wir müssen daraus schließen, dass die Verteilung der Elektronen auf dem Schirm, wenn wir sie beobachten, anders ist, als wenn wir sie nicht beobachten. Vielleicht bringt das Einschalten unserer Lichtquelle die Dinge durcheinander? Es muss so sein, dass die Elektronen sehr empfindlich sind und dass ihnen das Licht, wenn es von ihnen gestreut wird, einen Impuls verleiht,
10
1 Quantenverhalten
der ihre Bewegung ändert. Wir wissen, dass das elektrische Feld des Lichtes, wenn es auf eine Ladung wirkt, auf diese eine Kraft ausübt. Vielleicht müssen wir daher erwarten, dass die Bewegung geändert wird. In jedem Fall übt das Licht einen großen Einfluss auf die Elektronen aus. Durch den Versuch, die Elektronen zu „beobachten“, haben wir ihre Bewegung verändert. Das heißt, der Impuls, den das Elektron erhält, wenn es das Photon streut, ist so groß, dass er die Bewegung des Elektrons in einer Weise ändert, dass dieses, wenn es ursprünglich dahin hätte fliegen können, wo P12 zuvor ein Maximum hatte, nun stattdessen dort landet, wo P12 zuvor ein Minimum hatte. Das ist der Grund dafür, dass wir nicht mehr die welligen Interferenzeffekte sehen. Vielleicht denken Sie: „Nehmen Sie doch eine nicht so helle Lichtquelle! Drehen Sie die Helligkeit herunter! Die Lichtwellen werden dann schwächer sein und die Elektronen nicht so sehr stören. Wenn wir das Licht mehr und mehr abschwächen, wird die Welle sicher irgendwann so schwach werden, dass man ihre Wirkung vernachlässigen kann.“ Okay, versuchen wir’s. Das Erste, was wir beobachten, ist, dass die Lichtblitze, die von den vorbeifliegenden Elektronen gestreut werden, nicht schwächer werden. Es ist immer der gleich starke Blitz. Das Einzige, was passiert, wenn wir das Licht abschwächen, ist, dass wir manchmal einen „Klick“ aus dem Detektor hören, aber überhaupt keinen Blitz sehen. Das Elektron ist „ungesehen“ vorbeigeflogen. Was wir hier beobachten, ist, dass sich das Licht auch wie Elektronen verhält; wir wussten, dass es „wellenartig“ ist, aber nun stellen wir fest, dass es auch „klumpig“ ist. Immer kommt es an – oder wird gestreut – als Klumpen, die wir „Photonen“ nennen. Wenn wir die Intensität der Lichtquelle herunterregeln, ändern wir nicht die Größe der Photonen, sondern nur die Rate, mit der sie emittiert werden. Das erklärt, warum einige Elektronen bei schwachem Licht ungesehen vorbeifliegen. Es war eben gerade kein Photon zur Stelle, als das Elektron vorbeikam. Dies ist alles recht entmutigend. Wenn es wahr ist, dass wir jedes Mal, wenn wir ein Elektron „sehen“, auch einen gleich starken Blitz sehen, dann sind die Elektronen, die wir sehen, immer gestört. Dennoch wollen wir den Versuch mit dem abgeschwächten Licht durchführen. Jedes Mal, wenn wir jetzt einen Klick aus dem Detektor hören, wollen wir ihn in einer von drei Rubriken vermerken: In der Rubrik 1 jene Elektronen, die von Spalt 1 gesehen wurden, in der Rubrik 2 jene Elektronen, die von Spalt 2 gesehen wurden, und in der Rubrik 3 jene Elektronen, die gar nicht gesehen wurden. Wenn wir die Daten auswerten (die Wahrscheinlichkeiten ausrechnen), erhalten wir folgende Ergebnisse: Die Elektronen, die von Spalt 1 gesehen wurden, haben eine Verteilung wie P1 ; die Elektronen, die von Spalt 2 gesehen wurden, haben eine Verteilung wie P2 , (sodass die, die entweder von Spalt 1 oder von Spalt 2 gesehen wurden, eine Verteilung wie P12 haben); und die, die gar nicht gesehen wurden, haben eine „wellenartige“ Verteilung, genau wie P12 in Abbildung 1.3! Wenn die Elektronen nicht gesehen werden, erhalten wir Interferenz! Das ist verständlich. Wenn wir das Elektron nicht sehen, wird es von keinem Photon gestört, und wenn wir es sehen, dann ist es von einem Photon gestört worden. Die Störung ist immer gleich groß, weil die Photonen des Lichts immer eine gleich große Wirkung hervorrufen, und der Effekt durch die Streuung der Photonen reicht aus, um jede Interferenzerscheinung zu verwischen. Gibt es nicht irgendeine Möglichkeit, die Elektronen zu sehen, ohne sie zu stören? In einem früheren Kapitel haben wir gelernt, dass der Impuls, den ein Photon besitzt, zu seiner Wellenlänge umgekehrt proportional ist (p = h/λ). Sicherlich hängt der Impuls, der einem Elektron gegeben wird, wenn das Photon zu unserem Auge gestreut wird, von dem Impuls ab, den das
1.6 Beobachtung der Elektronen
11
Photon besitzt. Aha! Wenn wir die Elektronen nur wenig stören wollen, hätten wir nicht die Intensität des Lichtes verringern sollen, sondern seine Frequenz (das ist gleichbedeutend mit einer Vergrößerung der Wellenlänge). Nehmen wir also Licht vom roten Ende des Spektrums. Wir könnten auch Infrarotlicht oder Radiowellen (wie Radar) benutzen und mit einer Einrichtung, die Licht dieser größeren Wellenlänge „sehen“ kann, den Weg der Elektronen „sichtbar“ machen. Wenn wir „weicheres“ Licht benutzen, können wir vielleicht eine größere Störung der Elektronen vermeiden. Wiederholen wir das Experiment mit längeren Wellen. Wir werden unser Experiment mit immer langwelligerem Licht durchführen. Zuerst scheint sich nichts zu ändern. Die Resultate bleiben dieselben. Dann passiert etwas Schreckliches. Sie erinnern sich sicher, dass wir bei der Besprechung des Mikroskops darauf hingewiesen haben, dass es infolge der Wellennatur des Lichtes eine Grenze dafür gibt, wie nahe zwei Punkte zusammen sein können, um noch als getrennte Punkte gesehen zu werden. Diese Entfernung liegt in der Größenordnung der Wellenlänge des Lichtes. Wenn wir die Wellenlänge größer als die Entfernung zwischen unseren Spalten werden lassen, sehen wir daher einen ausgedehnten verschwommenen Blitz, wenn das Licht von einem Elektron gestreut wird. Wir können nicht mehr sagen, durch welchen Spalt das Elektron gegangen ist! Wir wissen nur, es kam irgendwoher! Und gerade bei dem Licht dieser Farbe stellen wir fest, dass die Impulse, die dem Elektron gegeben werden, klein genug sind, dass P12 anfängt wie P12 auszusehen – dass die Interferenz sich bemerkbar macht. Und nur bei Wellenlängen, die sehr viel größer als der Abstand zwischen den beiden Spalten sind (wenn wir überhaupt keine Möglichkeit mehr haben, den Weg der Elektronen zu verfolgen), wird die Störung durch das Licht so klein, dass wir wieder die Kurve P12 aus Abbildung 1.3 erhalten. In unserem Experiment stellen wir fest, dass es unmöglich ist, das Licht derart einzustellen, dass man sagen kann, durch welchen Spalt die Elektronen gegangen sind, ohne gleichzeitig das Beugungsbild zu stören. Heisenberg erkannte, dass die damals neuen Naturgesetze nur dann konsistent sind, wenn es eine grundsätzliche Begrenzung für unsere experimentellen Möglichkeiten gibt, die man vorher nicht kannte. Als allgemeines Prinzip schlug er sein Unbestimmtheitsprinzip vor, welches wir für unser Experiment folgendermaßen formulieren können: „Es ist unmöglich, einen Apparat zu konstruieren, der feststellt, durch welchen Spalt ein Elektron geht, ohne dass er gleichzeitig die Elektronen so weit stört, dass das Interferenzbild zerstört wird.“ Wenn ein Apparat in der Lage ist festzustellen, durch welchen Spalt ein Elektron geht, dann kann er nicht so sensitiv sein, dass er das Beugungsbild nicht wesentlich stört. Niemand hat jemals einen Weg gefunden (oder erdacht), mit dem sich das Unbestimmtheitsprinzip umgehen ließe. Daher müssen wir annehmen, dass es eine grundsätzliche Eigenschaft der Natur beschreibt. Die gesamte Theorie der Quantenmechanik, die wir heute zur Beschreibung der Atome und somit der gesamten Materie benutzen, beruht auf der Gültigkeit des Unbestimmtheitsprinzips. Da die Quantenmechanik eine so erfolgreiche Theorie ist, ist unser Vertrauen in das Unbestimmtheitsprinzip stark. Aber wenn jemals ein Weg gefunden würde, das Unbestimmtheitsprinzip zu „besiegen“, dann würde die Quantenmechanik widersprüchliche Ergebnisse liefern und müsste als gültiges Naturgesetz aufgegeben werden. „Schön und gut“, sagen Sie, „aber was ist mit Behauptung A? Stimmt es nun oder stimmt es nicht, dass jedes Elektron entweder durch Spalt 1 oder durch Spalt 2 geht?“ Die einzige Antwort, die man darauf geben kann, ist, dass wir aus den Experimenten entnommen haben, dass wir ein bestimmtes Denkschema anwenden müssen, um nicht zu Widersprüchen zu gelangen.
12
1 Quantenverhalten
Was wir (zur Vermeidung falscher Vorhersagen) sagen müssen, ist Folgendes: Wenn man die Spalte beobachtet, oder besser, wenn man ein Gerät hat, das in der Lage ist festzustellen, ob die Elektronen durch Spalt 1 oder Spalt 2 gehen, dann kann man sagen, dass sie entweder durch Spalt 1 oder durch Spalt 2 gehen. Aber wenn man sich nicht um eine Aussage über den Weg der Elektronen bemüht, wenn es nichts in dem Versuch gibt, was die Elektronen stören könnte, dann darf man nicht sagen, dass ein Elektron entweder durch Spalt 1 oder durch Spalt 2 geht. Wenn jemand das doch behauptet und anfängt, aus dieser Behauptung Schlüsse zu ziehen, dann wird er in der Auswertung Fehler machen. Das ist das logische Drahtseil, auf dem wir balancieren müssen, wenn wir die mikroskopische Natur erfolgreich beschreiben wollen. Wenn die Bewegung aller Materie – und damit auch der Elektronen – in Wellenausdrücken beschrieben werden muss, wie verhält es sich dann mit den Kugeln in unserem ersten Experiment? Warum sahen wir da kein Interferenzbild? Es stellt sich heraus, dass die Wellenlängen für die Kugeln so klein sind, dass die Interferenzlinien sehr fein wurden. In der Tat so fein, dass man mit einem Detektor von endlicher Größe die Maxima und Minima nicht mehr voneinander unterscheiden kann. Was wir sahen, war nur eine Art von Mittelwert, welcher die klassische Kurve ergibt. In Abbildung 1.5 haben wir versucht, schematisch darzustellen, was mit Objekten von größerer Ausdehnung geschieht. Teil (a) der Abbildung zeigt die Wahrscheinlichkeitsverteilung, die man bei Anwendung der Quantenmechanik für Kugeln vorhersagen würde. Die schnellen Schwankungen sollen das Interferenzmuster darstellen, das man für Wellen mit sehr kurzer Wellenlänge erhält. Jeder physikalische Detektor jedoch überdeckt mehrere Schwankungen der Wahrscheinlichkeitskurve, sodass die Messungen die glatte Kurve ergeben, die in Teil (b) der Abbildung gezeichnet ist. x
x P12 (geglättet)
P12
(a)
1.7
(b)
Abb. 1.5: Interferenzbild mit Kugeln: (a) tatsächlich (schematisch), (b) beobachtet.
Grundprinzipien der Quantenmechanik
Wir wollen nun die Hauptergebnisse unserer Experimente zusammenfassen. Wir wollen sie jedoch in eine Form bringen, die sie für eine allgemeine Klasse solcher Experimente gültig macht. Wir können unsere Zusammenfassung einfacher darstellen, wenn wir zuerst ein „ideales Experiment“ definieren, eins, in dem es keine unsicheren äußeren Einflüsse gibt, d. h. keine Schwankungen oder andere Vorgänge, die wir nicht berücksichtigen können. Wir können uns ziemlich präzise ausdrücken, wenn wir sagen: „Ein ideales Experiment ist ein Experiment, in dem alle Anfangs- und Endbedingungen vollständig festgelegt sind.“ Was wir ein „Ereignis“
1.7 Grundprinzipien der Quantenmechanik
13
nennen, ist im Allgemeinen nur ein besonderer Satz von Anfangs- und Endbedingungen. (Zum Beispiel: „Ein Elektron verlässt die Kanone, kommt am Detektor an und sonst passiert nichts.“) Nun zu unserer Zusammenfassung.
Zusammenfassung 1. Die Wahrscheinlichkeit eines Ereignisses ist in einem idealen Experiment durch das Quadrat des Absolutbetrages einer komplexen Zahl φ gegeben, die Wahrscheinlichkeitsamplitude genannt wird: P = Wahrscheinlichkeit φ = Wahrscheinlichkeitsamplitude
(1.6)
2
P = |φ| . 2. Wenn ein Ereignis auf verschiedene Weise auftreten kann, ist die Wahrscheinlichkeitsamplitude für das Ereignis die Summe der Wahrscheinlichkeitsamplituden aller einzeln betrachteten Möglichkeiten. Es gibt Interferenz: φ = φ1 + φ2 , P = |φ1 + φ2 |2 .
(1.7)
3. Wenn ein Experiment durchgeführt wird, das eine Entscheidung erlaubt, ob die eine oder die andere Alternative wirklich gewählt wurde, dann ist die Wahrscheinlichkeit für das Ereignis die Summe der Wahrscheinlichkeiten für jede der Alternativen. Die Interferenz geht verloren: P = P1 + P2 .
(1.8)
Es könnte immer noch jemand fragen: „Wie funktioniert das? Welcher Mechanismus steckt hinter diesem Gesetz?“ Niemand hat irgendeinen Mechanismus hinter dem Gesetz gefunden. Niemand kann mehr „erklären“, als wir gerade „erklärt“ haben. Niemand wird Ihnen irgendeine tiefer gehende Darstellung der Verhältnisse geben. Wir haben keine Vorstellung von einem grundlegenderen Mechanismus, aus dem diese Resultate hergeleitet werden könnten. Wir möchten einen sehr wichtigen Unterschied zwischen der klassischen Mechanik und der Quantenmechanik hervorheben. Wir haben von der Wahrscheinlichkeit gesprochen, dass ein Elektron unter gegebenen Umständen eintreffen wird. Wir haben dabei stillschweigend vorausgesetzt, dass es in unserem experimentellen Aufbau (und selbst in dem bestmöglichen Aufbau) unmöglich sein würde, genau vorherzusagen, was passiert. Wir können nur die Wahrscheinlichkeit vorhersagen! Wenn das wahr wäre, würde es bedeuten, dass die Physiker ihren Anspruch aufgegeben haben, genau vorherzusagen, was unter bestimmten Umständen passieren wird. Ja! Die Physiker haben das aufgegeben. Wir wissen nicht, wie man vorhersagen könnte, was unter vorgegebenen Umständen passieren wird, und wir glauben heute, dass es unmöglich ist – dass das Einzige, was vorhergesagt werden kann, die Wahrscheinlichkeit verschiedener Ereignisse ist. Es ist festzustellen, dass wir damit Abstriche an unserem früheren Ideal machen, die Natur zu verstehen. Es mag ein Schritt zurück sein, doch hat niemand eine Möglichkeit gesehen, ihn zu vermeiden.
14
1 Quantenverhalten
Es folgen jetzt einige Bemerkungen zu einem Vorschlag, der mitunter angeführt wird, um die von uns dargelegte Wahrscheinlichkeitsbeschreibung zu vermeiden: „Vielleicht besitzt das Elektron eine Art von innerem Mechanismus – irgendwelche internen Variablen –, von denen wir bloß nichts wissen. Vielleicht ist das der Grund, warum wir nicht vorhersagen können, was passieren wird. Wenn wir das Elektron genauer betrachten könnten, wäre es uns vielleicht möglich zu sagen, was es tun wird.“ Soweit wir wissen, ist das unmöglich. Wir wären auch weiterhin in Schwierigkeiten. Stellen Sie sich vor, wir müssten annehmen, dass es in dem Elektron eine Art Mechanismus gäbe, der bestimmt, was es tun wird. Diese Maschine müsste auch bestimmen, durch welchen Spalt es auf seinem Wege gehen wird. Aber wir dürfen nicht vergessen, dass das, was in dem Elektron geschieht, nicht davon abhängig sein darf, was wir tun, und erst recht nicht davon, ob wir einen der Spalte öffnen oder schließen. Wenn sich daher ein Elektron schon vor seinem Start entschlossen hat, (a) welchen Spalt es benutzen wird und (b) wo es landen wird, dann sollten wir für jene Elektronen, die Spalt 1 gewählt haben, P1 finden, für jene, die Spalt 2 gewählt haben, P2 , und notwendigerweise die Summe P1 + P2 für jene, die durch beiden Spalte ankommen. Daran scheint kein Weg vorbeizuführen. Aber wir haben experimentell verifiziert, dass dies nicht der Fall ist. Und niemand hat eine Lösung für dieses Rätsel gefunden. So müssen wir uns wohl gegenwärtig damit begnügen, Wahrscheinlichkeiten zu berechnen. Wir sagen „gegenwärtig“, aber wir haben den starken Verdacht, dass dies etwas ist, von dem wir nicht mehr loskommen – dass es unmöglich ist, das Rätsel zu lösen, weil die Natur tatsächlich so ist.
1.8
Das Unbestimmtheitsprinzip
Heisenberg hat das Unbestimmtheitsprinzip ursprünglich wie folgt formuliert: Wenn man an einem Objekt Messungen vornimmt und dabei die x-Komponente seines Impulses mit einer Unbestimmtheit Δp bestimmen kann, dann kann man gleichzeitig seine x-Koordinate nicht genauer als Δx = h/Δp ermitteln, wobei h eine von der Natur gegebene konstante Zahl ist. Sie heißt „plancksche Konstante“ oder „plancksches Wirkungsquantum“ und ihr Wert ist ungefähr 6,63 × 10−34 Joulesekunden. Das Produkt der Unbestimmtheiten von Ort und Impuls eines Teilchens muss immer größer als die plancksche Konstante sein. Dies ist ein Spezialfall des Unbestimmtheitsprinzips, das oben allgemeiner formuliert wurde. Die allgemeinere Aussage war, dass man zur Entscheidung, welche von zwei Alternativen gewählt wird, unmöglich eine Vorrichtung entwickeln kann, die nicht gleichzeitig das Interferenzbild zerstört. Wir wollen für einen speziellen Fall zeigen, dass die von Heisenberg angegebene Beziehung gelten muss, damit man nicht in Widersprüche gerät. Wir stellen uns eine Abwandlung des Experiments der Abbildung 1.3 vor, bei der die Wand mit den Spalten aus einer auf Rollen gelagerten Platte besteht, sodass sie sich frei auf- und abwärts bewegen kann (in x-Richtung), wie in Abbildung 1.6 dargestellt ist. Wenn wir die Bewegung der Platte sorgfältig beobachten, können wir versuchen zu erkennen, durch welchen Spalt ein Elektron geht. Stellen wir uns vor, was passiert, wenn der Detektor bei x = 0 steht. Wir erwarten, dass ein Elektron, das durch Spalt 1 geht, von der Platte nach unten abgelenkt wird, um den Detektor zu erreichen. Da sich nun die vertikale Komponente des Elektronenimpulses geändert hat, muss die Platte mit gleichem Impuls in die entgegengesetzte Richtung zurückfahren. Die Platte erhält einen Impuls nach oben. Wenn das Elektron durch den unteren Spalt geht, wird die Platte einen Impuls nach unten empfangen. Es ist klar, dass
1.8 Das Unbestimmtheitsprinzip
15
Rollen pa pb
Detektor
1
Elekronenkanone
Δp x
2
frei beweglich
pa pb
Δp x
Rollen Wand
Auffangwand
Abb. 1.6: Ein Experiment, in dem der Rückstoß der Wand gemessen wird.
für jede Stellung des Detektors der Impuls, den die Platte erhält, bei einem Durchgang durch Spalt 1 einen anderen Wert hat als bei einem Durchgang durch Spalt 2. So! Ohne die Elektronen im geringsten zu stören, können wir also sagen, welchen Weg die Elektronen genommen haben, indem wir nur die Platte beobachten. Um dies zu tun, müssen wir zunächst wissen, wie groß der Impuls der Platte war, bevor das Elektron hindurchging. Wenn wir dann den Impuls der Platte messen, nachdem das Elektron hindurchgegangen ist, können wir ausrechnen, um welchen Betrag sich der Impuls der Platte geändert hat. Aber erinnern Sie sich daran: Aufgrund des Unbestimmtheitsprinzips können wir dabei nicht gleichzeitig den Ort der Platte mit beliebiger Genauigkeit bestimmen. Aber wenn wir nicht genau wissen, wo die Platte ist, können wir auch nicht mit Bestimmtheit sagen, wo die beiden Spalte sind. Sie werden für jedes Elektron, das hindurchgeht, an einer anderen Stelle sein. Das bedeutet, dass der Mittelpunkt unseres Interferenzbildes für jedes Elektron an einem anderen Ort liegt. Die Wellenlinien des Interferenzbildes werden verschmiert sein. Im nächsten Kapitel werden wir quantitativ zeigen: Wenn wir den Impuls der Platte hinreichend genau bestimmen, um aus einer Messung des Rückstoßes zu entscheiden, welcher Spalt benutzt wurde, wird aufgrund des Unbestimmtheitsprinzips die Unbestimmtheit in der x-Position der Platte ausreichen, um das beobachtete Bild am Detektor in x-Richtung um den Abstand von einem Maximum zum nächsten Minimum auf- bzw. abwärts zu verschieben. Diese zufällige Verschiebung reicht gerade aus, um das Bild zu verschmieren, sodass man keine Interferenz beobachtet. Das Unbestimmtheitsprinzip „schützt“ die Quantenmechanik. Heisenberg erkannte, dass die Quantenmechanik zusammenbrechen würde, wenn es möglich wäre, Impuls und Ort gleichzeitig mit beliebiger Genauigkeit zu messen. Deshalb behauptete er, dass dies unmöglich sein müsse. Dann setzten sich Leute hin und versuchten, Mittel und Wege zu finden, um dieses Prinzip zu „überlisten“, aber niemand fand eine Möglichkeit, den Ort und Impuls von einem Objekt – einem Schirm, einem Elektron, einer Billardkugel oder von sonstigen Dingen – mit auch nur etwas größerer Genauigkeit zu messen. Die Quantenmechanik behält ihre mysteriöse aber doch korrekte Existenz.
2
Die Beziehung zwischen dem Wellen- und dem Teilchenbild
Anmerkung: Dieses Kapitel stimmt nahezu mit Kapitel 13 des zweiten Bandes überein.
2.1
Wahrscheinlichkeitsamplituden
In diesem Kapitel werden wir die Beziehung zwischen dem Wellen- und dem Teilchenbild diskutieren. Wir wissen bereits aus dem vorangegangenen Kapitel, dass weder das Wellenbild noch das Teilchenbild korrekt ist. Wir würden die physikalischen Sachverhalte immer gern genau darstellen oder wenigstens so genau, dass die Beschreibung nicht geändert werden muss, wenn wir mehr gelernt haben. Sie kann erweitert werden, aber sie wird nicht geändert! Wenn wir aber versuchen, vom Wellenbild oder vom Teilchenbild zu reden, so sind beide nur Näherungen und beide werden sich ändern. Daher wird das, was wir in diesem Kapitel lernen, in gewissem Sinne ungenau sein. Wir werden uns mit einigen halbintuitiven Argumenten befassen, die später präzisiert werden müssen. Aber bestimmte Aussagen müssen ein wenig geändert werden, wenn wir sie korrekt quantenmechanisch interpretieren. Wir machen dies, damit Sie bereits eine qualitative Vorstellung von Quantenphänomenen bekommen können, bevor wir in die mathematischen Details der Quantenmechanik einsteigen. Außerdem haben wir nur mit Wellen und Teilchen intuitive Erfahrungen und es ist daher recht bequem, den Wellen- und den Teilchenbegriff zu benutzen, um ungefähr verstehen zu können, was unter gegebenen Umständen geschieht, bevor wir die vollständige Mathematik der quantenmechanischen Amplituden kennenlernen. Wir werden versuchen, auf unserem Wege die Schwachstellen aufzuzeigen, aber das meiste ist fast korrekt – es ist lediglich eine Frage der Interpretation. Zunächst wissen wir, dass die neue Methode, die Welt im Rahmen der Quantenmechanik – im neuen Begriffssystem – darzustellen, darin besteht, jedem möglichen Ereignis eine Amplitude zuzuordnen. Wenn das Ereignis die Beobachtung eines Teilchens betrifft, dann können wir die Amplitude dafür angeben, dieses eine Teilchen an verschiedenen Orten und zu verschiedenen Zeiten zu finden. Die Wahrscheinlichkeit, dieses Teilchen anzutreffen, ist dann proportional zum Absolutquadrat der Amplitude. Im Allgemeinen variiert die Amplitude, ein Teilchen an verschiedenen Orten zu verschiedenen Zeiten anzutreffen, mit Ort und Zeit. In bestimmten Spezialfällen kann es sein, dass die Amplitude wie ei(ωt−k·r) sinusförmig in Raum und Zeit variiert, wobei r der Ortsvektor von einem Ursprung aus ist. (Vergessen Sie nicht, dass diese Amplituden keine reellen Zahlen, sondern komplexe Zahlen sind.) Ein solche Amplitude variiert mit einer bestimmten Frequenz ω und Wellenzahl k. Dann zeigt sich, dass dies einer klassischen Grenzsituation entspricht, in der wir davon ausgehen, ein Teilchen vor uns zu haben,
18
2 Die Beziehung zwischen dem Wellen- und dem Teilchenbild
dessen Energie E bestimmt ist und mit der Frequenz über E = ω
(2.1)
zusammenhängt und dessen Impuls p ebenfalls bestimmt ist und mit der Wellenzahl über p = k.
(2.2)
zusammenhängt. (Das Symbol steht für die Zahl h dividiert durch 2π; = h/2π.) Das bedeutet, dass das Konzept des Teilchens seine Grenzen hat. Die Vorstellung von einem Teilchen – von seinem Ort, seinem Impuls usw. –, die wir so oft benutzen, ist in gewisser Weise unbefriedigend. Wenn zum Beispiel die Amplitude, ein Teilchen an verschiedenen Orten anzutreffen, durch ei(ωt−k·r) gegeben ist, so ist ihr Absolutquadrat eine Konstante, und das bedeutet, dass die Wahrscheinlichkeit, das Teilchen anzutreffen, an allen Orten gleich ist. Das heißt, wir wissen nicht, wo es ist – es kann überall sein; hinsichtlich seines Ortes besteht eine große Unsicherheit. Wenn andererseits der Ort eines Teilchens mehr oder weniger gut bekannt ist und wir ihn beinahe genau vorhersagen können, dann muss die Wahrscheinlichkeit, es an verschiedenen Orten anzutreffen, auf einen bestimmten Bereich beschränkt sein, dessen Länge wir mit Δx bezeichnen. Außerhalb dieses Bereiches ist die Wahrscheinlichkeit null. Nun ist diese Wahrscheinlichkeit das Absolutquadrat einer Amplitude, und wenn das Absolutquadrat null ist, dann ist auch die Amplitude null, sodass wir einen Wellenzug haben, dessen Länge Δx ist (Abbildung 2.1), und die Wellenlänge (der Abstand zwischen den Wellenknoten im Zug) dieses Wellenzuges korrespondiert mit dem Teilchenimpuls. Δx
Abb. 2.1: Ein Wellenpaket der Länge Δx.
Hier stoßen wir auf etwas Merkwürdiges im Zusammenhang mit Wellen, auf eine sehr einfache Tatsache, die überhaupt nichts mit der Quantenmechanik zu tun hat. Es ist ein Umstand, den jeder kennt, der sich mit Wellen beschäftigt, selbst wenn er nichts über Quantenmechanik weiß: nämlich, dass wir für einen kurzen Wellenzug keine bestimmte Wellenlänge angeben können. Ein solcher Wellenzug hat keine bestimmte Wellenlänge. Es besteht eine Unbestimmtheit in der Wellenzahl, die mit der endlichen Länge des Wellenzuges zusammenhängt, und daraus ergibt sich eine Unbestimmtheit im Impuls.
2.2
Messung von Ort und Impuls
Wir wollen zwei Beispiele für diesen Grundgedanken betrachten, um zu verstehen, warum eine Unbestimmtheit im Ort und/oder im Impuls bestehen muss, wenn die Quantenmechanik richtig sein soll. Wir haben schon vorher gesehen, dass wir ein Paradoxon hätten, wenn es diese Unbestimmheit nicht gäbe – wenn es also möglich wäre, den Ort und den Impuls eines Objektes gleichzeitig beliebig genau zu messen. Glücklicherweise erhalten wir ein solches Paradoxon
2.2 Messung von Ort und Impuls
19
C B
Δθ
Abb. 2.2: Beugung von Teilchen beim Durchgang durch einen Spalt.
nicht, und die Tatsache, dass sich diese Unbestimmtheit ganz natürlich aus dem Wellenbild ergibt, zeigt, dass alles wechselseitig konsistent ist. Es folgt ein Beispiel, das die Beziehung zwischen Ort und Impuls in einem leicht verständlichen Fall zeigt. Wir betrachten einen einzelnen Spalt, und Teilchen kommen mit einer bestimmten Energie von sehr weit her, sodass sie alle im Wesentlichen horizontal ankommen (siehe Abbildung 2.2). Wir werden uns auf die vertikale Komponente des Impulses konzentrieren. Alle diese Teilchen haben im klassischen Sinne einen bestimmten horizontalen Impuls p0 . Daher ist im klassischen Sinne der vertikale Impuls py , bevor das Teilchen durch den Spalt geht, definitiv bekannt. Das Teilchen bewegt sich weder nach oben noch nach unten, weil es von einer sehr weit entfernten Quelle kommt – und daher ist der vertikale Impuls selbstverständlich null. Aber nun wollen wir annehmen, dass es durch den Spalt geht, dessen Weite B ist. Dann kennen wir, wenn es aus dem Spalt herausgekommen ist, die vertikale Position – die y-Position – mit ziemlich hoher Genauigkeit – nämlich ±B.1 Das heißt, die Unbestimmtheit im Ort Δy ist von der Größenordnung B. Nun könnten wir weiterhin sagen wollen, dass Δpy gleich null ist, da uns der Impuls als absolut horizontal bekannt ist; aber das ist falsch. Wir wussten früher einmal, dass der Impuls horizontal war, aber wir wissen es jetzt nicht mehr. Bevor die Teilchen durch den Spalt gekommen sind, kannten wir ihre vertikale Position noch nicht. Jetzt, da wir nun dadurch, dass wir das Teilchen den Spalt passieren ließen, ihre vertikale Position festgelegt haben, haben wir unsere Information über den vertikalen Impuls verloren! Warum? Nach der Wellentheorie tritt eine Verbreiterung oder Beugung der Wellen ein, wenn sie durch den Spalt gehen, genau wie beim Licht. Daher gibt es eine gewisse Wahrscheinlichkeit, dass Teilchen, die aus dem Spalt kommen, nicht genau gerade weiterlaufen. Das Trefferbild verbreitert sich durch den Beugungseffekt, und der Verbreiterungswinkel, den wir als Winkel des ersten Minimums definieren können, ist ein Maß für die Unbestimmtheit im Austrittswinkel. Wie wird das Trefferbild verbreitert? Wenn wir sagen, dass es sich verbreitert, dann meinen wir damit, dass das Teilchen eine Wahrscheinlichkeit hat, sich nach oben oder unten zu bewegen, das heißt, es kann eine Impulskomponente haben, die nach oben oder unten gerichtet ist. Wir sagen Wahrscheinlichkeit und Teilchen, weil wir dieses Beugungsbild mit einem Teilchenzähler nachweisen können, und wenn der Zähler das Teilchen registriert, etwa bei C in Abbildung 2.2, registriert er das vollständige Teilchen, sodass das Teilchen im klassischen Sinne einen vertikalen Impuls hat, um vom Spalt hinauf nach C zu gelangen. Eine ungefähre Vorstellung von der Änderung des Impulses vermittelt die Änderung des vertikalen Impulses py , die gleich p0 Δθ ist, wobei p0 der horizontale Impuls ist. Und wie groß ist Δθ in dem verbreiterten Trefferbild? Wir wissen, dass das erste Minimum unter einem solchen 1
Genauer gesagt, die Ungenauigkeit in y ist ±B/2. Aber da wir jetzt nur an Grundkonzepten interessiert sind, wollen wir uns um einen Faktor 2 nicht kümmern.
20
2 Die Beziehung zwischen dem Wellen- und dem Teilchenbild
Winkel Δθ erscheint, dass die Wellen von der einen Kante des Spalts eine Wellenlänge mehr zurücklegen müssen als die Wellen von der anderen Kante – das haben wir früher herausbekommen (Kapitel 5, Band II). Daher ist Δθ gleich λ/B und Δpy in diesem Experiment gleich p0 λ/B. Beachten Sie, dass das Beugungsbild breiter wird, wenn wir B kleiner machen und dadurch eine genauere Festlegung des Teilchenortes vornehmen. Daher wird das Bild umso breiter, je enger wir den Spalt machen, und umso größer ist die Wahrscheinlichkeit, dass wir feststellen, dass das Teilchen einen vertikalen Impuls hat. Deshalb ist die Unbestimmtheit im vertikalen Impuls umgekehrt proportional zur Unbestimmtheit von y. Wir sehen tatsächlich, dass das Produkt der beiden Unbestimmtheiten gleich p0 λ ist. Aber λ ist die Wellenlänge und p0 der Impuls, und gemäß der Quantenmechanik ist die Wellenlänge multipliziert mit dem Impuls gleich der planckschen Konstante h. Wir erhalten so die Regel, dass das Produkt der Unbestimmtheiten im vertikalen Impuls und in der vertikalen Position von der Größenordnung h ist: Δy Δpy ≥ /2
(2.3)
Wir können kein System konstruieren, in dem wir die vertikale Position eines Teilchens mit größerer Genauigkeit als (2.3) vorhersagen können. Das heißt, die Unbestimmtheit im vertikalen Impuls muss größer sein als /2Δy, wobei Δy die Unbestimmtheit in unserer Kenntnis des Ortes ist. Manche Leute halten die ganze Quantenmechanik für fehlerhaft. Als das Teilchen von links ankam, war sein vertikaler Impuls null. Und nun, da es durch den Spalt gegangen ist, ist sein Ort bekannt. Beide, Ort und Impuls, scheinen mit uneingeschränkter Genauigkeit bekannt zu sein. Es ist völlig richtig, dass wir ein Teilchen registrieren und beim Registrieren feststellen können, wo es ist und was für einen Impuls es gehabt haben muss, um dorthin zu gelangen. Das ist zwar richtig, aber es ist nicht das, worauf sich die Unbestimmtheitsrelation (2.3) bezieht. Die Gleichung (2.3) bezieht sich auf die Vorhersagbarkeit einer Situation, nicht auf Aussagen über die Vergangenheit. Es ist nutzlos zu sagen: „Ich kannte den Impuls, bevor das Teilchen durch den Spalt ging, und jetzt kenne ich den Ort“, weil jetzt die Kenntnis des Impulses verloren gegangen ist. Die Tatsache, dass es durch den Spalt gegangen ist, erlaubt es uns nicht mehr, den vertikalen Impuls vorherzusagen. Wir reden über eine vorhersagende Theorie, nicht bloß über Messungen nach dem Ereignis. Daher müssen wir darüber reden, was wir vorhersagen können. Nun wollen wir die Situation aus einer anderen Perspektive betrachten. Wir wollen ein anderes Beispiel für dasselbe Phänomen etwas quantitativer diskutieren. Im vorherigen Beispiel haben wir den Impuls auf klassische Weise gemessen. Wir betrachteten nämlich die Richtung, die Geschwindigkeit, die Winkel usw. und erhielten so den Impuls. Aber da der Impuls mit der Wellenzahl zusammenhängt, gibt es noch einen anderen Weg, den Impuls eines Teilchens – zum Beispiel eines Photons – zu messen, welcher kein klassisches Analogon hat, weil dabei Gleichung (2.2) benutzt wird. Wir messen die Wellenlänge. Wir wollen versuchen, den Impuls auf diesem Wege zu bestimmen. Wir betrachten ein Gitter mit einer großen Anzahl von Linien (siehe Abbildung 2.3) und lenken einen Teilchenstrahl auf das Gitter. Wir haben dieses Problem schon oft diskutiert: Wenn die Teilchen einen bestimmten Impuls haben, dann bekommen wir wegen der Interferenz in einer bestimmten Richtung ein sehr scharfes Bild, und wir haben auch darüber gesprochen, wie genau wir diesen Impuls bestimmen können, das heißt, wie groß das Auflösungsvermögen eines solchen Gitters ist. Anstatt es noch einmal herzuleiten, verweisen wir auf Kapitel 5 von Band II, wo wir gefunden haben, dass bei der Messung mit einem vorgegebenen Gitter die relative Un-
2.2 Messung von Ort und Impuls
21
Nmλ = L
Abb. 2.3: Bestimmung des Impulses durch Verwendung eines Beugungsgitters.
bestimmtheit in der Wellenlänge gleich 1/Nm ist, wobei N die Zahl der Linien auf dem Gitter und m die Ordnung des Beugungsbildes ist. Es gilt also Δλ/λ = 1/Nm .
(2.4)
Nun kann die Gleichung (2.4) umgeschrieben werden in Δλ/λ2 = 1/Nmλ = 1/L ,
(2.5)
wobei L der in Abbildung 2.3 gezeigte Abstand ist. Dieser Abstand ist die Differenz zwischen der gesamten Entfernung, die das Teilchen oder die Welle (oder was immer es sei) zurückzulegen hat, wenn es vom unteren Ende des Gitters reflektiert wird, und der Entfernung, die es zurückzulegen hat, wenn es vom oberen Ende des Gitters reflektiert wird. Das heißt, die Wellen, die das Beugungsbild erzeugen, sind Wellen, die von verschiedenen Teilen des Gitters kommen. Die zuerst eintreffenden Wellen kommen vom unteren Ende des Gitters, vom Anfang des Wellenzuges. Die übrigen kommen von den folgenden Teilen des Wellenzuges und von verschiedenen Teilen des Gitters, bis schließlich die letzte ankommt, und diese enthält einen Punkt in dem Wellenzug im Abstand L hinter dem ersten Punkt. Damit wir also eine scharfe Linie in unserem Spektrum erhalten, die mit einem Impuls mit einer Unbestimmheit gemäß (2.4) korrespondiert, benötigen wir einen Wellenzug mit der Mindestlänge L. Wenn der Wellenzug zu kurz ist, nutzen wir nicht das ganze Gitter aus. Die Wellen, die das Spektrum bilden, werden dann nur von einem sehr schmalen Bereich des Gitters reflektiert, und das Gitter erzeugt keine scharfe Linie – wir werden eine große Winkelverbreiterung bekommen. Um sie zu verkleinern, müssen wir das ganze Gitter ausnutzen, sodass wenigstens zu einem Zeitpunkt der ganze Wellenzug gleichzeitig an allen Teilen des Gitters reflektiert wird. Daher muss der Wellenzug die Länge L haben, damit die Unbestimmtheit in der Wellenlänge kleiner ist als durch (2.5) gegeben. Übrigens gilt Δλ/λ2 = Δ(1/λ) = Δk/2 π .
(2.6)
Daher gilt auch Δk = 2π/L ,
(2.7)
wobei L die Länge des Wellenzuges ist. Das bedeutet, dass die Unbestimmtheit in der Wellenzahl größer als 2π/L ist, wenn die Länge des Wellenzuges kleiner als L ist. Oder: Die Unbestimmtheit in der Wellenzahl multipliziert mit der Länge des Wellenzuges – wir wollen sie Δx nennen – ist größer als 2π. Wir nennen sie Δx, weil sie die Unbestimmtheit im Ort des Teilchens angibt. Wenn der Wellenzug nur in einem
22
2 Die Beziehung zwischen dem Wellen- und dem Teilchenbild
Abschnitt endlicher Länge existiert, dann ist es dieser Abschnitt, in dem wir das Teilchen mit einer Unbestimmtheit Δx finden könnten. Nun ist diese Eigenschaft der Wellen, nämlich dass die Länge des Wellenzuges multipliziert mit der Unbestimmtheit der dazugehörigen Wellenzahl mindestens 2π ist, eine Eigenschaft, die jedem bekannt ist, der sich mit Wellen befasst. Sie hat nichts mit der Quantenmechanik zu tun. Sie bedeutet einfach, dass wir in einem endlichen Wellenzug die Wellen nicht genau zählen können. Wir wollen versuchen, auf einem anderen Wege den Grund dafür zu erkennen. Angenommen, wir betrachten einen endlichen Wellenzug der Länge L, dann ist wegen der Art und Weise, wie er an den Enden abnehmen muss (siehe Abbildung 2.1), die Zahl der Wellen auf der Länge L nur bis auf etwa ±1 bekannt. Die Zahl der Wellen in L ist jedoch kL/2π. Also ist k unbestimmt und wir erhalten wieder das Ergebnis (2.7), das einfach eine Eigenschaft von Wellen ist. Sie gilt unabhängig davon, ob es sich um räumliche Wellen handelt und k die Zahl der Wellen pro Meter und L die Länge des Wellenzuges ist, oder ob die Wellen sich in der Zeit ausbreiten und ω die Zahl der Schwingungen pro Sekunde und T die „Länge“ der Zeit ist, in der der Wellenzug ankommt. Das heißt, wenn wir einen Wellenzug betrachten, der nur eine endliche Zeit T dauert, dann ist die Unbestimmtheit der Frequenz gegeben durch Δω = 2π/T .
(2.8)
Wir haben versucht klarzustellen, dass dies einfach typische Eigenschaften von Wellen sind, die zum Beispiel in der Akustik gut bekannt sind. Der wesentliche Punkt ist, dass wir in der Quantenmechanik die Wellenzahl als Maß für den Impuls eines Teilchens interpretieren, nach der Regel p = k, sodass (2.7) gleichbedeutend ist mit Δp ≈ h/Δx. Dies bedeutet also eine Einschränkung des klassischen Konzepts des Impulses. (Natürlich muss dieses Konzept in mancher Hinsicht eingeschränkt werden, wenn wir Teilchen durch Wellen darstellen!) Es ist schön, dass wir eine Regel gefunden haben, die uns einen Eindruck vermittelt, wann die klassischen Konzepte versagen.
2.3
Beugung an Kristallen
Als Nächstes wollen wir die Reflexion von Teilchenwellen an einem Kristallgitter betrachten. Ein Kristall ist ein Stück Materie, in dem sich eine große Anzahl gleicher Atome – einige Komplikationen werden wir später berücksichtigen – in einer regelmäßigen Anordnung befindet. Die Frage ist, wie wir die Anordnung ausrichten, um für einen gegebenen Strahl von Licht, Röntgenstrahlen, Elektronen, Neutronen oder etwas anderem ein stark reflektiertes Maximum in einer gegebenen Richtung zu erhalten. Um eine starke Reflexion zu bekommen, muss die Streuung von allen Atomen in Phase sein. Es darf nicht eine gleiche Anzahl in Phase und außer Phase geben, sonst würden sich die Wellen gegenseitig auslöschen. Der Weg, die richtige Ausrichtung zu bestimmen, besteht darin, die Gebiete konstanter Phase zu finden, wie wir bereits erklärt haben; sie sind Ebenen, die gleiche Winkel mit der Einfalls- und Ausfallsrichtung bilden (siehe Abbildung 2.4). Wenn wir, wie in Abbildung 2.4, zwei parallele Ebenen betrachten, dann sind die Wellen, die von den beiden Ebenen gestreut werden, in Phase, wenn der Unterschied der von den Wellenfronten zurückgelegten Entfernungen ein ganzzahliges Vielfaches der Wellenlänge ist. Man
2.3 Beugung an Kristallen
θ
d θθ
23
d sin θ d sin θ
Abb. 2.4: Streuung von Wellen an Kristallebenen.
sieht, dass die Differenz 2d sin θ beträgt, wobei d der senkrechte Abstand zwischen den Ebenen ist. Folglich ist die Bedingung für kohärente Reflexion 2d sin θ = nλ
(n = 1, 2, . . .) .
(2.9)
Wenn der Kristall zum Beispiel so aufgebaut ist, dass die Atome in Ebenen liegen, die der Bedingung (2.9) mit n = 1 genügen, dann tritt eine starke Reflexion auf. Wenn dagegen Atome derselben Art (mit gleicher Dichte) auf halbem Weg dazwischen liegen, dann wird auch die dazwischen liegende Ebene ebenso stark reflektieren, mit den anderen interferieren und keinen Effekt liefern. So muss sich also d in (2.9) auf nebeneinander liegende Ebenen beziehen; wir dürfen keine Ebenen betrachten, die beispielsweise fünf Lagen entfernt voneinander liegen, und diese Formel anwenden! Nun bestehen reale Kristalle gewöhnlich nicht einfach aus einer einzigen Sorte von Atomen, die sich in regelmäßiger Folge wiederholen. Stattdessen sind sie, wenn wir ein zweidimensionales Bild gebrauchen wollen, viel eher wie eine Tapete, auf der eine Figur ist, die sich über die gesamte Tapete wiederholt. Mit „Figur“ meinen wir im Falle der Atome eine Anordnung – Kalzium und ein Kohlenstoff und drei Sauerstoff usw. für Kalziumkarbonat –, welche eine verhältnismäßig große Anzahl von Atomen umfassen kann. Aber was es auch immer sei, die Figur wiederholt sich in einem Muster. Diese Grundfigur wird Einheitszelle genannt. Das Grundmuster der Wiederholung bestimmt den so genannten Gittertyp; der Gittertyp kann bestimmt werden, indem man die Reflexionen auf ihre Symmetrie hin untersucht. Um jedoch herauszufinden, was sich in jedem der Elemente des Gitters befindet, muss man die Intensität der Streuung in den verschiedenen Richtungen berücksichtigen. Welche Richtungen streuen, hängt vom Gittertyp ab, aber wie stark jede streut, ist durch den Inhalt der Einheitszelle festgelegt, und auf diese Weise wird die Kristallstruktur bestimmt. In den Abbildungen 2.5 und 2.6 sind zwei Aufnahmen von Röntgenbeugungsbildern wiedergegeben; sie veranschaulichen die Streuung an Natriumchlorid bzw. Myoglobin. Übrigens, es geschieht etwas Interessantes, wenn die Abstände der benachbarten Ebenen kleiner als λ/2 sind. In diesem Fall hat (2.9) für n keine Lösung. Wenn daher λ größer ist als der doppelte Abstand benachbarter Ebenen, dann gibt es kein seitliches Beugungsbild und das Licht – oder was auch immer – geht gerade durch das Material hindurch, ohne reflektiert zu werden oder verloren zu gehen. Im Falle von Licht also, wo λ viel größer als der Abstand ist, geht es einfach hindurch und es gibt kein Reflexionsbild von den Kristallebenen.
24
2 Die Beziehung zwischen dem Wellen- und dem Teilchenbild
Abb. 2.5: Röntgenbeugungsbild eines Natriumchlorid-Kristalls.
Abb. 2.6: Röntgenbeugungsbild von Myoglobin.
kurzwellige Neutronen Reaktor
langwellige Neutronen
Graphit kurzwellige Neutronen
Abb. 2.7: Diffusion von Reaktorneutronen.
Intensität
Diese Tatsache hat für Kernreaktoren, die Neutronen (dies sind offenbar Teilchen) erzeugen, eine interessante Konsequenz. Wenn wir diese Neutronen in einen langen Graphitblock hineinschicken, dann diffundieren sie hindurch und bahnen sich ihren Weg (siehe Abbildung 2.7). Sie diffundieren, weil sie an den Atomen abprallen, aber gemäß der Wellentheorie prallen sie streng genommen deswegen von den Atomen ab, weil sie von den Kristallebenen gebeugt werden. Wenn wir ein sehr langes Stück Graphit verwenden, stellt sich heraus, dass die Neutronen, die am äußersten Ende herauskommen, alle eine große Wellenlänge haben. In der Tat, wenn man die Intensität als Funktion der Wellenlänge aufträgt, dann erhält man gar nichts, außer für Wellenlängen, die größer als ein bestimmtes Minimum sind (siehe Abbildung 2.8). Mit anderen Worten, wir können auf diese Weise sehr langsame Neutronen erhalten. Nur die langsamsten Neutronen kommen hindurch; sie werden von den Kristallebenen des Graphits weder gebeugt noch gestreut, sondern sie gehen glatt hindurch wie Licht durch Glas und werden nicht seitwärts gestreut. Es gibt noch viele andere Beweise für die Existenz der Neutronenwellen und die Wellen anderer Teilchen.
λmin
λ
Abb. 2.8: Intensität von Neutronen aus einem Graphitstab als Funktion der Wellenlänge.
2.4 Die Größe eines Atoms
2.4
25
Die Größe eines Atoms
Wir betrachten jetzt eine weitere Anwendung der Unbestimmtheitsrelation (2.3). Die Darlegung sollte nicht zu ernst genommen werden; der Grundgedanke ist zwar richtig, aber die Analyse ist nicht sehr exakt. Es geht um die Größenbestimmung der Atome und um die Tatsache, dass nach klassischer Anschauung die Elektronen Strahlung aussenden und spiralförmig nach innen kreisen würden, bis sie sich schließlich auf dem Kern niederlassen. Aber das kann quantenmechanisch nicht richtig sein, weil wir dann genau wüssten, wo sich jedes Elektron befindet und wie schnell es sich bewegt. Wir betrachten ein Wasserstoffatom und messen den Ort des Elektrons. Wir dürfen nicht in der Lage sein, den Ort des Elektrons genau zu bestimmen, weil sich sonst die Impulsverbreiterung als unendlich ergeben würde. Jedes Mal, wenn wir nach dem Elektron schauen, ist es irgendwo, aber es hat eine Amplitude, an den verschiedenen Orten zu sein, sodass es eine Wahrscheinlichkeit gibt, es an verschiedenen Orten zu finden. Diese Orte können nicht alle beim Kern sein; wir werden annehmen, dass es eine Streuung des Abstands vom Kern in der Größenordnung a gibt. Das heißt, der Abstand des Elektrons vom Kern ist gewöhnlich etwa a. Wir werden a dadurch bestimmen, dass wir die Gesamtenergie des Atoms minimieren. Die Verbreiterung des Impulses ist wegen der Unbestimmtheitsrelation grob /a.2 Beim Versuch, den Impuls des Elektrons irgendwie zu messen, etwa anhand der Streuung von Röntgenstrahlen, wobei man den Doppler-Effekt von einem bewegten Streuzentrum beobachtet, erwarten wir daher nicht, jedes Mal null zu erhalten – das Elektron steht nicht still –, sondern sein Impuls muss von der Größenordnung p ≈ /a sein. Dann ist die kinetische Energie grob 1 2 2 2 2 2 mv = p /2m = /2ma . (Dies ist in gewissem Sinne eine Art Dimensionsanalyse, um herauszufinden, wie die kinetische Energie von der planckschen Konstante, von m und von der Größe des Atoms abhängt. Wir brauchen unserem Ergebnis nur bis auf Faktoren wie 2, π usw. zu vertrauen. Wir haben nicht einmal a sehr genau definiert.) Nun ist die potentielle Energie −e2 dividiert durch die Entfernung vom Mittelpunkt, sagen wir −e2 /a, wobei, wie in Band II definiert, e2 das Quadrat der Ladung eines Elektrons dividiert durch 4π�0 ist. Der springende Punkt ist nun, dass die potentielle Energie abnimmt, wenn a kleiner wird, aber je kleiner a ist, umso größer ist der vom Unbestimmtheitsprinzip geforderte Impuls, und darum wird auch die kinetische Energie größer. Die Gesamtenergie ist E = 2 /2ma2 − e2 /a .
(2.10)
dE/da = −2 /ma3 + e2 /a2 ,
(2.11)
Wir wissen nicht, wie groß a ist, aber wir wissen, dass sich das Atom auf eine Art Kompromiss einstellen wird, sodass die Energie so klein wie möglich wird. Um das Minimum von E zu bilden, differenzieren wir (2.10) nach a, setzen die Ableitung gleich null und lösen nach a auf. Die Ableitung von E ist
und wenn man dE/da = 0 setzt, ergibt sich für a der Wert a0 = 2 /me2 = 0,528 Å = 0,528 × 10−10 m. 2
(2.12)
Wir verwenden die Unbestimmtheitsrelation Δp Δx ≈ statt Δp Δx ≈ h, weil sie in dieser speziellen Anwendung präziser ist.
26
2 Die Beziehung zwischen dem Wellen- und dem Teilchenbild
Dieser spezielle Abstand wird der bohrsche Radius genannt, und wir haben damit gelernt, dass die atomaren Abmessungen in der Größenordnung von Ångström liegen, was richtig ist. Das ist wahrlich recht gut; es ist verblüffend, denn bis jetzt hatten wir keine Basis für das Verständnis von Atomgrößen! Vom klassischen Standpunkt aus kann es keine Atome geben, weil die Elektronen in den Kern fallen würden. Wenn wir nun, um die Energie auszurechnen, den Wert (2.12) für a0 in (2.10) einsetzen, ergibt sich E0 = −e2 /2a0 = −me4 /22 = −13,6 eV .
(2.13)
Was bedeutet eine negative Energie? Es bedeutet, dass das Elektron im Atom weniger Energie hat, als wenn es frei wäre. Es bedeutet, dass es gebunden ist. Es bedeutet, dass man Energie braucht, um das Elektron herauszuschlagen; man braucht Energie in der Größenordnung von 13,6 eV, um ein Wasserstoffatom zu ionisieren. Es besteht eigentlich kein Grund zu der Annahme, dass der Wert nicht auch doppelt, dreimal oder (1/π)-mal so groß sein kann, weil wir so schlampig argumentiert haben. Wir haben jedoch gemogelt. Wir haben sämtliche Konstanten so gewählt, dass gerade der richtige Wert herauskommt! Dieser Wert, 13,6 Elektronenvolt, wird 1 Rydberg genannt; er ist die Ionisierungsenergie des Wasserstoffs. Jetzt verstehen wir, warum wir nicht durch den Fußboden fallen. Wenn wir gehen, stoßen unsere Schuhe mit ihren Unmengen von Atomen gegen den Fußboden, der ebenfalls aus Unmengen von Atomen besteht. Um die Atome enger zusammenzuquetschen, müssten die Elektronen auf einen engeren Raum zusammengedrängt werden, und infolge des Unbestimmtheitsprinzips würden ihre Impulse im Durchschnitt anwachsen, und das bedeutet große Energie; der Widerstand gegen atomare Kompression ist also ein quantenmechanischer und kein klassischer Effekt. Wenn die Elektronen und Protonen enger zusammengebracht werden, erwarten wir vom klassischen Standpunkt aus, dass sich die Energie verringert. In der klassischen Physik wäre die beste Anordnung von positiven und negativen Ladungen, wenn alle aufeinander säßen. Das war in der klassischen Physik gut bekannt und deswegen die Existenz der Atome ein Rätsel. Natürlich erfanden die frühen Wissenschaftler einige Auswege, nun gut, jetzt kennen wir den richtigen Ausweg! Auch wenn wir es im Moment noch nicht wirklich verstehen, zeigt sich hier doch nebenbei, dass in einer Situation, an der viele Elektronen beteiligt sind, diese versuchen, sich voneinander fernzuhalten. Wenn ein Elektron einen bestimmten Raum besetzt, dann besetzt kein anderes Elektron denselben Raum. Genauer gesagt, gibt es zwei Spin-Möglichkeiten, sodass zwei Elektronen aufeinandersitzen können, wobei sich eins in der einen und eins in der anderen Richtung dreht. Aber noch mehr Elektronen können wir dort nicht unterbringen. Weitere Elektronen müssen auf andere Plätze, und das ist der eigentliche Grund dafür, dass die Materie Festigkeit besitzt. Wenn wir alle Elektronen auf dieselbe Stelle bringen könnten, würde sie noch stärker kondensieren, als sie es ohnehin schon tut. Die Tatsache, dass die Elektronen sich nicht alle aufeinandersetzen können, ist der Grund, warum Tische und alle anderen Objekte fest sind. Offensichtlich müssen wir zum Verständnis der Eigenschaften der Materie die Quantenmechanik heranziehen und dürfen uns nicht mit der klassischen Mechanik zufrieden geben.
2.5 Energieniveaus
2.5
27
Energieniveaus
Energie
Wir haben über das Atom in seinem niedrigsten Energiezustand gesprochen, aber es stellt sich heraus, dass das Elektron andere Dinge tun kann. Es kann sich auf energiereichere Art regen und bewegen, und so gibt es viele verschiedene Bewegungsmöglichkeiten für das Atom. Gemäß der Quantenmechanik kann es in stationären Zuständen nur bestimmte Energien für ein Atom geben. Wir zeichnen ein Diagramm (Abbildung 2.9), in dem wir die Energie vertikal auftragen und jeden erlaubten Energiewert als horizontale Linie eintragen. Wenn das Elektron frei ist, d. h. wenn seine Energie positiv ist, kann es jede beliebige Energie besitzen; es kann sich mit jeder beliebigen Geschwindigkeit bewegen. Aber Bindungsenergien sind nicht beliebig. Das Atom muss den einen oder den anderen Energiewert aus einer Reihe von erlaubten Werten, wie jene in Abbildung 2.9, annehmen.
E=0
E3 E2 E1 E0
Abb. 2.9: Energiediagramm für ein Atom, das einige mögliche Übergänge zeigt.
Nun wollen wir die erlaubten Energiewerte mit E0 , E1 , E2 , E3 , . . . bezeichnen. Wenn ein Atom anfangs in einem der „angeregten Zustände“ E1 , E2 usw. ist, bleibt es nicht für immer in diesem Zustand. Früher oder später fällt es in einen niedrigeren Zustand und strahlt dabei Energie in Form von Licht ab. Die Frequenz des ausgesendeten Lichtes wird bestimmt durch die Erhaltung der Energie plus der quantenmechanischen Forderung, dass die Frequenz des Lichtes mit der Energie des Lichtes durch (2.1) verknüpft ist. Daher ist die Frequenz des Lichtes, welches (zum Beispiel) bei einem Übergang von der Energie E3 zur Energie E1 frei wird, ω31 = (E3 − E1 )/ .
(2.14)
Dies ist dann eine charakteristische Frequenz des Atoms und legt eine Emissionsspektrallinie fest. Ein anderer möglicher Übergang wäre der von E3 nach E0 . Dieser hätte eine andere Frequenz: ω30 = (E3 − E0 )/ .
(2.15)
ω10 = (E1 − E0 )/ .
(2.16)
Eine weitere Möglichkeit besteht darin, dass ein Atom im angeregten Zustand E1 in den Grundzustand E0 zurückfallen könnte. Dabei emittiert es ein Photon der Frequenz
Wir betrachten hier diese drei Übergänge, um auf eine interessante Beziehung hinzuweisen. Aus (2.14), (2.15) und (2.16) erkennt man leicht, dass ω30 = ω31 + ω10 .
(2.17)
Wenn wir zwei Spektrallinien gefunden haben, müssen wir im Allgemeinen erwarten, eine weitere Linie bei der Summe der Frequenzen (oder bei der Differenz der Frequenzen) zu finden,
28
2 Die Beziehung zwischen dem Wellen- und dem Teilchenbild
und dass alle Linien durch das Auffinden einer Serie von Niveaus verstanden werden können, sodass jede Linie der Energiedifferenz eines Niveaupaares entspricht. Diese bemerkenswerte Beziehung zwischen den Spektralfrequenzen war schon vor der Entdeckung der Quantenmechanik bekannt und wird das ritzsche Kombinationsprinzip genannt. Vom Standpunkt der klassischen Mechanik ist das wiederum ein Rätsel. Wir wollen nicht weiter darauf herumreiten, dass die klassische Mechanik im atomaren Bereich versagt; diesen Aspekt haben wir inzwischen ausreichend belegt. Wir haben schon darüber gesprochen, dass wir in der Quantenmechanik Amplituden betrachten, die sich wie Wellen mit bestimmten Frequenzen und Wellenzahlen verhalten. Wir wollen jetzt einmal vom Standpunkt der Amplituden aus untersuchen, wie es dazu kommt, dass das Atom diskrete Energiezustände hat. Dies ist etwas, was wir aus dem bisher Gesagten noch nicht verstehen können, aber wir sind alle mit der Tatsache vertraut, dass eingeschlossene Wellen nur diskrete Frequenzen haben. Wenn zum Beispiel der Schall in einer Orgelpfeife oder in einem anderen Hohlraum gefangen ist, dann gibt es mehr als eine Mode, in der der Schall schwingen kann, aber jede Mode hat es eine bestimmte Frequenz. Folglich hat ein Objekt, in dem Wellen eingeschlossen sind, bestimmte Resonanzfrequenzen. Daher haben Wellen in einem begrenzten Raum – eine Situation, die wir später ausführlich mit Formeln behandeln werden – die Eigenschaft, nur mit bestimmten Frequenzen zu existieren. Und da ja die allgemeine Beziehung zwischen den Frequenzen der Amplituden und der Energie besteht, sind wir nicht überrascht, nur diskrete Energien für in Atomen gebundene Elektronen zu finden.
2.6
Philosophische Konsequenzen
Wir wollen kurz einige philosophische Folgerungen aus der Quantenmechanik betrachten. Wie immer hat ein solches Problem zwei Seiten: Die eine ist die philosophische Bedeutung für die Physik, und die andere ist die Extrapolation philosophischer Konzepte in andere Gebiete. Wenn mit der Wissenschaft verbundene philosophische Ideen in ein anderes Gebiet übertragen werden, werden sie gewöhnlich total entstellt. Deshalb werden wir unsere Bemerkungen so weit wie möglich auf die Physik selbst beschränken. Der interessanteste Aspekt ist zunächst das Unbestimmtheitsprinzip: die Tatsache, dass eine Beobachtung das Phänomen beeinflusst. Man hat schon immer gewusst, dass Beobachtungen ein Phänomen beeinflussen, aber das Wesentliche ist, dass dieser Effekt nicht eliminiert oder nach Belieben verringert werden kann, indem man den Apparat umbaut. Wenn wir ein bestimmtes Phänomen beobachten, kommen wir nicht umhin, es ein wenig zu stören, und diese Störung ist systemimmanent. Auch vor der Entwicklung der Quantenphysik war der Beobachter mitunter von Bedeutung, aber nur in einem trivialen Sinne. Folgende Frage wurde gestellt: Wenn ein Baum im Wald umfällt, und niemand ist dabei, der es hört, macht er dann Lärm? Ein wirklicher Baum, der in einem wirklichen Wald fällt, macht natürlich Lärm, auch wenn niemand dabei ist. Auch wenn kein Zuhörer anwesend ist, werden doch andere Spuren hinterlassen. Der Schall wird einige Blätter bewegen, und wenn wir mit genügender Sorgfalt suchen, könnten wir irgendwo entdecken, dass ein Dorn gegen ein Blatt gerieben hat und einen winzigen Kratzer hinterlassen hat, der nur durch eine Vibration des Blattes erklärt werden kann. So müssen wir in gewissem Sinne schlussfolgern, dass Lärm erzeugt wurde. Wir könnten fragen: Gab es eine Empfindung des
2.6 Philosophische Konsequenzen
29
Lärms? Nein, Empfindungen sind vermutlich an das Bewusstsein gebunden. Und ob Ameisen ein Bewusstsein haben und ob überhaupt Ameisen in dem Wald waren oder ob der Baum ein Bewusstsein hat, wissen wir nicht. Lassen wir das Problem auf sich beruhen. Etwas anderes, was man vielfach seit der Entwicklung der Quantenmechanik betont, ist die Auffassung, dass wir nicht über Dinge reden sollten, die wir nicht messen können. (Auch die Relativitätstheorie sagt das.) Wenn ein Phänomen nicht durch Messung erfasst werden kann, ist dafür kein Platz in einer Theorie. Und da wir aus Messungen keinen genauen Wert für den Impuls eines lokalisierten Teilchens erhalten können, habe er keinen Platz in der Theorie. Die Vorstellung, dass es dies ist, wo es mit der klassischen Theorie hapert, ist ein falscher Standpunkt. Es ist eine nachlässige Analyse der Situation. Dass wir Ort und Impuls nicht gleichzeitig genau messen können, bedeutet a priori nicht, dass wir nicht darüber sprechen können. Es bedeutet nur, dass wir nicht darüber sprechen müssen. Die Situation in den Wissenschaften ist folgende: Ein Konzept oder eine Größe, die nicht gemessen oder direkt mit einem Experiment belegt werden kann, kann nützlich sein oder nicht. Sie braucht nicht in einer Theorie zu existieren. Mit anderen Worten: Wir vergleichen die klassische Theorie von der Welt mit der Quantentheorie, und nehmen wir weiter an, dass sich experimentell ergibt, dass wir Ort und Impuls gleichzeitig nur ungenau messen können. Die Frage ist, ob die Konzepte von dem exakten Ort eines Teilchens und dem exakten Impuls eines Teilchens stichhaltig sind oder nicht. Die klassische Theorie stimmt dem zu, die Quantentheorie nicht. Das bedeutet an sich nicht, dass die klassische Physik falsch ist. Als die neue Quantenmechanik entwickelt wurde, sagten die klassischen Physiker – und das waren alle außer Heisenberg, Schrödinger und Born: „Schaut mal, eure Theorie taugt nichts, weil ihr bestimmte Fragen nicht beantworten könnt, wie zum Beispiel: Welches ist der genaue Ort eines Teilchens? Durch welchen Spalt geht es hindurch?“ Heisenbergs Antwort war: „Ich brauche solche Fragen nicht zu beantworten, weil man solche Fragen experimentell nicht stellen kann.“ Das heißt, wir müssen sie nicht stellen. Man betrachte zwei Theorien A und B; A enthält ein Konzept, das nicht direkt geprüft werden kann, das aber in der Analyse benutzt wird, und B enthält dieses Konzept nicht. Wenn die Theorien in ihren Vorhersagen nicht übereinstimmen, dann kann man nicht behaupten, dass B falsch sei, weil sie das Konzept nicht erklären kann, das in A enthalten ist, weil dieses Konzept zu den Dingen gehört, die nicht direkt geprüft werden können. Es ist immer gut zu wissen, welche Konzepte nicht direkt geprüft werden können, aber es ist nicht nötig, sie alle auszumerzen. Es stimmt nicht, dass wir der Wissenschaft vollständig nachgehen können, indem wir nur jene Konzepte benutzen, die direkt einem Experiment unterworfen werden können. Auch in der Quantenmechanik gibt es eine Wahrscheinlichkeitsamplitude, ein Potential und viele Konstrukte, die wir nicht direkt messen können. Die Grundlage einer Wissenschaft ist die Fähigkeit, etwas vorherzusagen. Vorhersagen bedeutet, dass man sagen kann, was in einem Experiment, das noch nie durchgeführt wurde, geschehen wird. Wie können wir das? Indem wir unabhängig vom Experiment annehmen, dass wir wissen, was vor sich geht. Wir müssen die Experimente in ein Gebiet hinein extrapolieren, wo sie noch nicht ausgeführt wurden. Wir müssen unsere Vorstellungen auf Bereiche ausdehnen, wo sie noch nicht geprüft worden sind. Wenn wir das nicht tun, erhalten wir keine Vorhersage. So war es ganz verständlich, dass der klassische Physiker fröhlich weitermachte und annahm, dass der Ort – der offenbar für einen Baseball etwas bedeutet – auch für ein Elektron etwas bedeutet. Das war keine Dummheit. Es war ein vernünftiger Vorgang. Heute behaupten wir, dass das Gesetz der Relativität für alle Energien gilt, aber vielleicht kommt eines Tages jemand und stellt fest, wie dumm wir doch waren. Wir wissen nicht, wo wir „dumm“ sind, bis wir „etwas riskieren“, und daher ist es wich-
30
2 Die Beziehung zwischen dem Wellen- und dem Teilchenbild
tig, etwas zu riskieren. Und die einzige Möglichkeit zu ergründen, dass wir eventuell unrecht haben, besteht darin herauszufinden, was unsere Vorhersagen sind. Es ist absolut notwendig, Gedankengebäude zu errichten. Wir haben schon einige Bemerkungen über den Nichtdeterminismus der Quantenmechanik gemacht. Das bedeutet, dass wir in atomaren Dimensionen nicht vorhersagen können, was in einer gegebenen physikalischen Situation, sei sie auch noch so sorgfältig vorbereitet, geschehen wird. Wenn wir ein Atom betrachten, das in einem angeregten Zustand ist und daher ein Photon emittieren kann, können wir nicht sagen, wann es das Photon emittieren wird. Es hat zu jeder Zeit eine gewisse Amplitude, das Photon zu emittieren, und wir können zwar eine Wahrscheinlichkeit für die Emission vorhersagen, doch wir können die Zukunft nicht exakt vorhersagen. Das hat zu allerlei unsinnigen Folgerungen geführt und irritierende Fragen aufgeworfen, etwa die Frage nach der Bedeutung der Willensfreiheit oder danach, ob die Welt nichdeterministisch ist. Natürlich müssen wir erkennen, dass auch die klassische Physik in gewissem Sinne nichtdeterministisch ist. Es wird allgemein angenommen, dass dieser Nichtdeterminismus, der verhindert, dass wir die Zukunft exakt vorhersagen können, eine spezifisch quantenmechanische Angelegenheit sei. Dies wurde gesagt, um die Rolle des Verstandes, die Überzeugung von der Freiheit des Willens usw. zu erklären. Aber wenn die Welt klassisch wäre – wenn die Gesetze der Mechanik klassisch wären –, dann ist es nicht ohne weiteres klar, dass der Geist nicht mehr oder weniger dasselbe empfinden sollte. Klassisch ist es richtig, dass wir bei Kenntnis von Ort und Geschwindigkeit eines jeden Teilchens in der Welt oder in einem Gefäß mit Gas genau vorhersagen könnten, was passieren wird. Darum ist die klassische Welt deterministisch. Nehmen wir jedoch an, dass wir nur eine endliche Genauigkeit erreichen können und nicht genau wissen, wo ein Atom gerade ist, sagen wir auf ein Milliardstel genau. Nun wird das Atom auf seinem Weg mit einem anderen Atom zusammenstoßen, und da wir seinen Ort nur auf ein Milliardstel genau kennen, werden wir nach dem Zusammenstoß einen noch größeren Fehler im Ort erhalten. Dieser wird natürlich beim nächsten Zusammenstoß noch einmal vergrößert, sodass sich selbst der kleinste anfängliche Fehler schnell zu einer sehr großen Ungewissheit ausweitet. Um ein Beispiel zu geben: Wenn Wasser über einen Damm fließt, dann spritzt es. Wenn wir nah dabei stehen, dann wird ab und an ein Tropfen auf unserer Nase landen. Das scheint vollständig planlos zu sein, doch wäre ein solches Verhalten nach rein klassischen Gesetzen vorherbestimmt. Die exakte Position all der Tropfen hängt ab vom genauen Wellengang des Wassers, bevor es über den Damm fließt. Aber wie? Die kleinsten Unregelmäßigkeiten werden beim Fließen über den Damm vergrößert, sodass wir vollständige Zufälligkeit erhalten. Offenbar können wir die Position eines Tropfens nicht exakt vorhersagen, ohne die Bewegung des Wassers absolut exakt zu kennen. Genauer gesagt, wenn eine beliebige Genauigkeit vorgegeben ist, ganz gleich wie groß sie auch sei, dann kann man eine Zeit angeben, nach der unsere Vorhersagen keine Gültigkeit mehr haben. Hierbei ist nun wesentlich, dass diese Zeitspanne nicht zu groß ist. Es ist nicht so, dass die Zeit bei einer Genauigkeit von eins zu einer Milliarde mehrere Millionen von Jahren beträgt. Die Zeit hängt logarithmisch von der Ungenauigkeit ab und es ergibt sich, dass wir schon innerhalb einer sehr kurzen Zeitspanne all unsere Informationen verlieren. Wenn wir die Genauigkeit mit eins zu Milliarden und Milliarden und Milliarden – ganz gleich, wie viele Milliarden wir wollen, wenn wir nur irgendwo aufhören – annehmen, dann können wir immer eine Zeit finden, die kleiner ist als die Zeit, die wir brauchten, um die Genauigkeit festzulegen – nach der wir nicht mehr vorhersagen können, was geschehen wird! Es ist daher nicht fair zu behaupten, dass
2.6 Philosophische Konsequenzen
31
wir wegen der offenbaren Freiheit und Nichtdeterminiertheit des menschlichen Geistes hätten erkennen müssen, dass die klassische „deterministische“ Physik niemals hoffen konnte, diesen Geist zu verstehen und die Quantenmechanik als Erlösung von einem „vollständig mechanistischen“ Universum zu begrüßen. Denn diesen Nichtdeterminismus gibt es vom praktischen Standpunkt aus gesehen schon in der klassischen Mechanik.
3
Wahrscheinlichkeitsamplituden
3.1
Die Gesetze zur Kombination von Amplituden
Als Schrödinger die korrekten Gesetze der Quantenmechanik entdeckte, schrieb er eine Gleichung auf, die die Amplitude, ein Teilchen an verschiedenen Orten aufzufinden, beschrieb. Diese Gleichung war den Gleichungen, die auch schon den klassischen Physikern bekannt waren, sehr ähnlich – das waren Gleichungen, die sie für die Beschreibung der Luftbewegung in einer Schallwelle, der Fortpflanzung des Lichtes und ähnlicher Phänomene benutzten. Deshalb wurde am Anfang der Quantenmechanik die meiste Zeit auf die Lösung dieser Gleichung verwendet. Aber zur gleichen Zeit entwickelten insbesondere Born und Dirac ein Verständnis der grundlegend neuen physikalischen Ideen, die hinter der Quantenmechanik stecken. Als sich die Quantenmechanik weiterentwickelte, stellte sich heraus, dass es Vieles gab, das nicht direkt in der Schrödinger-Gleichung enthalten war – wie der Spin des Elektrons und verschiedene relativistische Phänomene. Traditionell begannen alle Kurse zur Quantenmechanik auf dieselbe Art, indem man den Weg der historischen Entwicklung dieses Fachgebiets nachzeichnete. Man lernt zuerst eine Menge über klassische Mechanik, sodass man versteht, wie die SchrödingerGleichung zu lösen ist. Dann verbringt man eine lange Zeit mit der Ausarbeitung verschiedener Lösungen. Erst nach einem sorgfältigen Studium dieser Gleichung kommt man zu dem „fortgeschrittenen“ Thema des Elektronenspins. Wir hielten es ursprünglich ebenfalls für den richtigen Weg, diese Physikvorlesungen abzuschließen, indem wir zeigen, wie die Gleichungen der klassischen Physik in komplizierten Situationen gelöst werden – etwa bei der Beschreibung der Schallwellen in abgeschlossenen Räumen, Schwingungsmoden der elektromagnetischen Strahlung in zylindrischen Hohlräumen usw. Das war der ursprüngliche Plan für diesen Kursus. Wir haben dann jedoch beschlossen, diesen Plan aufzugeben und stattdessen eine Einführung in die Quantenmechanik zu geben. Wir sind zu der Überzeugung gelangt, dass die so genannten „fortgeschrittenen“ Themen der Quantenmechanik eigentlich ganz einfach sind. Die Mathematik, die darin steckt, ist besonders einfach, sie enthält nur einfache algebraische Operationen und keine Differentialgleichungen oder allenfalls sehr einfache. Das einzige Problem besteht darin, dass wir die Hürde überspringen müssen, das Verhalten von Teilchen im Raum nicht mehr detailliert beschreiben zu können. Daher werden wir Folgendes versuchen: Wir werden darüber berichten, was man gewöhnlich die „fortgeschrittenen“ Themen der Quantenmechanik nennt. Aber wir versichern Ihnen, dass sie auf jeden Fall elementare Themen – in einem doppelten Sinne des Wortes – sind, und sie sind auch die grundlegenden Themen. Dies ist ein pädagogisches Experiment; es wurde, soweit wir wissen, nie zuvor unternommen. Bei diesem Unterfangen stoßen wir natürlich auf das Problem, dass das quantenmechanische Verhalten der Objekte recht eigentümlich ist. Niemand hat eine Alltagserfahrung, auf die er sich stützen kann, um ein grobes Gefühl für das, was geschehen wird, zu bekommen. Daher gibt es zwei Möglichkeiten, diesen Stoff darzubieten: Entweder könnten wir auf ziemlich ungenaue
34
3 Wahrscheinlichkeitsamplituden
physikalische Art beschreiben, was geschehen kann, ohne die genauen Gesetze anzugeben; oder wir könnten die genauen Gesetze in ihrer abstrakten Form angeben. Aber wegen der Abstraktion würden Sie dann nicht wissen, was diese Gesetze physikalisch aussagen. Die zweite Methode ist unbefriedigend, weil sie vollkommen abstrakt ist, und die erste hinterlässt ein Gefühl des Unbehagens, weil man nicht genau weiß, was richtig und was falsch ist. Uns ist nicht klar, wie wir dieses Problem lösen können. Sie werden sicher bemerkt haben, dass die Kapitel 1 und 2 dieses Problem aufzeigen. Das erste Kapitel war zwar vergleichsweise genau; aber das zweite Kapitel gab nur eine grobe Beschreibung der Eigenschaften der diversen Phänomene. Nun wollen wir versuchen, den goldenen Mittelweg zwischen den beiden Extremen zu finden. Wir wollen in diesem Kapitel damit beginnen, uns mit einigen allgemeinen quantenmechanischen Konzepten zu beschäftigen. Manche Feststellungen werden sehr genau sein, andere nur ungenau. Es wird schwierig sein, Ihnen jeweils zu sagen, was nun was ist, aber wenn Sie erst einmal das Buch durchgearbeitet haben, werden Sie im Nachhinein verstehen, welche Teile stichhaltig sind und welche Teile nur grobe Erklärungen enthalten. Die folgenden Kapitel werden relativ genau sein. Einer der Gründe, warum wir uns ernsthaft bemüht haben, in den nächsten Kapiteln genau zu sein, ist, dass wir Ihnen eine der schönsten Seiten der Quantenmechanik zeigen wollten – nämlich wie viel man aus so wenig herleiten kann. Wir fangen an, indem wir noch einmal die Überlagerung von Wahrscheinlichkeitsamplituden diskutieren. Als Beispiel beziehen wir uns auf das in Kapitel 1 beschriebene Experiment, das hier noch einmal in Abbildung 3.1 gezeigt ist. Wir betrachten eine Quelle s von Teilchen, in diesem Fall von Elektronen. Darauf folgt eine Wand mit zwei Spalten. Hinter der Wand befindet sich am Ort x der Detektor. Wir fragen nach der Wahrscheinlichkeit, dass man ein Teilchen bei x findet. Unser erstes Grundprinzip der Quantenmechanik besagt, dass die Wahrscheinlichkeit für die Ankunft eines Teilchens bei x, wenn es aus der Quelle s kommt, quantitativ durch das Absolutquadrat einer komplexen Zahl, die Wahrscheinlichkeitsamplitude heißt, dargestellt werden kann – in diesem Falle die „Amplitude, dass ein Teilchen aus s bei x ankommt“. Wir werden solche Amplituden so häufig angeben müssen, dass wir, um diese Idee auszudrücken, x
x P1
Detektor
1
s
2
Elektronenkanone
Wand
P12
x
P2
Auffangwand
(a) Abb. 3.1: lnterferenzexperiment mit Elektronen.
(b)
(c)
3.1 Die Gesetze zur Kombination von Amplituden
35
eine abkürzende Notation benutzen wollen, die von Dirac eingeführt wurde und heute in der Quantenmechanik allgemein üblich ist. Wir schreiben die Wahrscheinlichkeitsamplitude folgendermaßen: �Das Teilchen kommt bei x an|das Teilchen verlässt s� .
(3.1)
Mit anderen Worten, die Klammern � � stehen für: „die Amplitude, dass . . . “; der Ausdruck rechts von dem vertikalen Strich gibt immer die Anfangsbedingung an und der auf der linken Seite die Endbedingung. Manchmal wird es auch bequem sein, noch weiter abzukürzen und die Anfangs- und Endbedingung jeweils mit einem Buchstaben zu bezeichnen. Zum Beispiel können wir die Amplitude (3.1) als �x|s�
(3.2)
schreiben. Wir betonen, dass eine solche Amplitude nichts anderes als eine komplexe Zahl ist. Wir haben schon in der Diskussion von Kapitel 1 erkannt, dass bei zwei Möglichkeiten für das Teilchen, den Detektor zu erreichen, die resultierende Wahrscheinlichkeit nicht die Summe der beiden Wahrscheinlichkeiten ist, sondern als das Absolutquadrat der Summe von zwei Amplituden geschrieben werden muss. Es ergab sich, dass die Wahrscheinlichkeit für die Ankunft eines Elektrons am Detektor bei beiden geöffneten Spalten P12 = |φ1 + φ2 |2
(3.3)
ist. Wir wollen dieses Ergebnis nun in unserer neuen Notation ausdrücken. Zuerst aber wollen wir unser zweites Grundprinzip der Quantenmechanik aufstellen: Wenn ein Teilchen einen vorgegebenen Zustand auf zwei möglichen Wegen erreichen kann, dann ist die Gesamtamplitude für diesen Vorgang gleich der Summe der Amplituden für die beiden einzeln betrachteten Wege. In unserer neuen Notation drücken wir das so aus: � x | s �beide Spalte offen = � x | s �durch 1 + � x | s �durch 2 .
(3.4)
Außerdem nehmen wir an, dass die Spalte 1 und 2 so klein sind, dass wir sagen können, ein Elektron geht durch den Spalt, ohne dabei weiter diskutieren zu müssen, durch welchen Teil des Spalts. Wir könnten natürlich jeden Spalt in Felder aufteilen, wobei es für jedes Feld eine gewisse Amplitude gibt, dass das Elektron dort hindurch geht. Wir wollen annehmen, dass der Spalt so klein ist, dass wir uns um dieses Detail nicht zu kümmern brauchen. Darin steckt eine gewisse Ungenauigkeit; man kann die Beschreibung präzisieren, aber wir wollen das in diesem Stadium noch nicht tun. Nun wollen wir ausführlicher aufschreiben, was wir über die Amplitude für den Vorgang aussagen können, bei dem das Elektron den Detektor bei x auf dem Wege durch Spalt 1 erreicht. Dabei können wir unser drittes Grundprinzip heranziehen: Wenn ein Teilchen einen bestimmten Weg nimmt, kann die Amplitude für diesen Weg als das Produkt der Amplitude für den ersten Teil des Weges und der Amplitude für den Rest des Weges geschrieben werden. Für die Anordnung von Abbildung 3.1 ist die Amplitude für den Weg von s nach x durch Spalt 1 gleich der Amplitude für den Weg von s nach 1 multipliziert mit der Amplitude für den Weg von 1 nach x: � x | s �durch 1 = � x | 1 � � 1 | s � .
(3.5)
36
3 Wahrscheinlichkeitsamplituden
a s
x
1 b 2 c
Abb. 3.2: Ein komplizierteres Interferenzexperiment.
Dieses Ergebnis ist wiederum nicht ganz genau. Wir müssten eigentlich auch einen Faktor für die Amplitude, dass das Elektron durch Spalt 1 hindurchgeht, einsetzen; aber im vorliegenden Fall ist es ein einfacher Spalt, und wir werden diesen Faktor gleich eins setzen. Sie werden bemerkt haben, dass die Gleichung (3.5) in verkehrter Anordnung geschrieben zu sein scheint. Sie muss von rechts nach links gelesen werden: Das Elektron geht von s nach 1 und dann von 1 nach x. Wir fassen zusammen: Wenn Ereignisse in einer Folge auftreten – das heißt, wenn man einen Weg des Teilchens zerlegen kann, indem man sagt, es tut dies, dann das und dann das –, dann kann man die resultierende Amplitude für diesen Weg berechnen, indem man der Reihe nach die Amplituden für jedes der aufeinanderfolgenden Ereignisse multipliziert. Unter Anwendung dieses Gesetzes können wir Gleichung (3.4) umschreiben: � x | s �beide = � x | 1 � � 1 | s � + � x | 2 � � 2 | s � . Nun möchten wir zeigen, dass wir bei Anwendung dieser Prinzipien ein sehr viel schwierigeres Problem als das in Abbildung 3.2 gezeigte lösen können. Wir betrachten nun zwei Wände, eine mit zwei Spalten 1 und 2 und eine andere, die drei Spalte a, b und c hat. Hinter der zweiten Wand ist bei x ein Detektor, und wir fragen nach der Amplitude, dass dort ein Teilchen ankommt. Nun ja, ein Weg, dies herauszufinden, besteht in der Berechnung der Überlagerung oder Interferenz der durchgehenden Wellen. Man kann es aber auch so machen: Man sagt, es gibt sechs mögliche Wege und überlagert die Amplituden für diese verschiedenen Wege. Das Elektron kann durch Spalt 1, dann durch Spalt a und dann nach x gehen. Oder es kann durch Spalt 1 und dann durch Spalt b und dann nach x gehen usw. Unserem zweiten Prinzip zufolge addieren sich die Amplituden für die verschiedenen Wege. Daher müssen wir die Amplitude für den Weg von s nach x als Summe von sechs Einzelamplituden schreiben. Bei Anwendung des dritten Prinzips kann andererseits jede dieser einzelnen Amplituden als Produkt von jeweils drei Amplituden geschrieben werden. Eine von ihnen ist zum Beispiel die Amplitude für s nach 1 mal der Amplitude für 1 nach a mal der Amplitude für a nach x. In unserer Notation können wir die vollständige Amplitude für den Weg von s nach x folgendermaßen angeben: � x| s� = � x|a��a|1��1| s�+� x|b��b|1��1| s�+...+� x|c��c|2��2| s� .
Wir können Schreibarbeit sparen, wenn wir das Summenzeichen benutzen: � x| s� = � x|α��α|i��i| s� . i = 1, 2 α = a, b, c
(3.6)
3.1 Die Gesetze zur Kombination von Amplituden
37
Um mit dieser Methode konkrete Berechnungen durchzuführen, muss man natürlich die Amplitude für den Weg von einem Ort zum anderen kennen. Wir wollen eine ungefähre Vorstellung von einer typischen Amplitude vermitteln. Sie lässt gewisse Details, wie die Polarisation des Lichtes oder den Spin des Elektrons außer Acht, aber abgesehen von solchen Besonderheiten ist sie genau. Wir machen die Angaben so, dass man damit Aufgaben lösen kann, einschließlich verschiedener Spaltkombinationen. Nehmen wir an, ein Teilchen mit einer bestimmten Energie fliegt im leeren Raum von einem Ort r1 zu einem Ort r2 . Mit anderen Worten, es ist ein ungebundenes Teilchen, auf das keine Kräfte wirken. Abgesehen von einem Zahlenfaktor ist die Amplitude für den Weg von r1 nach r2 � r2 | r1 � =
eip·r12 / . r12
(3.7)
Dabei gilt r12 = r2 − r1 , und p ist der Impuls, der mit der Energie E durch die relativistische Gleichung 2 p 2 c2 = E 2 − m0 c2 ,
oder durch die nichtrelativistische Gleichung p2 = kinetische Energie 2m verknüpft ist. Gleichung (3.7) besagt, dass das Teilchen wellenähnliche Eigenschaften hat, wobei sich die Amplitude wie eine Welle ausbreitet, deren Wellenzahl gleich dem Impuls dividiert durch ist. Im allgemeinen Fall enthalten die Amplitude und die dazugehörende Wahrscheinlichkeit auch die Zeit. Für die meisten dieser anfänglichen Überlegungen wollen wir aber annehmen, dass die Quelle die Teilchen immer mit einer bestimmten Energie aussendet, sodass wir uns um die Zeit nicht zu kümmern brauchen. Aber im allgemeinen Fall könnten uns noch einige andere Fragen interessieren. Nehmen wir an, dass ein Teilchen zu einer bestimmten Zeit t0 an einem bestimmten Ort P frei wird, und wir wüssten jetzt gern die Amplitude für seine Ankunft an einem bestimmten Ort r zu einer späteren Zeit t. Dies könnte symbolisch als die Amplitude � r, t | P, t0 � ausgedrückt werden. Offensichtlich wird dies von r und t abhängen. Man wird andere Ergebnisse erhalten, wenn man den Detektor an einen anderen Ort bringt und zu einer anderen Zeit misst. Diese Funktion von r und t ist im Allgemeinen die Lösung einer Differentialgleichung, die die Form einer Wellengleichung hat. Im nichtrelativistischen Fall ist es zum Beispiel die Schrödinger-Gleichung. Man hat dann ein Wellengleichungsanalogon zur Gleichung der elektromagnetischen Wellen oder der Schallwellen in einem Gas. Es muss jedoch betont werden, dass die Wellenfunktion, die die Gleichung erfüllt, keiner realen Welle im Raum entspricht; man kann sich kein anschauliches Bild von dieser Welle machen, wie man es bei Schallwellen tut. Wenn man auch versucht sein mag, in den Begriffen von Teilchenwellen zu denken, wenn man ein Teilchen behandelt, so ist das doch keine gute Idee, denn wenn wir zum Beispiel zwei Teilchen betrachten, dann ist die Amplitude, das eine bei r1 und das andere bei r2 zu finden, keine einfache Welle im dreidimensionalen Raum, sondern sie hängt von den sechs Raumvariablen r1 und r2 ab. Wenn wir also zum Beispiel zwei (oder mehr) Teilchen behandeln,
38
3 Wahrscheinlichkeitsamplituden
brauchen wir das folgende zusätzliche Prinzip: Vorausgesetzt, dass es zwischen den beiden Teilchen keine Wechselwirkung gibt, ist die Amplitude, dass ein Teilchen das eine und das andere das andere tut, das Produkt der Amplituden dafür, dass die beiden Teilchen die beiden Dinge einzeln tun. Wenn zum Beispiel � a | s1 � die Amplitude für das Teilchen 1, von s1 nach a zu gehen, ist und � b | s2 � die Amplitude für das Teilchen 2, von s2 nach b zu gehen, dann ist die Amplitude, dass beide Ereignisse gleichzeitig geschehen, � a | s1 � � b | s2 � . Ein weiterer Aspekt muss betont werden. Nehmen wir an, wir wüssten nicht, woher die Teilchen in Abbildung 3.2 kommen, bevor sie bei den Spalten 1 und 2 der ersten Wand ankommen. Dann können wir dennoch eine Vorhersage machen über das, was hinter der Wand geschehen wird (zum Beispiel die Amplitude für die Ankunft bei x), wenn wir nur zwei Zahlen kennen: erstens die Amplitude, dass es bei 1 angekommen ist, und zweitens die Amplitude, dass es bei 2 angekommen ist. Mit anderen Worten: Aufgrund der Tatsache, dass sich die Amplituden für aufeinanderfolgende Ereignisse gemäß (3.6) multiplizieren, brauchen wir zur Fortsetzung der Auswertung nur zwei Zahlen zu kennen – in diesem speziellen Fall � 1 | s � und � 2 | s �. Diese zwei komplexen Zahlen reichen zur Vorhersage des gesamten zukünftigen Geschehens aus. Das ist es, was die Quantenmechanik wirklich einfach macht. Sie werden sehen, dass wir in späteren Kapiteln genau dies tun werden, wenn wir eine Anfangsbedingung mittels zweier (oder einiger weniger) Zahlen spezifizieren. Natürlich sind diese Zahlen davon abhängig, wo sich die Quelle befindet, und möglicherweise von anderen Details des Apparats, aber wenn wir diese beiden Zahlen haben, brauchen wir weiter nichts über diese Einzelheiten zu wissen.
3.2
Das Interferenzbild bei zwei Spalten
Nun möchten wir uns einem Thema zuwenden, das in gewisser Ausführlichkeit schon in Kapitel 1 besprochen wurde. Diesmal stützen wir uns bei der Betrachtung auf das Amplitudenkonzept, um Ihnen zu zeigen, wie es funktioniert. Wir betrachten dasselbe Experiment, das in Abbildung 3.1 gezeigt ist, aber diesmal unter Hinzufügung einer Lichtquelle hinter den beiden Spalten (siehe Abbildung 3.3). In Kapitel 1 hatten wir das folgende interessante Ergebnis gefunden. Wenn wir hinter Spalt 1 schauen und ein von dort gestreutes Photon sehen, dann erhalten wir bei x für die Elektronen, die mit diesen Photonen in Koinzidenz sind, dieselbe Verteilung, wie wenn Spalt 2 geschlossen wäre. Die Gesamtverteilung der Elektronen, die entweder bei Spalt 1 oder Spalt 2 gesehen werden, ist die Summe der einzelnen Verteilungen und ganz verschieden von der Verteilung bei ausgeschaltetem Licht. Das stimmt zumindest dann, wenn wir Licht von hinreichend kurzer Wellenlänge benutzen. Wenn wir die Wellenlänge so weit vergrößern, dass wir nicht mehr feststellen können, bei welchem Spalt die Streuung stattfand, wird die Verteilung mehr derjenigen ähnlich, die wir bei ausgeschaltetem Licht vorgefunden haben. Wir wollen nun analysieren, was geschieht, indem wir unsere neue Notation und die Prinzipien der Amplitudenkombination verwenden. Um die Schreibweise zu vereinfachen, bezeichnen wir wieder mit φ1 die Amplitude, dass das Elektron bei x auf dem Weg durch Spalt 1 ankommt, das heißt φ1 = � x | 1 � � 1 | s � .
3.2 Das Interferenzbild bei zwei Spalten
39
D1
s Elektronenkanone
1
Lichtquelle L
x
2 D2
Abb. 3.3: Experiment zur Bestimmung, durch welchen Spalt das Elektron geht.
Entsprechend bezeichnen wir mit φ2 die Amplitude, dass das Elektron zum Detektor auf dem Weg durch Spalt 2 gelangt: φ2 = � x | 2 � � 2 | s � . Das sind die Amplituden für einen Durchgang durch einen der beiden Spalte und die Ankunft bei x, wenn kein Licht vorhanden ist. Wenn nun aber das Licht eingeschaltet wird, fragen wir nach der Amplitude für den folgenden Vorgang: Ein Elektron startet bei s und ein Photon wird von der Lichtquelle L freigegeben, das Elektron endet bei x und ein Photon wird hinter Spalt 1 gesehen. Nehmen wir an, dass wir, wie in Abbildung 3.3 gezeigt, das Photon hinter Spalt 1 mit einem Detektor D1 registrieren und einen gleichartigen Detektor D2 benutzen, um die Photonen, die hinter Spalt 2 gestreut werden, zu zählen. Es wird eine Amplitude für die Ankunft eines Photons bei D1 und eines Elektrons bei x geben und ebenso eine Amplitude für die Ankunft eines Photons bei D2 und eines Elektrons bei x. Versuchen wir, sie zu berechnen. Obwohl wir nicht die korrekten mathematischen Formeln für alle Faktoren kennen, die in diese Rechnung eingehen, werden Sie doch ihren Sinn in der folgenden Diskussion erkennen. Zunächst gibt es die Amplitude � 1 | s �, dass ein Elektron von der Quelle zu Spalt 1 geht. Dann können wir annehmen, dass es eine gewisse Amplitude dafür gibt, dass das Elektron, während es bei Spalt 1 ist, ein Photon in den Detektor D1 streut. Wir wollen diese Amplitude mit a bezeichnen. Dann gibt es die Amplitude � x | 1 �, dass das Elektron von Spalt 1 zum Elektronendetektor bei x geht. Die Amplitude, dass das Elektron von s über Spalt 1 nach x geht und ein Photon nach D1 streut, ist dann � x|1�a�1| s� . Oder in unserer ursprünglichen Notation einfach aφ1 . Es gibt auch eine Amplitude, dass ein Elektron bei seinem Durchgang durch Spalt 2 ein Photon in den Zähler D1 streut. Sie werden sagen: „Das ist unmöglich, wie kann es in den Zähler D1 streuen, wenn der doch nur auf Spalt 1 gerichtet ist?“ Wenn die Wellenlänge hinreichend groß ist, dann treten Beugungseffekte auf, und das Ereignis ist sicherlich möglich. Wenn der Apparat gut gebaut ist und wenn wir Photonen kurzer Wellenlängen nehmen, dann ist die Amplitude, dass ein Photon in den Detektor 1 von einem Elektron bei 2 gestreut wird, sehr klein. Aber um die Behandlung allgemein zu halten, wollen wir berücksichtigen, dass es immer diese Amplitude, die wir mit b bezeichnen, gibt.
40
3 Wahrscheinlichkeitsamplituden
Dann ist die Amplitude, dass ein Elektron durch Spalt 2 geht und ein Photon nach D1 streut, gleich � x | 2 � b � 2 | s � = bφ2 . Die Amplitude, das Elektron bei x und das Photon in D1 zu finden, ist somit die Summe zweier Terme, je eines für die beiden möglichen Wege des Elektrons. Jeder Term setzt sich wiederum aus zwei Faktoren zusammen: Erstens, dass das Elektron durch einen bestimmten Spalt geht, und zweitens, dass das Photon von diesem Elektron in Detektor 1 gestreut wird. Es gilt Elektron bei x Elektron aus s = aφ1 + bφ2 . Photon bei D Photon aus L 1
(3.8)
Wir erhalten einen analogen Ausdruck, wenn das Photon im anderen Detektor D2 gefunden wird. Nehmen wir der Einfachheit halber an, dass das System symmetrisch ist. Dann ist a auch die Amplitude für ein Photon in D2 , wenn ein Elektron durch Spalt 2 geht, und b ist die Amplitude für ein Photon in D2 , wenn das Elektron durch Spalt 1 geht. Die entsprechende Gesamtamplitude für ein Photon bei D2 und ein Elektron bei x ist Elektron bei x Elektron aus s = aφ2 + bφ1 . Photon bei D Photon aus L 2
(3.9)
Nun sind wir fertig. Wir können die Wahrscheinlichkeit für verschiedene Situationen leicht berechnen. Nehmen wir an, wir möchten wissen, mit welcher Wahrscheinlichkeit wir eine Zählung in D1 und ein Elektron bei x erhalten. Das wird das Absolutquadrat der in (3.8) angegebenen Amplitude sein, nämlich |aφ1 + bφ2 |2 . Schauen wir uns diesen Ausdruck genauer an. Nehmen wir erst einmal an, dass b null ist – so hätten wir den Apparat gern gebaut. Dann ist die Antwort einfach: |φ1 |2 ist in der Gesamtamplitude um den Faktor |a|2 verringert. Dies ist die Wahrscheinlichkeitsverteilung, die man erhalten würde, wenn nur ein Spalt vorhanden wäre – wie in der Darstellung in Abbildung 3.4 (a) gezeigt. Wenn jedoch die Wellenlänge sehr groß ist, kann die Streuung hinter Spalt 2 nach D1 ungefähr genauso groß sein wie für Spalt 1. Obwohl einige Phasen in a und b enthalten sein mögen, können wir den einfachen Fall annehmen, dass die beiden Phasen gleich sind. Wenn a praktisch gleich b ist, dann wird die Gesamtwahrscheinlichkeit |φ1 + φ2 |2 multipliziert mit |a|2 , da der gemeinsame Faktor a ausgeklammert werden kann. Dies ist aber gerade die Wahrscheinlichkeitsverteilung, die wir ganz ohne Photonen erhalten hätten. Daher kommt man im Falle großer Wellenlänge – bei unwirksamem Photonennachweis – zurück zu der ursprünglichen Verteilungskurve, die Interferenzeffekte zeigt, wie in Abbildung 3.4 (b) dargestellt. Gesetzt den Fall, der Nachweis gelingt nur teilweise, dann gibt es eine Interferenz zwischen viel φ1 und wenig φ2 und man erhält eine mittlere Verteilung, wie sie in Abbildung 3.4 (c) skizziert ist. Es erübrigt sich zu sagen, dass wir analoge Ergebnisse erhalten, wenn wir Koinzidenzzählungen der Photonen bei D2 und der Elektronen bei x durchführen. Wenn Sie sich an die Diskussion in Kapitel 1 erinnern, werden Sie bemerken, dass diese Ergebnisse eine quantitative Beschreibung des dort Behandelten geben. Nun möchten wir einen wichtigen Aspekt betonen, damit Sie einen häufigen Irrtum vermeiden. Angenommen, Sie möchten nur die Amplitude wissen, dass ein Elektron bei x ankommt, und Sie unterscheiden nicht, ob das Photon bei D1 oder D2 gezählt wurde. Muss man dazu die durch (3.8) und (3.9) gegebenen Amplituden addieren? Nein! Sie dürfen niemals die Amplituden für verschiedene und getrennte Endzustände addieren. Wenn das Photon erst einmal von
3.3 Streuung an einem Kristall x
x
x
P
(a)
41
P
(b)
P
(c)
Abb. 3.4: Die Wahrscheinlichkeit, im Experiment von Abbildung 3.3 ein Elektron bei x in Koinzidenz mit einem Photon bei D1 zu zählen: (a) für b = 0; (b) für b = a; (c) für 0 < b < a.
einem der Photonenzähler aufgenommen wurde, dann können wir, immer feststellen, welche Alternative eingetreten ist, ohne das System weiter zu stören. Jede Alternative hat eine Wahrscheinlichkeit, die völlig unabhängig von der anderen ist. Um es zu wiederholen: Addieren Sie keine Amplituden für verschiedene Endzustände, wobei wir den „Endzustand“ zu jenem Zeitpunkt meinen, für den wir die Wahrscheinlichkeit wissen wollen – das heißt, wenn das Experiment „beendet“ ist. Man addiert die Amplituden für die verschiedenen ununterscheidbaren Alternativen innerhalb des Experiments, bevor der gesamte Prozess abgelaufen ist. Am Ende des Vorgangs können Sie natürlich sagen, dass Sie „das Photon nicht beachten wollen“. Das ist Ihre Sache, aber addieren Sie dennoch nicht die Amplituden. Die Natur weiß nicht, worauf Sie achten, und ihr Verhalten ist unabhängig davon, ob Sie sich die Mühe machen, die Daten niederzuschreiben oder nicht. Daher dürfen wir hier nicht die Amplituden addieren. Wir quadrieren zuerst die Amplituden für alle möglichen verschiedenen Endresultate und summieren dann. Das richtige Ergebnis für ein Elektron bei x und ein Photon bei D1 oder D2 ist e bei x ph bei D 1
3.3
e aus s 2 e bei x ph aus L + ph bei D 2
e aus s 2 2 2 ph aus L = |aφ1 + bφ2 | + |aφ2 + bφ1 | .
(3.10)
Streuung an einem Kristall
Unser nächstes Beispiel ist ein Phänomen, bei dem wir die Interferenz der Wahrscheinlichkeitsamplituden mit einiger Sorgfalt analysieren müssen. Wir betrachten den Streuvorgang von Neutronen an einem Kristall. Angenommen, wir betrachten einen Kristall, der eine Vielzahl von Atomen mit Kernen in der Mitte in periodischer Anordnung besitzt, und einen Neutronenstrahl, der aus großer Entfernung kommt. Wir können die einzelnen Kerne in dem Kristall mit einem Index i versehen, wobei i über die ganzen Zahlen 1, 2, 3, . . . , N läuft. Dabei ist N die Gesamtzahl der Atome. Das Problem besteht darin, die Wahrscheinlichkeit zu berechnen, ein Neutron in den Zähler zu bekommen, und zwar mit der in Abbildung 3.5 gezeigten Anordnung. Die Amplitude, dass das Neutron beim Zähler C ankommt, ist für jedes einzelne Atom i gleich der Amplitude, dass das Neutron von der Quelle S zum Kern i geht, multipliziert mit der Amplitude a, dass es dort gestreut wird, multipliziert mit der Amplitude, dass es von i zum Zähler C geht. Das wollen wir hinschreiben: � Neutron bei C | Neutron aus S �über i = � C | i � a � i | S � .
(3.11)
42
3 Wahrscheinlichkeitsamplituden
Neutronenquelle S
Kristall
θ C Neutronenzähler
Abb. 3.5: Messung der Streuung von Neutronen an einem Kristall.
Bei dieser Gleichung haben wir angenommen, dass die Streuamplitude a für alle Atome gleich ist. Wir haben hier eine große Anzahl von offenbar nicht zu unterscheidenden Wegen. Sie sind deshalb nicht zu unterscheiden, weil ein niederenergetisches Neutron von einem Kern gestreut wird, ohne das Atom aus seiner Position im Kristall zu stoßen – die Streuung hinterlässt keine „Spur“. Gemäß unseren früheren Diskussionen erhalten wir die Gesamtamplitude für ein Neutron bei C durch Summierung von (3.11) über alle Atome: � Neutron bei C | Neutron aus S � =
N i=1
�C |i�a�i|S � .
(3.12)
Weil wir Streuamplituden von Atomen mit verschiedenen Positionen im Raum addieren, werden die Amplituden verschiedene Phasen haben und das charakteristische Interferenzmuster ergeben, das wir schon im Fall der Streuung von Licht an einem Gitter analysiert haben. Die Neutronenintensität als Funktion des Winkels hat in einem solchen Experiment tatsächlich oft gewaltige Variationen gezeigt, mit sehr scharfen Interferenzspitzen und fast nichts dazwischen, wie in Abbildung 3.6 (a) dargestellt. Bei manchen Kristallen ist das jedoch anders, und es gibt – neben den oben erwähnten Interferenzspitzen – einen allgemeinen Hintergrund von Streuung in allen Richtungen. Wir wollen versuchen, den scheinbar rätselhaften Grund dafür zu verstehen. Nun ja, wir haben bisher eine wichtige Eigenschaft des Neutrons nicht berücksichtigt: Es hat den Spin 21 , und so gibt es zwei Zustände, in denen es sich befinden kann: entweder „zeigt“ der Spin „nach oben“ (sagen wir aus der Zeichenebene in Abbildung 3.5 heraus) oder „nach unten“. (Im Folgenden bezeichnen wir diese Spinzustände mit Spin up und Spin down.) Wenn die Kerne des Kristalls keinen Spin haben, hat der Spin des Neutrons keine Wirkung. Aber wenn die Kerne des Kristalls auch einen Spin haben, sagen wir ebenfalls den Spin 12 , werden Sie den oben beschriebenen Streuhintergrund beobachten. Das lässt sich folgendermaßen erklären. Wenn der Spin des Neutrons dieselbe Richtung wie der Spin des Atomkerns hat, dann kann beim Streuvorgang keine Änderung der Spins eintreten. Wenn das Neutron und der Atomkern entgegengesetzte Spins haben, dann kann die Streuung auf zwei Arten erfolgen. Bei der einen bleiben die Spins unverändert und bei der anderen kehren sich beide Spinrichtungen um. Diese Regel, dass sich die Summe der Spins nicht ändert, entspricht unserem klassischen Gesetz von der Erhaltung des Drehimpulses. Wir beginnen das Phänomen zu verstehen, wenn wir annehmen, dass alle streuenden Kerne mit Spins in derselben Richtung ausgestattet sind. Ein Neutron mit gleichem Spin wird dann mit der erwarteten scharfen Interferenzverteilung gestreut werden. Wie verhält sich nun ein Neutron mit entgegengesetztem Spin? Wenn es ohne Spinumklappung gestreut wird, dann ändert sich gegenüber dem oben Gesagten nichts; aber wenn die Spins bei der Streuung umklappen, dann können wir im Prinzip herausfinden, welcher Kern die Streuung
43
Zählrate
Zählrate
3.3 Streuung an einem Kristall
θ
Spinumklappwahrscheinlichkeit
(a)
(c)
(b)
θ
θ
Abb. 3.6: Die Neutronenzählrate als Funktion des Winkels: (a) für Kerne mit Spin 0; (b) die Streuwahrscheinlichkeit mit Spinumklappung; (c) die beobachtete Zählrate für einen Kern mit Spin 12 .
besorgt hat, da er der einzige mit umgeklapptem Spin ist. Nun ja, wenn wir sagen können, welches Atom die Streuung besorgt hat, was haben dann die anderen Atome damit zu tun? Nichts natürlich. Die Streuung ist genau die gleiche wie die von einem einzelnen Atom. Um diesen Effekt zu berücksichtigen, muss die mathematische Formulierung (3.12) modifiziert werden, da wir in der bisherigen Analyse die Zustände nicht vollständig beschrieben haben. Beginnen wir mit dem Fall, dass alle Neutronen aus der Quelle den Spin up haben und alle Kerne des Kristalls den Spin down. Zuerst wüssten wir gern die Amplitude, dass am Zähler der Spin des Neutrons up ist und alle Spins des Kristalls immer noch down sind. Dies unterscheidet sich nicht von unserer vorhergehenden Diskussion. Wir wollen a als Amplitude für die Streuung ohne Umklappung der Spins beibehalten. Die Amplitude für die Streuung am i-ten Atom ist natürlich nach wie vor � Cup , im Kristall alle down | S up , im Kristall alle down � = � C | i � a � i | S � . Da alle Kernspins noch down sind, können die verschiedenen Alternativen (unterschiedliche Werte von i) nicht unterschieden werden. Es gibt somit keine Möglichkeit zu sagen, welches Atom die Streuung besorgt hat. Bei diesem Vorgang interferieren alle Amplituden. Es gibt jedoch auch den Fall, in dem das Neutron bei seinem Nachweise Spin down hat, obwohl es von S mit Spin up ausging. Im Kristall muss einer der Kernspins umgeklappt sein, sagen wir der des k-ten Atoms. Wir nehmen an, dass es für jedes Atom die gleiche Streuamplitude mit Spinumklappung gibt, nämlich b. (In einem realen Kristall gibt es die unangenehme Möglichkeit, dass der umgeklappte Spin auf ein anderes Atom übergeht, aber wir wollen den Fall eines Kristalls annehmen, bei dem diese Wahrscheinlichkeit sehr gering ist.) Die Streuamplitude ist dann � Cdown , Kern k up | S up , im Kristall alle down � = � C | k � b � k | S � .
(3.13)
Die Wahrscheinlichkeit, den Neutronenspin im Zustand down und den k-ten Kernspin im Zustand up zu finden, ist gleich dem Absolutquadrat dieser Amplitude, also einfach |b|2 mal | � C | k � � k | S � |2 . Der zweite Faktor ist nahezu unabhängig von der Position im Kristall, und
44
3 Wahrscheinlichkeitsamplituden
bei der Bildung des Absolutquadrates sind alle Phasen verschwunden. Die Wahrscheinlichkeit für die Streuung an einem beliebigen Kern im Kristall mit Spinumklappung ist nun |b|2
N k=1
| � C | k � � k | S � |2 .
Sie wird eine glatte Verteilung zeigen wie in Abbildung 3.6 (b). Sie können argumentieren: „Mir ist es gleich, welcher Kern im Spinzustand up ist.“ Ihnen ist das vielleicht gleich, aber die Natur weiß es; und die Wahrscheinlichkeit entspricht tatsächlich dem, was wir oben angegeben haben – es gibt keine Interferenz. Wenn wir dagegen nach der Wahrscheinlichkeit fragen, dass der Spin am Detektor up ist und alle Kerne Spin down haben, dann müssen wir das Absolutquadrat von N i=1
�C |i�a�i|S �
bilden. Da die Terme in dieser Summe Phasen haben, interferieren sie und wir erhalten ein scharfes Interferenzbild. Wenn wir ein Experiment durchführen, bei dem wir den Spin des nachgewiesenen Neutrons nicht beobachten, dann können beide Erscheinungen auftreten und die einzelnen Wahrscheinlichkeiten addieren sich. Die Gesamtwahrscheinlichkeit (oder Zählrate) als Funktion des Winkels sieht dann wie in Abbildung 3.6 (c) aus. Schauen wir uns die Physik in diesem Experiment noch einmal an. Wenn Sie im Prinzip die beiden möglichen Endzustände unterscheiden können, dann erhalten Sie die gesamte Endwahrscheinlichkeit, indem Sie die Wahrscheinlichkeit für jeden Zustand (nicht die Amplitude) berechnen und sie dann addieren. Wenn Sie auch im Prinzip die Endzustände nicht unterscheiden können, dann müssen Sie die Wahrscheinlichkeitsamplituden summieren, bevor Sie das Absolutquadrat bilden, um die resultierende Wahrscheinlichkeit zu finden. Beachten Sie insbesondere Folgendes: Wenn Sie versuchen, das Neutron nur durch eine Welle darzustellen, würden Sie die gleiche Verteilungsform für die Streuung eines Neutrons mit Spin down wie für eins mit Spin up erhalten. Sie müssten sagen, dass die „Welle“ aus all den verschiedenen Atomen resultiert und wie diejenige mit Spin up mit derselben Wellenlänge interferiert. Aber wir wissen, dass es nicht so abläuft. So müssen wir, wie bereits gesagt, daran denken, dass wir den Wellen im Raum nicht zu viel Realität zuschreiben. Die Beschreibung durch Wellen ist zwar für bestimmte Probleme nützlich, aber eben nicht für alle.
3.4
Identische Teilchen
Das nächste Experiment, das wir beschreiben werden, demonstriert eine der interessanten Konsequenzen der Quantenmechanik. Es betrifft wieder eine physikalische Situation, in der etwas auf zwei ununterscheidbare Arten geschehen kann, sodass es eine Interferenz der Amplituden gibt – was unter solchen Umständen immer der Fall ist. Wir betrachten die Streuung von Kernen an anderen Kernen bei relativ niedriger Energie. Zuerst einmal denken wir an α-Teilchen (also Heliumkerne), die zum Beispiel Sauerstoffkerne bombardieren. Damit wir die Reaktion leichter analysieren können, wollen wir sie im Schwerpunktsystem betrachten, in dem die
3.4 Identische Teilchen
45
θ α-Teilchen
D1
D1
α
O
Sauerstoff
θ α-Teilchen
Sauerstoff
π−θ α
O D2
(a)
D2
(b)
Abb. 3.7: Streuung von α-Teilchen an Sauerstoffkernen (im Schwerpunktsystem betrachtet).
Sauerstoffkerne und die α-Teilchen vor und nach dem Zusammenstoß gleich große Impulse in genau entgegengesetzten Richtungen haben, vergleiche Abbildung 3.7 (a). (Die Beträge der Geschwindigkeiten sind natürlich unterschiedlich, da die Massen verschieden sind.) Wir wollen außerdem annehmen, dass die Energie erhalten bleibt und dass die Energie des Zusammenstoßes so niedrig ist, dass kein Teilchen gespalten wird oder in einen angeregten Zustand versetzt wird. Der Grund dafür, dass sich die beiden Teilchen abstoßen, liegt natürlich darin, dass jedes Teilchen eine positive Ladung trägt. Klassisch ausgedrückt, gibt es eine elektrostatische Abstoßung, wenn sie sich treffen. Die Streuung wird in verschiedene Richtungen mit unterschiedlichen Wahrscheinlichkeiten vor sich gehen, und wir würden gerne einiges mehr über die Winkelabhängigkeit solcher Streuungen aussagen. (Man kann diese Situation natürlich klassisch berechnen, und es ist einer der bemerkenswertesten Zufälle der Quantenmechanik, dass sie auf dieses Problem dieselbe Antwort gibt wie die klassische Physik. Dies ist ein kurioser Fall, der nur bei Kräften auftritt, die umgekehrt proportional zum Quadrat des Abstands sind – daher ist es wirklich ein Zufall.) Die Wahrscheinlichkeit der Streuung in verschiedene Richtungen kann mit einem Experiment, wie es in Abbildung 3.7 (a) gezeigt ist, gemessen werden. Der Zähler in Position 1 könnte nur zum Nachweis von α-Teilchen konstruiert sein; der Zähler in Position 2 könnte nur zum Nachweis von Sauerstoffkernen konstruiert sein – einfach als Gegenprobe. (Im Laborsystem würden sich die Detektoren nicht gegenüberstehen; sie tun das aber im Schwerpunktsystem.) Unser Experiment besteht in der Messung der Wahrscheinlichkeit der Streuung in verschiedene Richtungen. Sei f (θ) die Amplitude für eine Streuung in die Zähler, wenn sie im Winkel θ zur jeweiligen Einfallsrichtung stehen; dann ist | f (θ)|2 unsere experimentell bestimmte Wahrscheinlichkeit. Nun könnten wir uns ein anderes Experiment ausdenken, bei dem unsere Zähler sowohl auf α-Teilchen als auch auf Sauerstoffkerne ansprechen. Dann müssen wir herausfinden, was passiert, wenn wir uns nicht um eine Unterscheidung der gezählten Teilchen kümmern. Wenn wir einen Sauerstoffkern in der Position θ erhalten, dann muss natürlich ein α-Teilchen auf der gegenüberliegenden Seite beim Winkel (π − θ) sein, wie Abbildung 3.7 (b) zeigt. Wenn also f (θ) die Amplitude für α-Streuung im Winkel θ ist, dann ist f (π − θ) die Amplitude für Sauerstoff-
46
3 Wahrscheinlichkeitsamplituden
streuung im Winkel (π−θ).1 Folglich ist die Wahrscheinlichkeit, irgendein Teilchen im Detektor bei Position 1 zu finden Wahrscheinlichkeit für irgendein Teilchen in D1 = | f (θ)|2 + | f (π − θ)|2 .
(3.14)
Man beachte, dass die beiden Zustände im Prinzip unterscheidbar sind. Auch wenn wir sie in diesem Versuch nicht unterscheiden, könnten wir es doch tun. Aus unseren früheren Überlegungen folgt, dass die Wahrscheinlichkeiten und nicht die Amplituden addiert werden müssen. Das oben gegebene Resultat gilt für verschiedene Targetkerne – für α-Teilchen an Sauerstoff, Kohlenstoff, Beryllium oder Wasserstoff. Aber es gilt nicht für α-Teilchen an α-Teilchen. Wenn beide Teilchen zur selben Sorte gehören, stimmen die experimentellen Ergebnisse nicht mit der Vorhersage von (3.14) überein. Die Wahrscheinlichkeit der Streuung bei 90◦ ist zum Beispiel genau das Doppelte von dem, was die obige Theorie vorhersagt, und das hat nichts damit zu tun, dass die Teilchen „Heliumkerne“ sind: Wenn das Target He3 ist, aber die Geschosse α-Teilchen (He4 ) sind, dann haben wir wieder Übereinstimmung. Nur wenn auch das Target He4 ist – sodass seine Kerne identisch mit den ankommenden α-Teilchen sind –, variiert die Streuung auf eigenartige Weise mit dem Winkel. Vielleicht ahnen Sie schon, wie sich das erklären lässt. Es gibt zwei Möglichkeiten, ein α-Teilchen in den Zähler zu bekommen: durch Streuung des bombardierenden α-Teilchens in einem Winkel θ oder durch Streuung dieses Teilchens in einem Winkel (π − θ). Wie können wir entscheiden, ob das bombardierende Teilchen oder das Targetteilchen in den Zähler gelangte? Die Antwort ist, dass wir es nicht können. Im Falle der Streuung von α-Teilchen an α-Teilchen gibt es zwei Alternativen, die nicht zu unterscheiden sind. Hier müssen wir die Wahrscheinlichkeitsamplituden durch Addition überlagern, und die Wahrscheinlichkeit, ein α-Teilchen im Zähler zu finden, ist das Quadrat ihrer Summe: Wahrscheinlichkeit für ein α-Teilchen bei D1 = | f (θ) + f (π − θ)|2 .
(3.15)
Das ist ein ganz anderes Ergebnis als in (3.14). Als Beispiel können wir den Winkel π/2 betrachten, weil das leicht zu berechnen ist. Für θ = π/2 ist offensichtlich f (θ) = f (π − θ). Damit wird die durch (3.15) gegebene Wahrscheinlichkeit | f (π/2) + f (π/2)|2 = 4| f (π/2)|2.
Wenn sich die Wahrscheinlichkeitsamplituden dagegen nicht überlagern, liefert (3.14) nur 2| f (π/2)|2. Also gibt es bei 90◦ doppelt so viel Streuung wie wir erwartet hätten. Natürlich werden bei anderen Winkeln die Ergebnisse andere sein. Und so haben Sie das ungewöhnliche Ergebnis, dass bei gleichartigen Teilchen etwas Neues geschieht, etwas, das nicht geschieht, wenn die Teilchen unterschieden werden können. In der mathematischen Beschreibung müssen Sie für alternative Prozesse, in denen die beiden Teilchen einfach die Rollen tauschen, die Amplituden addieren und es gibt Interferenz. Etwas noch Verblüffenderes geschieht, wenn wir in einem gleichartigen Experiment Elektronen an Elektronen oder Protonen an Protonen streuen. Keines der obigen Ergebnisse ist dann richtig! Für diese Teilchen müssen wir noch eine neue Regel einführen, nämlich folgende höchst 1
Im Allgemeinen muss eine Streurichtung natürlich durch zwei Winkel, den Polarwinkel φ und den Azimutwinkel θ beschrieben werden. Wir würden dann sagen, dass ein Sauerstoffkern bei (θ, φ) bedeutet, dass das α-Teilchen bei (π − θ, φ + π) ist. Für Coulomb-Streuung (und für viele andere Fälle) ist die Streuamplitude jedoch unabhängig von φ. Dann ist die Amplitude, einen Sauerstoffkern bei θ zu bekommen, gleich der Amplitude, das α-Teilchen bei (π − θ) zu bekommen.
3.4 Identische Teilchen
47 D1
D1 Spin up
Spin up θ
Elektron Spin up
Elektron Spin up
θ
Elektron Spin up
Elektron Spin up
π−θ Spin up
Spin up D2
D2 (a)
(b)
Abb. 3.8: Die Streuung von Elektronen an Elektronen. Wenn die eintretenden Elektronen parallele Spins haben, dann sind die Prozesse (a) und (b) nicht zu unterscheiden.
sonderbare Regel: Wenn man eine Situation hat, in der die Identität des an einem Punkt ankommenden Elektrons mit einer anderen vertauscht wird, dann interferiert die neue Amplitude mit der alten mit entgegengesetzter Phase. Es ist ebenfalls Interferenz, aber mit einem Minuszeichen. Im Fall von α-Teilchen überlagern sich die interferierenden Amplituden mit positivem Vorzeichen, wenn man das in den Detektor eintretende α-Teilchen austauscht. Im Fall von Elektronen überlagern sich die beim Austausch interferierenden Amplituden mit negativem Vorzeichen. Abgesehen von einem weiteren Detail, das später besprochen wird, lautet die richtige Gleichung für Elektronen bei einem Experiment wie in Abbildung 3.8 Wahrscheinlichkeit für ein Elektron bei D1 = | f (θ) − f (π − θ)|2 .
(3.16)
Die bisherige Feststellung muss eingeschränkt werden, weil wir den Spin des Elektrons nicht berücksichtigt haben (α-Teilchen haben nämlich keinen Spin). Der Spin des Elektrons kann als entweder „up“ oder „down“ in Bezug auf die Streuebene angenommen werden. Wenn die Energie in dem Versuch niedrig ist, sind die magnetischen Kräfte, die durch die Ströme verursacht werden, klein und der Spin wird nicht beeinflusst. Wir wollen annehmen, dass dies für die jetzige Untersuchung zutrifft, sodass keine Möglichkeit für eine Änderung des Spins bei dem Zusammenstoß besteht. Welchen Spin das Elektron auch hat, es nimmt ihn mit sich. Nun sehen Sie, dass es viele Möglichkeiten gibt. Das bombardierende und das Targetteilchen können beide den Spin up, beide down oder entgegengesetzte Spins haben. Wenn beide Spins up sind, wie in Abbildung 3.8 (oder beide down), gilt dasselbe für die gestreuten Teilchen, und die Amplitude für den Prozess ist die Differenz der Amplituden für die beiden Möglichkeiten, die in Abbildung 3.8 gezeigt sind. Die Wahrscheinlichkeit für den Nachweis eines Elektrons in D1 ist dann durch (3.16) gegeben. Nehmen wir jedoch an, der Spin des bombardierenden Elektrons ist up und der Target-Spin ist down. Das Elektron, das in den Zähler 1 eintritt, kann dann Spin up oder down haben, und wenn wir diesen Spin messen, können wir sagen, ob es aus dem bombardierenden Strahl oder aus dem Target stammt. Die beiden Möglichkeiten sind in Abbildung 3.9 dargestellt; sie sind im Prinzip zu unterscheiden, und folglich gibt es keine Interferenz – nur eine Addition
48
3 Wahrscheinlichkeitsamplituden D1
D1
Spin up θ Elektron Spin up
Spin down
Elektron Spin down
Elektron Spin up
Elektron Spin down π−θ Spin up
Spin down D2
D2 (a)
(b)
Abb. 3.9: Die Streuung von Elektronen mit entgegengesetzten Spins.
der beiden Wahrscheinlichkeiten. Das gleiche Argument gilt, wenn die beiden ursprünglichen Spins vertauscht werden, d. h., wenn der linke Spin down ist und der rechte Spin up. Wenn wir den Spin unserer Elektronen als zufällig betrachten, was zum Beispiel der Fall ist, wenn sie aus einem Wolframheizdraht stammen, in dem die Elektronen vollständig unpolarisiert sind, dann stehen die Chancen fünfzig zu fünfzig, dass ein einzelnes Elektron mit Spin up oder Spin down herauskommt. Wenn wir uns an keiner Stelle des Experimentes um eine Messung des Elektronenspins kümmern, dann haben wir es mit einem unpolarisierten Experiment zu tun. Die Ergebnisse dieses Experimentes berechnet man am besten, wenn man alle verschiedenen Möglichkeiten in einer Tabelle zusammenstellt, wie wir es in Tabelle 3.1 getan haben. Für jede unterscheidbare Alternative wird eine eigene Wahrscheinlichkeit berechnet. Die Gesamtwahrscheinlichkeit ist dann die Summe aller einzelnen Wahrscheinlichkeiten. Beachten Sie, dass für unpolarisierte Strahlen das Ergebnis für θ = π/2 gleich der Hälfte des klassischen Ergebnisses mit unabhängigen Teilchen ist. Das Verhalten von identischen Teilchen hat viele interessante Konsequenzen, die wir im nächsten Kapitel ausführlicher besprechen werden. Tabelle 3.1: Die Streuung unpolarisierter Teilchen mit Spin
1 2
Anteil der Fälle
Spin von Teilchen 1
Spin von Teilchen 2
Spin bei D1
Spin bei D2
Wahrscheinlichkeit
1 4 1 4
up
up
up
up
down
down
down
down
| f (θ) − f (π − θ)|2
1 4
up
down
up
down
down
up
1 4
down
up
up
down
down
up
| f (θ) − f (π − θ)|2 | f (θ)|2
| f (π − θ)|2 | f (π − θ)|2 | f (θ)|2
Gesamtwahrscheinlichkeit = 12 | f (θ) − f (π − θ)|2 + 12 | f (θ)|2 + 12 | f (π − θ)|2
4
Identische Teilchen
Siehe auch: Strahlung des schwarzen Körpers in: Band II, Kapitel 16, Die brownsche Bewegung Band II, Kapitel 17, Anwendungen der kinetischen Theorie
4.1
Bose-Teilchen und Fermi-Teilchen
Im vorigen Kapitel haben wir mit der Behandlung spezieller Regeln für die Interferenz begonnen, die in Prozessen mit zwei identischen Teilchen auftritt. Mit identischen Teilchen meinen wir Objekte wie Elektronen, die nicht voneinander unterschieden werden können. Wenn an einem Prozess zwei identische Teilchen beteiligt sind, haben wir keine Möglichkeit zu unterscheiden, ob das eine oder das andere Teilchen am Zähler ankommt. Wie in allen Fällen, in denen nicht zu unterscheidende Alternativen auftreten, interferieren die beiden Möglichkeiten. Die Amplitude für den Prozess ist dann die Summe der beiden interferierenden Amplituden; aber interessanterweise geschieht die Interferenz in einigen Fällen mit gleicher Phase und in anderen mit entgegengesetzter Phase.
1
1
θ
θ
a
b
a
b π−θ
2
(a)
2
(b)
Abb. 4.1: Bei der Streuung zweier identischer Teilchen sind die Prozesse (a) und (b) nicht unterscheidbar.
Angenommen, zwei Teilchen a und b stoßen zusammen, wobei Teilchen a in Richtung 1 und Teilchen b in Richtung 2 gestreut wird, wie in Abbildung 4.1 (a) skizziert ist. Die Amplitude für diesen Vorgang sei f (θ). Dann ist die Wahrscheinlichkeit P1 , ein solches Ereignis zu beobachten, proportional zu | f (θ)|2 . Natürlich kann es auch passieren, dass Teilchen b in den Zähler 1 gestreut wird und Teilchen a in den Zähler 2 geht, wie Abbildung 4.1 (b) zeigt. Wenn wir an-
50
4 Identische Teilchen
nehmen, dass keine spezielle Richtung durch Spins oder dergleichen festgelegt ist, dann ist die Wahrscheinlichkeit P2 für diesen Vorgang einfach | f (π − θ)|2 , weil er äquivalent ist zum ersten Vorgang, nur mit einem um den Winkel π − θ gedrehten Zähler 1. Sie könnten denken, dass die Amplitude für den zweiten Vorgang einfach f (π − θ) ist. Aber das muss nicht unbedingt so sein, weil es einen Phasenfaktor geben könnte. Das heißt, die Amplitude könnte sein eiδ f (π − θ) . Diese Amplitude gibt immer noch eine Wahrscheinlichkeit P2 gleich | f (π − θ)|2 .
Nun wollen wir sehen, was passiert, wenn a und b identische Teilchen sind. Die beiden in Abbildung 4.1 gezeigten Vorgänge können dann nicht unterschieden werden. Es gibt eine Amplitude, dass entweder Teilchen a oder Teilchen b in den Zähler 1 geht, während das andere in den Zähler 2 geht. Diese Amplitude ist die Summe der Amplituden für die beiden Vorgänge, die in Abbildung 4.1 dargestellt sind. Wenn wir die erste mit f (θ) bezeichnen, dann ist die zweite eiδ f (π − θ), wobei jetzt der Phasenfaktor wichtig wird, weil wir die beiden Amplituden addieren. Angenommen, wir müssen die Amplitude mit dem Phasenfaktor eiδ multiplizieren, wenn wir die Rollen der zwei Teilchen vertauschen. Wenn wir sie noch einmal vertauschen, müssen wir denselben Faktor ein zweites Mal anwenden. Aber wir sind dann wieder beim ersten Vorgang. Zweimal angewendet, muss uns der Phasenfaktor zum Anfang zurückbringen – sein Quadrat muss gleich 1 sein. Es gibt nur zwei Möglichkeiten: eiδ ist +1 oder −1. Entweder kommt der ausgetauschte Fall mit dem gleichen Vorzeichen oder mit dem entgegengesetzten Vorzeichen hinzu. Beide Fälle kommen in der Natur vor, jeder bei einer anderen Gruppe von Teilchen. Teilchen, die mit positivem Vorzeichen interferieren, werden Bose-Teilchen genannt, und jene, die mit negativem Vorzeichen interferieren, werden Fermi-Teilchen genannt. Zu den Bose-Teilchen gehören Photonen, Mesonen und Gravitonen. Elektronen, Myonen, Neutrinos, Nukleonen und Baryonen sind Fermi-Teilchen. Damit ergibt sich als Amplitude für die Streuung identischer Teilchen: Bose-Teilchen: (Amplitude direkt) + (Amplitude ausgetauscht)
(4.1)
(Amplitude direkt) − (Amplitude ausgetauscht)
(4.2)
Fermi-Teilchen:
Bei Teilchen mit Spin – wie bei Elektronen – gibt es eine zusätzliche Komplikation. Wir müssen nicht nur den Ort der Teilchen angeben, sondern auch die Richtung ihrer Spins. Nur bei identischen Teilchen mit gleichen Spinzuständen überlagern sich die Amplituden, wenn die Teilchen ausgetauscht werden. Wenn Sie an die Streuung von unpolarisierten Strahlen denken – die eine Ansammlung von Teilchen mit unterschiedlichen Spinzuständen sind –, ist etwas zusätzliche Rechenarbeit nötig. Nun taucht ein interessantes Problem auf, wenn zwei oder mehr Teilchen fest aneinander gebunden sind. Zum Beispiel enthält ein α-Teilchen vier Teilchen – zwei Neutronen und zwei Protonen. Wenn zwei α-Teilchen zusammenstoßen, gibt es mehrere Möglichkeiten. Es ist möglich, dass es beim Zusammenstoß eine gewisse Amplitude gibt, dass eins der Neutronen von einem α-Teilchen auf das andere überspringt, während ein Neutron von dem anderen α-Teilchen
4.1 Bose-Teilchen und Fermi-Teilchen
Proton
51
Neutron
α-Teilchen
(a)
(b)
Abb. 4.2: Die Streuung von zwei α-Teilchen. In (a) behalten die beiden Teilchen ihre Identität; in (b) wird ein Neutron beim Zusammenstoß ausgetauscht.
den umgekehrten Weg nimmt, sodass die beiden α-Teilchen, die aus der Streuung herauskommen, nicht mehr die ursprünglichen sind – es hat ein Austausch eines Neutronenpaares stattgefunden (siehe Abbildung 4.2). Die Amplitude einer Streuung mit Austausch eines Neutronenpaares interferiert mit der Amplitude der Streuung ohne einen solchen Austausch, und die Interferenz muss mit einem Minuszeichen erfolgen, weil der Austausch eines Paares von Fermi-Teilchen stattgefunden hat. Wenn dagegen die relative Bewegungsenergie der beiden αTeilchen so klein ist, dass sie ziemlich weit voneinander entfernt bleiben – sagen wir wegen der Coulomb-Abstoßung – und nicht die geringste Wahrscheinlichkeit für den Austausch innerer Teilchen besteht, können wir das α-Teilchen als homogenes Objekt ansehen und brauchen uns um seine innere Beschaffenheit nicht zu kümmern. Unter diesen Umständen gibt es nur zwei Beiträge zur Streuamplitude. Entweder gibt es keinen Austausch oder alle vier Nukleonen werden bei der Streuung ausgetauscht. Da die Protonen und Neutronen in dem α-Teilchen alle Fermi-Teilchen sind, kehrt eine Vertauschung jedes Paares das Vorzeichen der Streuamplitude um. Solange es keine inneren Veränderungen in dem α-Teilchen gibt, ist der Austausch der beiden α-Teilchen das Gleiche wie eine Vertauschung von vier Paaren von Fermi-Teilchen. Für jedes Paar gibt es einen Vorzeichenwechsel, sodass sich im Gesamtergebnis die Amplituden mit positivem Vorzeichen zusammensetzen. Das α-Teilchen verhält sich wie ein Bose-Teilchen. Es gilt also die Regel, dass sich zusammengesetzte Objekte, wenn sie als Einheit betrachtet werden können, wie Fermi-Teilchen oder wie Bose-Teilchen verhalten, je nachdem, ob sie eine gerade oder eine ungerade Anzahl von Fermi-Teilchen enthalten. Alle elementaren Fermi-Teilchen, die wir erwähnt haben – Elektron, Proton, Neutron usw. –, haben den Spin j = 12 . Wenn mehrere solcher Fermi-Teilchen zu einem zusammengesetzten Gebilde vereinigt werden, dann kann der resultierende Spin entweder ganzzahlig oder halbzahlig sein. So hat zum Beispiel das gewöhnliche Isotop des Heliums, He4 , das zwei Neutronen und zwei Protonen besitzt, den Spin null, während Li7 , welches drei Protonen und vier Neutronen besitzt, den Spin 23 hat. Wir werden später die Regeln für die Addition von Drehimpulsen kennenlernen und wollen jetzt nur erwähnen, dass jedes zusammengesetzte Objekt, das einen halbzahligen Spin hat, sich wie ein Fermi-Teilchen verhält, während jedes zusammengesetzte Objekt mit ganzzahligem Spin sich wie ein Bose-Teilchen verhält.
52
4 Identische Teilchen
Dies wirft eine interessante Frage auf: Wie kommt es, dass Teilchen mit halbzahligem Spin Fermi-Teilchen sind, deren Amplituden sich mit einem Minuszeichen zusammensetzen, während Teilchen mit ganzzahligem Spin Bose-Teilchen sind, deren Amplituden sich mit positivem Vorzeichen addieren? Leider können wir hierfür keine elementare Erklärung geben. Von Pauli ist eine Erklärung ausgearbeitet worden, die auf komplizierten Argumenten der Quantenfeldund der Relativitätstheorie beruht. Er hat gezeigt, dass beides notwendigerweise miteinander korrespondiert, aber wir haben keine Möglichkeit finden können, seine Beweisführung auf elementarem Niveau wiederzugeben. Es scheint eine der wenigen Situation in der Physik zu sein, wo es eine Regel gibt, die sehr einfach formuliert werden kann, für die aber niemand eine einfache Erklärung gefunden hat. Die Erklärung steckt tief in der relativistischen Quantenmechanik. Das deutet wahrscheinlich darauf hin, dass wir die grundlegenden Prinzipien noch nicht ganz verstehen. Im Moment müssen Sie es einfach als eine der Regeln der Welt hinnehmen.
4.2
Zustände mit zwei Bose-Teilchen
Nun wollen wir eine interessante Konsequenz der Additionsregel für Bose-Teilchen diskutieren. Es handelt sich um ihr Verhalten in Prozessen, an denen mehrere Teilchen beteiligt sind. Wir betrachten zuerst eine Situation, in der zwei Bose-Teilchen an zwei Streuzentren gestreut werden. Wir wollen uns hier nicht um die Einzelheiten des Streumechanismus kümmern. Uns interessiert nur, was mit den gestreuten Teilchen geschieht. Nehmen wir die in Abbildung 4.3 gezeigte Situation an. 1
2
a b
Abb. 4.3: Zwei Streuprozesse in benachbarte Endzustände.
Das Teilchen a wird in den Zustand 1 gestreut. Mit Zustand meinen wir eine bestimmte Richtung und Energie oder irgendeine andere gegebene Bedingung. Das Teilchen b wird in den Zustand 2 gestreut. Wir wollen annehmen, dass die beiden Zustände 1 und 2 fast gleich sind. (Was wir letztendlich herausfinden wollen, ist die Amplitude dafür, dass die beiden Teilchen in die gleiche Richtung bzw. in den gleichen Zustand gestreut werden; es ist aber am besten, wenn wir uns zuerst überlegen, was geschieht, wenn die Zustände nur fast gleich sind, und dann berechnen, was passiert, wenn sie sich einander angleichen.) Nehmen wir an, es gäbe nur das Teilchen a; es hätte dann eine bestimmte Amplitude � 1 | a �, in Richtung 1 gestreut zu werden. Teilchen b allein hätte die Amplitude � 2 | b �, in Richtung 2
4.2 Zustände mit zwei Bose-Teilchen
53
gestreut zu werden. Wenn die beiden Teilchen nicht identisch sind, ist die Amplitude dafür, dass die beiden Streuprozesse gemeinsam stattfinden, einfach das Produkt �1|a��2|b� . Die Wahrscheinlichkeit für dieses Ereignis ist dann |� 1 | a � � 2 | b �|2 , das auch gleich |� 1 | a �|2 |� 2 | b �|2 ist. Um bei unserer Berechnung Schreibarbeit zu sparen, werden wir gelegentlich die Notation a1 = � 1 | a � ,
b2 = � 2 | b �
verwenden. Dann ist die Wahrscheinlichkeit für die doppelte Streuung |a1 |2 |b2 |2 . Es kann auch vorkommen, dass Teilchen b in Richtung 1 gestreut wird, während Teilchen a in Richtung 2 läuft. Die Amplitude für diesen Vorgang ist �2|a��1|b� , und die Wahrscheinlichkeit für dieses Ereignis ist |� 2 | a � � 1 | b �|2 = |a2 |2 |b1 |2 . Stellen Sie sich nun vor, dass wir mit einem Paar kleiner Zähler die beiden gestreuten Teilchen auffangen. Die Wahrscheinlichkeit P2 , dass die Zähler zwei Teilchen gleichzeitig aufnehmen, ist einfach die Summe P2 = |a1 |2 |b2 |2 + |a2 |2 |b1 |2 .
(4.3)
Nun wollen wir annehmen, dass sich die Richtungen 1 und 2 nur wenig unterscheiden. Wir erwarten, dass sich � n | a � stetig mit der Richtung n ändert. Daher müssen sich a1 und a2 einander annähern, wenn 1 und 2 nahe zusammenkommen. Wenn sie nahe genug sind, sind die Amplituden a1 und a2 gleich. Wir können dann a1 = a2 setzen und beide einfach a nennen; entsprechend setzen wir b1 = b2 = b. Dann erhalten wir P2 = 2 |a|2 |b|2 .
(4.4)
Nun nehmen wir an, dass a und b identische Bose-Teilchen sind. Dann kann der Vorgang, bei dem a nach 1 und b nach 2 läuft, nicht von dem umgekehrten Vorgang, bei dem a nach 2 und b nach 1 läuft, unterschieden werden. In diesem Fall werden die Amplituden für die beiden Vorgänge interferieren. Die Gesamtamplitude, in jedem der beiden Zähler ein Teilchen zu erhalten, ist �1|a��2|b� + �2|a��1|b� .
(4.5)
54
4 Identische Teilchen
Und die Wahrscheinlichkeit, dass wir ein Teilchenpaar erhalten, ist das Absolutquadrat dieser Amplitude: P2 = |a1 b2 + a2 b1 |2 = 4 |a|2 |b|2 .
(4.6)
Als Ergebnis erhalten wir, dass es doppelt so wahrscheinlich ist, zwei in denselben Zustand gestreute identische Bose-Teilchen zu finden, wie für den Fall unterscheidbarer Teilchen. Wir haben zwar angenommen, dass die beiden Teilchen in verschiedenen Zählern nachgewiesen werden, doch ist dies nicht wesentlich, wie man durch die folgende Überlegung erkennen kann. Stellen wir uns vor, dass die beiden Richtungen 1 und 2 die Teilchen in einen einzigen kleinen Zähler führen würden, der weit entfernt ist. Die Richtung 1 sei dadurch definiert, dass sie zu dem Flächenelement dS 1 des Zählers hinführt. Die Richtung 2 führt zum Flächenelement dS 2 des Zählers. (Wir stellen uns vor, dass die Oberfläche des Zählers im rechten Winkel zur Streurichtung steht.) Nun können wir keine Wahrscheinlichkeit dafür angeben, dass ein Teilchen genau in eine bestimmte Richtung oder exakt zu einem einzelnen Punkt im Raum geht. So etwas ist unmöglich – für jede genaue Richtung ist die Wahrscheinlichkeit null. Wenn wir präzise sein wollen, müssen wir unsere Amplitude so definieren, dass sie die Ankunftswahrscheinlichkeit pro Flächeneinheit eines Zählers angibt. Angenommen, wir haben nur das Teilchen a, welches eine gewisse Amplitude hat, in Richtung 1 gestreut zu werden. Wir definieren � 1 | a � = a1 als die Amplitude, dass a in eine Flächeneinheit des Zählers in Richtung 1 gestreut wird. Mit anderen Worten, der Maßstab von a1 ist so gewählt – wir sagen, a1 ist „normiert“ –, dass die Wahrscheinlichkeit für die Streuung in ein Flächenelement dS 1 durch |� 1 | a �|2 dS 1 = |a1 |2 dS 1
(4.7)
gegeben ist. Wenn unser Zähler die Gesamtfläche ΔS hat und wir dS 1 über diese Fläche laufen lassen, dann ist die Gesamtwahrscheinlichkeit, dass das Teilchen a in den Zähler gestreut wird |a1 |2 dS 1 . (4.8) ΔS
Wie vorher nehmen wir an, dass der Zähler hinreichend klein ist, sodass die Amplitude a1 sich auf der Oberfläche des Zählers nicht wesentlich ändert; a1 ist dann eine konstante Amplitude, die wir a nennen können. Dann ist die Wahrscheinlichkeit, dass das Teilchen a irgendwo in den Zähler gestreut wird, pa = |a|2 ΔS .
(4.9)
In analoger Weise erhalten wir für die Wahrscheinlichkeit, dass Teilchen b – wenn es allein ist – in ein Flächenelement dS 2 gestreut wird |b2 |2 dS 2 . (Wir schreiben dS 2 statt dS 1 , weil wir später a und b in verschiedene Richtungen gehen lassen wollen.) Wir setzen wieder b2 gleich der konstanten Amplitude b. Die Wahrscheinlichkeit, dass Teilchen b im Detektor gezählt wird, ist dann pb = |b|2 ΔS .
(4.10)
4.2 Zustände mit zwei Bose-Teilchen
55
Wenn nun beide Teilchen betrachtet werden, ist die Wahrscheinlichkeit, dass a nach dS 1 und b nach dS 2 gestreut wird, |a1 b2 |2 dS 1 dS 2 = |a|2 |b|2 dS 1 dS 2 .
(4.11)
Wenn wir die Wahrscheinlichkeit ermitteln möchten, dass sowohl a als auch b in den Zähler geht, integrieren wir sowohl dS 1 als auch dS 2 über ΔS und erhalten P2 = |a|2 |b|2 (ΔS )2 .
(4.12)
Nebenbei bemerken wir, dass dies gerade gleich pa · pb ist, genau so, wie wir es für unabhängige Teilchen a und b auch erwarten. Wenn die beiden Teilchen jedoch identisch sind, dann gibt es zwei ununterscheidbare Möglichkeiten für jedes Paar von Oberflächenelementen dS 1 und dS 2 . Man kann nicht unterscheiden, ob Teilchen a nach dS 2 und Teilchen b nach dS 1 oder Teilchen a nach dS 1 und Teilchen b nach dS 2 geht. Daher werden die Amplituden für diese Vorgänge interferieren. (Als wir zuvor zwei unterscheidbare Teilchen betrachtet haben, haben wir uns zwar nicht weiter darum gekümmert, welches Teilchen wo in den Zähler lief, doch wir hätten es im Prinzip herausfinden können; daher gab es da keine Interferenz. Bei identischen Teilchen können wir auch im Prinzip nichts darüber aussagen.) Wir müssen dann für die Wahrscheinlichkeit, dass die beiden Teilchen bei dS 1 und dS 2 ankommen, |a1 b2 + a2 b1 |2 dS 1 dS 2
(4.13)
schreiben. Wenn wir nun aber über die Fläche des Zählers integrieren, müssen wir vorsichtig sein. Wenn wir sowohl dS 1 als auch dS 2 über die gesamte Fläche ΔS laufen lassen, berücksichtigen wir jeden Teil der Fläche doppelt, da (4.13) alles enthält, was mit irgendeinem Paar von Oberflächenelementen dS 1 und dS 2 geschehen kann.1 Wir können dennoch das Integral so berechnen, wenn wir die doppelte Zählung korrigieren, indem wir das Ergebnis durch 2 dividieren. Wir erhalten dann P2 für identische Bose-Teilchen: P2 (Bose) =
1 2 2 4|a| |b| (ΔS )2 = 2|a|2|b|2 (ΔS )2 . 2
(4.14)
Wieder ist dies genau das Doppelte vom Ergebnis (4.12), das wir für unterscheidbare Teilchen erhalten hatten. Stellen wir uns für einen Augenblick vor, wir wüssten, dass der b-Kanal sein Teilchen schon in eine bestimmte Richtung geschickt hat. Dann können wir sagen, dass die Wahrscheinlichkeit, dass ein zweites Teilchen in dieselbe Richtung geht, doppelt so groß ist, wie wir erwartet hätten, wenn wir sie für ein unabhängiges Ereignis berechnet hätten. Dies ist eine Eigenschaft der Bose-Teilchen: Wenn ein Teilchen schon in einem Zustand ist, dann ist die Wahrscheinlichkeit, ein zweites Teilchen im selben Zustand zu bekommen, doppelt so groß wie sie wäre, wenn das erste noch nicht da wäre. Diese Tatsache wird oft folgendermaßen ausgedrückt: Wenn ein 1
Wenn man in (4.11) dS 1 und dS 2 vertauscht, ergibt sich ein anderes Ereignis, daher müssen beide Oberflächenelemente über die gesamte Zählerfläche laufen. In (4.13) behandeln wir dS 1 und dS 2 als ein Paar und schließen alles, was passieren kann, mit ein. Wenn die Integrale wieder das enthalten, was geschieht, wenn dS 1 und dS 2 vertauscht werden, wird alles doppelt gezählt.
56
4 Identische Teilchen
Bose-Teilchen schon in einem vorgegebenen Zustand ist, dann ist die Amplitude, ein identi√ sches Teilchen daraufzusetzen, um den Faktor 2 größer, als wenn das erste nicht da wäre. (Das ist vom physikalischen Standpunkt aus, den wir eingenommen haben, keine einwandfreie Methode, das Ergebnis auszudrücken, aber wenn man sie konsequent als Regel benutzt, wird sie natürlich das richtige Ergebnis bringen.)
Zustände mit n Bose-Teilchen
4.3
Wir wollen unser Ergebnis auf den Fall ausdehnen, dass n Teilchen vorhanden sind. Wir stellen uns den in Abbildung 4.4 gezeigten Fall vor. Wir haben n Teilchen a, b, c, . . ., die gestreut werden und in die Richtungen 1, 2, 3, . . . , n fliegen. Alle n Richtungen führen zu einem kleinen Zähler, der weit entfernt ist. Wie im vorigen Abschnitt wollen wir alle Amplituden so normieren, dass |� �|2 dS
die Wahrscheinlichkeit ist, dass jedes Teilchen für sich allein in ein Oberflächenelement dS des Zählers geht. 1
2
3
n
a
b c
Abb. 4.4: Streuung von n Teilchen in benachbarte Endzustände.
Nehmen wir zuerst einmal an, dass alle Teilchen unterscheidbar sind. Dann ist die Wahrscheinlichkeit, dass die n Teilchen zusammen in n verschiedenen Oberflächenelementen gezählt werden, |a1 b2 c3 . . .|2 dS 1 dS 2 dS 3 . . .
(4.15)
|a|2 |b|2 |c|2 . . . dS 1 dS 2 dS 3 . . .
(4.16)
Pn (verschieden) = |a|2 |b|2 |c|2 . . . (ΔS )n .
(4.17)
Wieder nehmen wir an, dass die Amplituden nicht davon abhängen, wo dS i in dem (als klein angenommenen) Zähler liegt, und nennen sie einfach a, b, c . . .. Die Wahrscheinlichkeit (4.15) wird dann Wenn wir jedes dS i über die Oberfläche ΔS des Zählers integrieren, erhalten wir als Wahrscheinlichkeit Pn (verschieden), n unterscheidbare Teilchen auf einmal zu zählen,
4.3 Zustände mit n Bose-Teilchen
57
Dies ist das Produkt der Wahrscheinlichkeiten, dass jedes Teilchen für sich in den Zähler geht. Sie bewegen sich alle unabhängig voneinander – die Wahrscheinlichkeit, dass eins in den Zähler geht, hängt nicht davon ab, wie viele andere sonst noch hineingehen. Nun stellen wir uns vor, dass alle Teilchen identische Bose-Teilchen sind. Für jede Gruppe von Richtungen 1, 2, 3, . . . gibt es viele ununterscheidbare Möglichkeiten. Für drei Teilchen zum Beispiel gäbe es folgende Möglichkeiten: a→1 b→2 c→3
a→1 b→3 c→2
a→2 b→1 c→3
a→2 b→3 c→1
a→3 b→1 c→2
a→3 b→2 c→1
Es gibt sechs verschiedene Kombinationen. Für n Teilchen gibt es n! verschiedene, aber ununterscheidbare Möglichkeiten, für die wir die Amplituden addieren müssen. Die Wahrscheinlichkeit, dass n Teilchen in n Oberflächenelementen gezählt werden, ist dann |a1 b2 c3 . . . + a1 b3 c2 . . . + a2 b1 c3 . . . + a2 b3 c1 . . . + usw.|2 dS 1 dS 2 dS 3 . . . dS n .
(4.18)
Wieder setzen wir voraus, dass alle Richtungen so dicht beieinander liegen, dass wir a1 = a2 = . . . = an = a setzen können, und ebenso für b, c, . . .. Die durch (4.18) gegebene Wahrscheinlichkeit wird damit |n! abc . . . |2 dS 1 dS 2 . . . dS n .
(4.19)
Wenn wir jedes dS i über die Fläche ΔS des Zählers integrieren, dann wird jedes mögliche Produkt von Oberflächenelementen n!-mal gezählt. Dies korrigieren wir, indem wir durch n! dividieren, und erhalten Pn (Bose) =
1 |n!abc . . . |2 (ΔS )n n!
oder Pn (Bose) = n! |abc . . . |2 (ΔS )n .
(4.20)
Wenn wir dieses Ergebnis mit (4.17) vergleichen, stellen wir fest, dass die Wahrscheinlichkeit, n Bose-Teilchen gemeinsam zu zählen, n!-mal größer ist als für unterscheidbare Teilchen. Wir können unser Ergebnis folgendermaßen zusammenfassen: Pn (Bose) = n! Pn (verschieden) .
(4.21)
Folglich ist die Wahrscheinlichkeit im Bose-Fall n!-mal größer, als man unter der Annahme, dass die Teilchen unabhängig voneinander wirken, ausrechnen würde. Was dies bedeutet, können wir besser erkennen, wenn wir folgende Frage stellen: Wie groß ist die Wahrscheinlichkeit, dass ein Bose-Teilchen in einen bestimmten Zustand geht, wenn sich schon n andere Bose-Teilchen darin befinden? Wir wollen das neu hinzukommende Teilchen w nennen. Wenn sich in dem Zustand (n + 1) Teilchen (einschließlich w) befinden, gilt gemäß (4.20) Pn+1 (Bose) = (n + 1)! | abc . . . w|2 (ΔS )n+1 .
(4.22)
58
4 Identische Teilchen
Das können wir auch schreiben als Pn+1 (Bose) = (n + 1)|w|2 ΔS n! |abc . . . |2 (ΔS )n oder
Pn+1 (Bose) = (n + 1)|w|2 ΔS Pn (Bose) .
(4.23)
Dieses Ergebnis können wir folgendermaßen auffassen: Die Zahl |w|2 ΔS ist die Wahrscheinlichkeit, das Teilchen w im Detektor nachzuweisen, wenn keine anderen Teilchen da sind; Pn (Bose) ist die Wahrscheinlichkeit, dass schon n andere Bose-Teilchen vorhanden sind. Gleichung (4.23) besagt also: Wenn schon n andere identische Bose-Teilchen vorhanden sind, ist die Wahrscheinlichkeit, dass noch ein solches Teilchen in denselben Zustand gelangt, um den Faktor (n+1) vergrößert. Die Wahrscheinlichkeit, ein Bose-Teilchen dort zu erhalten, wo schon n andere gleichartige Bose-Teilchen sind, ist (n + 1)-mal höher als sie wäre, wenn vorher keines da wäre. Die Anwesenheit der anderen Bose-Teilchen erhöht die Wahrscheinlichkeit, ein weiteres in diesem Zustand zu erhalten.
4.4
Emission und Absorption von Photonen
Bei unserer Diskussion haben wir über einen Prozess wie die Streuung von α-Teilchen gesprochen. Aber das ist nicht wesentlich; wir hätten auch über die Erzeugung von Teilchen sprechen können, wie zum Beispiel die Lichtemission. Wenn Licht emittiert wird, wird ein Photon „erzeugt“. In diesem Fall brauchen wir in Abbildung 4.4 die ankommenden Linien nicht; wir müssen nur berücksichtigen, dass es einige Atome gibt, die n Photonen emittieren, wie in Abbildung 4.5. Daher kann unser Ergebnis auch so formuliert werden: Die Wahrscheinlichkeit, dass ein Atom ein Photon in einen bestimmten Endzustand emittiert, vergrößert sich um den Faktor (n + 1), wenn schon n Photonen in diesem Zustand sind. 1
2
3
n
Abb. 4.5: Erzeugung von n Photonen in benachbarten Zuständen.
Man fasst dieses Ergebnis gern zusammen, indem man sagt, dass die Amplitude für die Emissi√ on eines Photons um den Faktor n + 1 größer wird, wenn schon n Photonen vorhanden sind. Das ist nur eine andere Möglichkeit, dasselbe zu sagen, wenn klar ist, dass man durch Quadrieren der Amplitude die Wahrscheinlichkeit erhält. In der Quantenmechanik gilt allgemein, dass die Amplitude, von irgendeinem Zustand φ zu einem anderen Zustand χ zu kommen, das konjugiert Komplexe der Amplitude ist, von χ nach φ zu kommen: � χ | φ � = � φ | χ �∗ .
(4.24)
4.4 Emission und Absorption von Photonen
59
Wir werden über dieses Gesetz später mehr erfahren, aber im Moment wollen wir einfach annehmen, dass es richtig ist. Wir können es anwenden, um herauszufinden, wie Photonen aus einem vorgegebenen Zustand gestreut oder absorbiert werden. Wie wir bereits wissen, kann die Amplitude, dass ein Photon zu einem Zustand i hinzukommt, wenn schon n Photonen da sind, durch √ �n + 1|n� = n + 1a, (4.25) ausgedrückt werden. Dabei ist a = � i | a � die Amplitude für den Fall, dass keine anderen Photonen da sind. Bei Anwendung von (4.24) wird die Amplitude für den umgekehrten Prozess – von (n + 1) Photonen zu n √ � n | n + 1 � = n + 1 a∗ . (4.26) Auf diese Weise drückt man es gewöhnlich nicht aus; man geht in Gedanken nicht gerne von (n + 1) nach n, sondern man zieht es immer vor, von n vorhandenen Photonen auszugehen. Man sagt dann, dass die Amplitude, ein Photon zu absorbieren, wenn n Photonen vorhanden sind – mit anderen Worten von n nach (n − 1) zu gehen –, sich folgendermaßen ausdrücken lässt: √ � n − 1 | n � = n a∗ . (4.27) Dies ist natürlich dasselbe wie (4.26). Dann hat man jedoch das Problem, sich zu merken, wann √ √ man n und wann n + 1 benutzen soll. Man kann es sich so merken: Der Faktor ist immer die Quadratwurzel der größeren Anzahl anwesender Photonen, egal ob vor oder nach der Reaktion. Die Gleichungen (4.25) und (4.26) zeigen, dass das Gesetz tatsächlich symmetrisch ist – es erscheint nur unsymmetrisch, wenn Sie es in der Form (4.27) schreiben. Diese neuen Gesetze haben viele physikalische Konsequenzen; wir möchten eine davon beschreiben, die mit der Emission von Licht zu tun hat. Stellen wir uns eine Situation vor, in der Photonen in einem Kasten eingeschlossen sind – Sie können sich einen Kasten denken, der Spiegel als Wände hat. Nun sagen wir, dass sich in dem Kasten n Photonen in demselben Zustand befinden – gleiche Frequenz, Richtung und Polarisation –, sodass sie nicht unterschieden werden können. Außerdem gibt es in dem Kasten ein Atom, das ein weiteres Photon in denselben Zustand emittieren kann. Dann ist die Wahrscheinlichkeit, dass es das Photon emittieren wird, (n + 1) |a|2,
(4.28)
und die Wahrscheinlichkeit, dass es ein Photon absorbieren wird, ist n |a|2 ,
(4.29)
wobei |a|2 die Wahrscheinlichkeit dafür ist, dass es ein Photon emittieren würde, wenn keine weiteren vorhanden wären. Wir haben diese Gesetze auf eine etwas andere Art in Kapitel 17 von Band II besprochen. Die Gleichung (4.29) sagt aus, dass die Wahrscheinlichkeit, dass ein Atom ein Photon absorbieren und in einen höheren Energiezustand übergehen wird, proportional zur Intensität des einfallenden Lichts ist. Aber wie Einstein darlegte, hat die Rate, mit der ein Atom einen Übergang nach unten vollführt, zwei Anteile. Es gibt die Wahrscheinlichkeit |a|2 für einen spontanen Übergang und die Wahrscheinlichkeit n | a|2 für einen induzierten Übergang. Letztere
60
4 Identische Teilchen
ist proportional zur Lichtintensität, das heißt, zur Anzahl der bereits anwesenden Photonen. Außerdem sind, wie Einstein sagte, die Koeffizienten für Absorption und induzierte Emission gleich und stehen in Beziehung zur Wahrscheinlichkeit einer spontanen Emission. Was wir hier lernen, ist Folgendes: Wenn als Maß für die Lichtintensität die Anzahl der anwesenden Photonen genommen wird (anstelle der Energie pro Flächeneinheit und Sekunde), dann sind die Koeffizienten für Absorption, induzierte Emission und spontane Emission alle gleich. Dies ist der Inhalt der in Kapitel 17, Band II, formulierten Beziehung (17.18) zwischen den EinsteinKoeffizienten A und B.
4.5
Das Spektrum des schwarzen Körpers
Wir wollen nun die Gesetze für Bose-Teilchen benutzen, um noch einmal das Spektrum der Strahlung eines schwarzen Körpers zu besprechen (vgl. Kapitel 17, Band II). Wir wollen dies tun, indem wir ermitteln, wie viele Photonen in einem Kasten enthalten sind, wenn die Strahlung im thermischen Gleichgewicht mit einigen Atomen in dem Kasten ist. Nehmen wir an, dass für jede Lichtfrequenz ω eine bestimmte Zahl Nω von Atomen vorhanden ist, die zwei Energiezustände haben, die um den Energiebetrag ΔE = ω auseinander liegen, siehe Abbildung 4.6. e ΔE = ω Grundzustand (a)
g
e ΔE = ω Grundzustand (b)
g Abb. 4.6: Emission und Absorption eines Photons mit der Frequenz ω.
Wir wollen den unteren Energiezustand „Grundzustand“ und den oberen Zustand „angeregten“ Zustand nennen. Ng und Ne seien die durchschnittlichen Anzahlen von Atomen im Grundzustand bzw. im angeregten Zustand (engl. ground state und exited state). Aus der statistischen Mechanik wissen wir, dass im thermischen Gleichgewicht bei der Temperatur T gilt Ne = e−ΔE/kT = e−ω/kT . Ng
(4.30)
Jedes Atom im Grundzustand kann ein Photon absorbieren und in den angeregten Zustand übergehen und jedes Atom im angeregten Zustand kann ein Photon emittieren und in den Grundzustand übergehen. Im Gleichgewicht müssen die Raten für diese beiden Prozesse gleich sein. Die Raten sind proportional zur Wahrscheinlichkeit für das Ereignis sowie zur Anzahl
4.5 Das Spektrum des schwarzen Körpers
61
E 5ω 4ω 3ω 2ω ω 0
Grundzustand
Abb. 4.7: Energieniveaus des harmonischen Oszillators.
der vorhandenen Atome, die den entsprechenden Übergang ausführen können. Nun sei n¯ die durchschnittliche Anzahl von Photonen in einem gegebenen Zustand mit der Frequenz ω. Dann ist die Absorptionsrate aus diesem Zustand Ng n¯|a|2 und die Emissionsrate in diesen Zustand Ne (¯ n + 1)|a|2. Wenn wir die beiden Raten gleichsetzen, erhalten wir n + 1). Ng n¯ = Ne (¯
(4.31)
Wenn wir dies mit (4.30) verbinden, erhalten wir n¯ = e−ω/kT . n¯ + 1 Auflösen nach n¯ ergibt n¯ =
1 eω/kT
−1
.
(4.32)
Dies ist die mittlere Anzahl von Photonen in einem Zustand mit der Frequenz ω für einen Hohlraum im thermischen Gleichgewicht. Da jedes Photon die Energie ω hat, ist die Energie der Photonen eines gegebenen Zustandes n¯ω oder ω eω/kT
−1
.
(4.33)
Übrigens haben wir bereits in einem anderen Zusammenhang eine ähnliche Gleichung gefunden [Kapitel 16, Band II, Gleichung (16.15)]. Sie erinnern sich, dass bei jedem harmonischen Oszillator – wie zum Beispiel ein Gewicht an einer Feder – die quantenmechanischen Energieniveaus alle den gleichen Abstand ω voneinander haben (siehe Abbildung 4.7). Wenn wir die Energie des n-ten Niveaus mit nω bezeichnen, erhalten wir, dass die mittlere Energie eines solchen Oszillators auch durch (4.33) gegeben ist. Wir haben hier jedoch diese Gleichung für Photonen durch Zählen von Teilchen hergeleitet und es ergibt sich dasselbe Resultat. Das ist eines der erstaunlichen Wunder der Quantenmechanik. Wenn man mit einem Zustand oder einer Bedingung für Bose-Teilchen, die nicht miteinander wechselwirken (wir haben angenommen, dass die Photonen nicht miteinander wechselwirken), beginnt und dann berücksichtigt, dass man in diesen Zustand entweder null oder eins oder zwei, . . . bis zu jeder Anzahl n von
62
4 Identische Teilchen
Teilchen hineintun kann, dann findet man, dass sich dieses System für alle quantenmechanischen Zwecke genau wie ein harmonischer Oszillator verhält. Unter einem solchen Oszillator verstehen wir ein dynamisches System wie ein Gewicht an einer Feder oder eine stehende Welle in einem Hohlraum in Resonanz. Darum ist es möglich, das elektromagnetische Feld durch Photonenteilchen darzustellen. Von dem einen Standpunkt aus können wir das elektromagnetische Feld in einem Kasten oder Hohlraum als eine Vielzahl von harmonischen Oszillatoren betrachten, indem wir jede Schwingungsmode gemäß der Quantenmechanik wie einen harmonischen Oszillator behandeln. Von einem anderen Standpunkt aus können wir dieselbe physikalische Gegebenheit im Sinne von identischen Bose-Teilchen analysieren. Und die Ergebnisse beider Betrachtungsweisen sind immer in voller Übereinstimmung. Man kann auf keine Weise entscheiden, ob das elektromagnetische Feld als eine Vielzahl quantisierter harmonischer Oszillator beschrieben werden muss oder durch die Angabe, wie viele Photonen sich in jedem einzelnen Zustand befinden. Die beiden Standpunkte stellen sich als mathematisch gleichwertig heraus. Daher können wir in Zukunft entweder über die Anzahl der Photonen in einem bestimmten Zustand in einem Kasten oder über die Anzahl der Energieniveaus, die mit einer bestimmten Schwingungsmode des elektromagnetischen Feldes zusammenhängen, sprechen. Es sind zwei Möglichkeiten, dasselbe auszudrücken. Dasselbe gilt für Photonen im freien Raum. Sie sind äquivalent zu Schwingungen eines Hohlraumes, dessen Wände sich ins Unendliche entfernt haben. Wir haben die mittlere Energie jeder einzelnen Schwingungsmode in einem Kasten bei der Temperatur T berechnet. Eine Angabe brauchen wir noch, um das Gesetz der Strahlung des schwarzen Körpers angeben zu können: Wir müssen wissen, wie viele Schwingungsmoden es für jede Energie gibt. (Wir nehmen an, dass es für jede Schwingungsmode einige Atome in dem Kasten – oder innerhalb der Wände – gibt, die Energieniveaus haben, die diese Schwingungsmode ausstrahlen, sodass jede Schwingungsmode in das thermische Gleichgewicht gelangen kann.) Das Gesetz der Strahlung des schwarzen Körpers wird gewöhnlich so formuliert, dass die Energie pro Volumeneinheit angegeben wird, die das Licht in einem kleinen Frequenzbereich zwischen ω und ω + Δω mit sich führt. Daher müssen wir wissen, wie viele Schwingungsmoden mit Frequenzen im Intervall Δω sich in einem Kasten befinden. Obwohl diese Frage überall in der Quantenmechanik auftaucht, ist sie doch eine rein klassische Frage über stehende Wellen. Wir werden die Antwort für einen rechtwinkligen Kasten herleiten. Es ergibt sich zwar dasselbe für einen Kasten beliebiger Form, aber es ist sehr schwierig, es für den allgemeinen Fall zu berechnen. Wir sind auch nur an einem Kasten interessiert, dessen Abmessungen im Vergleich zur Wellenlänge des Lichts sehr groß sind. Dann gibt es Abermilliarden von Schwingungsmoden; in jedem kleinen Frequenzintervall Δω wird es viele geben, daher können wir von der „durchschnittlichen Anzahl“ der Schwingungsmoden für jedes Δω um die Frequenz ω sprechen. Beginnen wir mit der Frage, wie viele Schwingungsmoden es im eindimensionalen Fall gibt – wie zum Beispiel für die Wellen eines gespannten Seiles. Sie wissen, dass jede Schwingungsmode eine Sinuswelle ist, deren Amplitude an beiden Enden null sein muss; mit anderen Worten, es muss eine ganze Zahl von halben Wellenlängen auf der Länge der Linie geben, wie in Abbildung 4.8 gezeigt ist. Wir ziehen es vor, die Wellenzahl k = 2π/λ zu benutzen; wenn wir die Wellenzahl der j-ten Schwingungsmode mit k j bezeichnen, erhalten wir kj =
jπ , L
(4.34)
4.5 Das Spektrum des schwarzen Körpers
63
2L λ 1 2
j Abb. 4.8: Schwingungsmoden der stehenden Wellen auf einer Linie.
L
wobei j eine ganze Zahl ist. Der Abstand δk zwischen zwei aufeinanderfolgenden Schwingungsmoden ist δk = k j+1 − k j =
π . L
Wir wollen annehmen, dass kL so groß ist, dass in einem kleinen Intervall Δk viele Schwingungsmoden vorhanden sind. Wenn wir mit ΔN die Anzahl der Schwingungsmoden im Intervall Δk bezeichnen, erhalten wir ΔN =
Δk L = Δk . δk π
(4.35)
Nun ziehen es die theoretischen Physiker, die sich mit der Quantenmechanik befassen, gewöhnlich vor zu sagen, dass es nur halb so viele Schwingungsmoden gibt; sie schreiben ΔN =
L Δk . 2π
(4.36)
Wir wollen erklären warum. Sie denken gewöhnlich gern in Begriffen von fortschreitenden Wellen – manche laufen nach rechts (mit einem positiven k), und manche laufen nach links (mit einem negativen k). Aber eine „Schwingungsmode“ ist eine stehende Welle, die die Summe von zwei Wellen ist, die in entgegengesetzte Richtungen laufen. Mit anderen Worten, sie betrachten jede stehende Welle so, als enthielte sie zwei getrennte Photonen-„Zustände“. Wenn man daher mit ΔN lieber die Anzahl der Photonenzustände eines gegebenen k bezeichnet (wobei k jetzt positive und negative Werte annehmen kann), dann muss man ΔN nur halb so groß wählen. (Alle ganzen Zahlen müssen nun von k = −∞ bis k = +∞ gehen und die Gesamtzahl von Zuständen bis zu irgendeinem gegebenen absoluten Wert von k wird richtig herauskommen.) Natürlich beschreiben wir dann stehende Wellen nicht sehr gut, aber wir zählen die Schwingungsmoden in einer konsistenten Weise. Nun möchten wir die Ergebnisse auf drei Dimensionen ausdehnen. In einem rechtwinkligen Kasten muss eine stehende Welle entlang jeder Achse eine ganze Zahl von Halbwellen haben. Die Situation für zwei Dimensionen ist in Abbildung 4.9 gezeigt. Jede Wellenrichtung und
64
4 Identische Teilchen Lx
Ly
ky
k kx Abb. 4.9: Die Schwingungsmoden der stehenden Wellen in zwei Dimensionen.
Frequenz wird durch einen Wellenzahlvektor k beschrieben, dessen x-, y- und z-Komponenten Gleichungen wie (4.34) genügen müssen. Damit erhalten wir kx =
jx π , Lx
ky =
jy π , Ly
kz =
jz π . Lz
Die Anzahl der Schwingungsmoden mit k x in einem Intervall Δk x ist wie vorher Lx Δk x 2π und ebenso für Δky und Δkz . Bezeichnen wir mit ΔN(k) die Anzahl der Schwingungsmoden für einen Wellenzahlvektor k, für den die x-Komponente zwischen k x und k x + Δk x , die y-Komponente zwischen ky und ky + Δky und die z-Komponente zwischen kz und kz + Δkz liegt. Dann ist ΔN( k) =
L x Ly Lz Δk x Δky Δkz . (2π)3
(4.37)
Das Produkt L x Ly Lz ist gleich dem Volumen V des Kastens. Daher erhalten wir das wichtige Ergebnis, dass bei hohen Frequenzen (kleine Wellenlängen im Vergleich zu den Abmessungen) die Anzahl der Schwingungsmoden in einem Hohlraum proportional zum Volumen V des Kastens und zum „Volumenelement im k-Raum“ Δk x Δky Δkz ist. Dieses Ergebnis kommt bei vielen Problemen vor und sollte im Gedächtnis behalten werden: dN( k) = V
d3 k . (2π)3
(4.38)
Obwohl wir es nicht bewiesen haben, ist das Ergebnis doch unabhängig von der Form des Kastens.Wir wollen dieses Ergebnis nun verwenden, um die Anzahl von Schwingungsmoden für Photonen mit Frequenzen im Bereich Δω zu finden. Wir interessieren uns für die Energie der verschiedenen Schwingungsmoden, nicht aber für die Richtung der Wellen. Wir wüssten gern die Anzahl der Schwingungsmoden in einem gegebenen Frequenzbereich. Im Vakuum ist der Betrag von k mit der Frequenz durch | k| =
ω c
(4.39)
4.5 Das Spektrum des schwarzen Körpers
65
π2 C 3 dE × V kT dω
1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 1
2
3 4 5 ω/kT
6
7
8
Abb. 4.10: Das Frequenzspektrum der Strahlung in einem Hohlraum im thermischen Gleichgewicht, das Spektrum des „schwarzen Körpers“.
verknüpft. Daher sind dies in einem Frequenzintervall Δω alle diejenigen Schwingungsmoden, die unabhängig von ihren Richtungen Beträge zwischen k und k + Δk haben. Das „Volumen im k-Raum“ zwischen k und k + Δk ist eine Kugelschale vom Inhalt 4πk2 Δk . Die Anzahl der Schwingungsmoden ist dann ΔN(k) =
V4πk2 Δk . (2π)3
(4.40)
Da uns jetzt jedoch Frequenzen interessieren, setzen wir k = ω/c. Damit erhalten wir ΔN(ω) =
V4πω2 Δω . (2π)3 c3
(4.41)
Es gibt noch eine weitere Komplikation. Wenn wir von Schwingungsmoden einer elektromagnetischen Welle sprechen, dann kann es für jeden Wellenvektor k zwei Polarisationsrichtungen geben (orthogonal zueinander). Da diese Schwingungsmoden unabhängig voneinander sind, müssen wir – für Licht – die Anzahl der Schwingungsmoden verdoppeln. Damit erhalten wir ΔN(ω) =
Vω2 Δω π 2 c3
(für Licht) .
(4.42)
Wir haben in (4.33) gezeigt, dass jede Schwingungsmode die mittlere Energie n¯ω =
ω eω/kT − 1
hat. Multiplizieren wir dies mit der Anzahl der Schwingungsmoden, dann erhalten wir die Energie ΔE der Schwingungsmoden, die in dem Intervall Δω liegen: ΔE =
ω eω/kT
Vω2 Δω . − 1 π 2 c3
(4.43)
Dies ist das Gesetz für das Frequenzspektrum der Strahlung des schwarzen Körpers, das wir schon im Kapitel 16 von Band II gefunden hatten. Das Spektrum ist in Abbildung 4.10 aufgetragen. Sie sehen jetzt, dass das Ergebnis von der Tatsache abhängt, dass Photonen Bose-Teilchen
66
4 Identische Teilchen
sind, die die Tendenz haben, alle in denselben Zustand zu gehen (weil die Amplitude dafür so groß ist). Sie werden sich erinnern, dass es Plancks Studien zum Spektrum des schwarzen Körpers (welches für die klassische Physik ein Rätsel war) und seine Entdeckung der durch (4.43) gegebenen Formel waren, womit die Quantenmechanik ihren Anfang nahm.
4.6
Flüssiges Helium
Flüssiges Helium hat bei tiefen Temperaturen viele seltsame Eigenschaften, für deren detaillierte Beschreibung wir im Moment leider nicht die Zeit haben. Viele davon beruhen auf der Tatsache, dass Heliumatome Bose-Teilchen sind. Eine dieser Eigenschaften ist, dass flüssiges Helium ohne jeden viskosen Widerstand fließt. Es ist in der Tat das ideale „trockene“ Wasser, von dem wir in einem früheren Kapitel gesprochen haben – vorausgesetzt, dass die Fließgeschwindigkeiten hinreichend klein sind. Das hat folgenden Grund. Damit eine Flüssigkeit Viskosität besitzt, müssen innere Energieverluste eintreten; es muss für einen Teil der Flüssigkeit die Möglichkeit bestehen, eine vom Rest der Flüssigkeit verschiedene Bewegung auszuführen. Das heißt, es muss möglich sein, einige der Atome in Zustände zu stoßen, die sich von den Zuständen unterscheiden, die die anderen Atome einnehmen. Aber bei hinreichend tiefen Temperaturen, wenn die Wärmebewegung sehr gering ist, versuchen alle Atome, denselben Zustand einzunehmen. Wenn sich daher einige von ihnen in bestimmter Weise bewegen, dann versuchen alle Atome, sich in der gleichen Weise zu bewegen. Es ist eine Art Starrheit in der Bewegung, und es ist schwierig, die Bewegung in den unregelmäßigen Verlauf einer Turbulenz zu bringen, wie sie zum Beispiel bei unabhängigen Teilchen auftreten würde. Daher gibt es in einer Flüssigkeit von Bose-Teilchen für alle Atome √ eine starke Tendenz, in denselben Zustand zu gehen. Diese Tendenz wird durch den Faktor n + 1 beschrieben, den wir zuvor gefunden hatten. (Für eine Flasche mit flüssigem Helium ist n natürlich eine sehr große Zahl!) Diese kollektive Bewegung findet bei hohen Temperaturen nicht mehr statt, weil dann genügend thermische Energie vorhanden ist, um die einzelnen Atome in unterschiedliche höhere Zustände zu bringen. Aber bei hinreichend tiefer Temperatur kommt plötzlich der Moment, wo alle Heliumatome versuchen, denselben Zustand einzunehmen. Das Helium wird superfluid. Es sei erwähnt, dass dieses Phänomen nur bei den Heliumisotopen auftritt, die das Atomgewicht 4 haben. Bei dem Heliumisotop mit dem Atomgewicht 3 sind die einzelnen Atome FermiTeilchen und die Flüssigkeit verhält sich normal. Da die Superfluidität nur bei He4 auftritt, ist sie offensichtlich ein quantenmechanischer Effekt, der aus der Bose-Natur des α-Teilchens folgt.
4.7
Das Ausschließungsprinzip
Fermi-Teilchen verhalten sich ganz anders. Schauen wir uns nun an, was passiert, wenn wir versuchen, zwei Fermi-Teilchen in denselben Zustand zu bringen. Wir greifen auf unser ursprüngliches Beispiel zurück und fragen nach der Amplitude, dass zwei identische Fermi-Teilchen in fast genau dieselbe Richtung gestreut werden. Die Amplitude, dass Teilchen a in die Richtung 1 und Teilchen b in die Richtung 2 gehen, ist �1|a��2|b� .
4.7 Das Ausschließungsprinzip
67
Dagegen ist die Amplitude, dass sich die Richtungen vertauschen, �2|a��1|b� . Da wir es mit Fermi-Teilchen zu tun haben, ist die Amplitude für den Prozess die Differenz dieser zwei Amplituden �1|a��2|b� − �2|a��1|b�
(4.44)
Mit „Richtung 1“ meinen wir, dass das Teilchen nicht nur eine bestimmte Flugrichtung, sondern auch eine gegebene Spinrichtung hat, und dass „Richtung 2“ fast genau die gleiche Flugrichtung ist wie Richtung 1 und derselben Spinrichtung entspricht. Dann sind � 1 | a � und � 2 | a � fast gleich. (Wenn die Endzustände 1 und 2 nicht den gleichen Spin haben, muss das nicht unbedingt stimmen, weil es einige Gründe geben könnte, dass die Amplitude von der Spinrichtung abhängt.) Wenn sich nun die Richtungen 1 und 2 einander nähern, wird die Gesamtamplitude in (4.44) null. Das Ergebnis für Fermi-Teilchen ist viel einfacher als für Bose-Teilchen. Es ist für zwei Fermi-Teilchen – zum Beispiel zwei Elektronen – unmöglich, in genau denselben Zustand zu gelangen. Sie werden niemals zwei Elektronen an demselben Ort mit ihren Spins in gleicher Richtung finden. Es ist für zwei Elektronen nicht möglich, denselben Impuls und dieselbe Spinrichtung zu haben. Wenn sie an demselben Ort sind oder denselben Bewegungszustand haben, dann müssen sie entgegengesetzte Spins haben. Was sind die Konsequenzen daraus? Es gibt eine Reihe von höchst merkwürdigen Effekten, die aus der Tatsache folgen, dass zwei Fermi-Teilchen nicht denselben Zustand einnehmen können. In der Tat hängen fast alle Eigenschaften der materiellen Welt von dieser bemerkenswerten Tatsache ab. Die Vielfalt, die sich im Periodensystem der Elemente darstellt, ist im Grunde eine Folge dieses einen Gesetzes. Natürlich können wir nicht sagen, wie die Welt aussähe, wenn diese eine Regel geändert würde, da sie eben ein Teil des gesamten quantenmechanischen Gebäudes ist. Es ist unmöglich zu sagen, was sich sonst noch ändern würde, wenn die Regel für Fermi-Teilchen anders wäre. Doch wir wollen uns zumindest überlegen, was geschehen würde, wenn nur diese eine Regel geändert würde. Zunächst können wir zeigen, dass alle Atome mehr oder weniger gleich wären. Beginnen wir mit dem Wasserstoffatom. Dieses würde nicht merklich beeinflusst. Das Proton des Kernes würde von einer kugelsymmetrischen Elektronenwelle umgeben sein, wie in Abbildung 4.11 (a) gezeigt. Wie wir in Kapitel 2 beschrieben haben, wird das Elektron zur Mitte hin angezogen, aber das Unbestimmtheitsprinzip fordert, dass ein Gleichgewicht zwischen der Konzentration im Raum und dem Impuls besteht. Das Gleichgewicht bedeutet, dass es eine bestimmte Energie und eine bestimmte Verbreiterung der Elektronenverteilung geben muss, die die charakteristischen Abmessungen des Wasserstoffatoms bestimmt. Nun nehmen wir an, dass wir einen Kern mit zwei Ladungseinheiten haben, also beispielsweise den Heliumkern. Dieser Kern würde zwei Elektronen anziehen, und wenn sie Bose-Teilchen wären, würden sie sich – abgesehen von ihrer elektrischen Abstoßung – beide so dicht wie möglich an den Kern herandrängen. Ein Heliumatom könnte so aussehen, wie in Teil (b) der Abbildung 4.11 gezeigt. Entsprechend hätte ein Lithiumatom mit einem dreifach geladenen Kern eine Elektronenverteilung wie die in Teil (c) der Abbildung 4.11. Jedes Atom würde mehr oder weniger gleich aussehen – eine kleine runde Kugel, bei der alle Elektronen dicht beim Kern sitzen, nichts Gerichtetes und nichts Kompliziertes.
68
4 Identische Teilchen
ein Elektron
+
zwei Elektronen
Kern
++
(a) drei Elektronen
(b)
+ ++ Abb. 4.11: Wie Atome aussehen würden, wenn sich Elektronen wie Bose-Teilchen verhielten.
(c)
Weil Elektronen jedoch Fermi-Teilchen sind, ist die tatsächliche Situation ganz anders. Beim Wasserstoffatom ist die Situation im Wesentlichen unverändert. Der einzige Unterschied besteht darin, dass das Elektron einen Spin hat, den wir durch den kleinen Pfeil in Abbildung 4.12 (a) kennzeichnen. Im Falle des Heliumatoms können wir jedoch die beiden Elektronen nicht aufeinandersetzen. Doch halt, dies gilt nur, wenn ihre Spins gleich sind. Zwei Elektronen können denselben Zustand besetzen, wenn ihre Spins entgegengesetzt sind. Daher sieht auch das Heliumatom nicht viel anders aus. Es würde wie in Abbildung 4.12 (b) erscheinen. Für Lithium wird die Situation jedoch ganz anders. Wo können wir das dritte Elektron unterbringen? Nicht bei den beiden anderen, weil beide Spinrichtungen schon besetzt sind. (Sie erinnern sich, dass es bei einem Elektron oder einem anderen Teilchen mit Spin 12 nur zwei mögliche Spinrichtungen gibt.) Das dritte Elektron kann an die Stelle, die die beiden anderen besetzen, nicht nahe herankommen, es muss daher eine besondere Lage in einem anderen Zustand weiter weg vom Spin ein Elektron +
(a)
zwei Elektronen
++
(b)
Kern
+ ++
(c) Abb. 4.12: Atomkonfiguration für reale Elektronen, die vom Fermi-Typ sind und den Spin 12 haben.
4.7 Das Ausschließungsprinzip
69
Kern in Teil (c) der Abbildung einnehmen. (Wir drücken uns hier sehr vereinfacht aus, da in Wirklichkeit alle drei Elektronen identisch sind. Da wir die Elektronen nicht wirklich unterscheiden können, gilt unser Bild nur näherungsweise.) Nun fangen wir an zu verstehen, warum die Elemente verschiedene chemische Eigenschaften haben. Weil das dritte Elektron im Lithium weiter außen ist, ist es weniger fest gebunden. Es ist viel leichter, ein Elektron aus einem Lithiumatom zu entfernen als aus einem Heliumatom. (Experimentell stellt man fest, dass man 25 Elektronenvolt braucht, um Helium zu ionisieren, aber nur 5 Elektronenvolt, um Lithium zu ionisieren.) Dies erklärt die Wertigkeit des Lithiumatoms. Die Richtungseigenschaften der Wertigkeit hängen mit den Moden des äußeren Elektrons zusammen, mit denen wir uns im Moment nicht beschäftigen wollen. Aber wir können schon die Bedeutung des so genannten Ausschließungsprinzips erkennen, welches besagt, dass zwei Elektronen nicht in genau demselben Zustand (Spin eingeschlossen) angetroffen werden können. Das Ausschließungsprinzip ist auch für die Stabilität der Materie im großen Maßstab verantwortlich. Wir haben bereits erklärt, dass die einzelnen Atome der Materie aufgrund des Unbestimmtheitsprinzips nicht kollabieren; aber dies erklärt nicht, warum man nicht zwei Wasserstoffatome beliebig dicht zusammendrücken kann – warum all die Protonen sich nicht dicht zusammenlagern mit einem großen Elektronenfleck darum. Die Antwort ist natürlich, dass sich die Wasserstoffatome voneinander fernhalten müssen, da nicht mehr als zwei Elektronen – mit entgegengesetzten Spins – an etwa der gleichen Stelle sein können. Daher ist die Stabilität der Materie im Großen tatsächlich eine Folge der Fermi-Teilchen-Natur der Elektronen. Wenn die äußeren Elektronen von zwei Atomen allerdings Spins in entgegengesetzten Richtungen haben, können sie natürlich nahe zusammenkommen. Auf diese Weise kommt die chemische Bindung zustande. Es stellt sich heraus, dass zwei Atome zusammen im Allgemeinen die niedrigste Energie haben, wenn sich ein Elektron zwischen ihnen befindet. Es ist eine Art elektrischer Anziehung der beiden positiven Kerne zu dem Elektron in der Mitte hin. Es ist auch möglich, zwei Elektronen mehr oder weniger zwischen die beiden Kerne zu setzen, solange ihre Spins entgegengesetzt sind, und dadurch kommt die stärkste chemische Bindung zustande. Es gibt keine stärkere Bindung, weil das Ausschließungsprinzip nicht mehr als zwei Elektronen im Raum zwischen den Atomen gestattet. Wir erwarten, dass das Wasserstoffmolekül mehr oder weniger wie in Abbildung 4.13 aussieht.
+
+ Abb. 4.13: Das Wasserstoffmolekül.
Wir möchten noch eine weitere Konsequenz des Ausschließungsprinzips erwähnen. Sie erinnern sich, dass, wenn im Heliumatom beide Elektronen nahe beim Kern sein sollen, ihre Spins notwendigerweise entgegengesetzt sind. Nun stellen wir uns vor, dass wir versuchen, beiden Elektronen denselben Spin zu geben. Zu diesem Zweck könnten wir zum Beispiel ein enorm starkes Magnetfeld anlegen, in der Hoffnung, dass dieses die Spins in dieselbe Richtung dreht. Aber dann könnten die beiden Elektronen nicht mehr denselben Zustand im Raum einnehmen. Eins von ihnen müsste eine andere räumliche Lage einnehmen, wie in Abbildung 4.14 angedeutet. Das Elektron, das sich weiter weg vom Kern befindet, hat eine kleinere Bindungsenergie.
70
4 Identische Teilchen
Die Energie des gesamten Atoms wird dadurch ein wenig erhöht. Mit anderen Worten, wenn die zwei Spins entgegengesetzt sind, gibt es eine viel stärkere Gesamtanziehung.
++
Abb. 4.14: Helium mit einem Elektron in einem höheren Energiezustand.
Es gibt offenbar eine enorme Kraft, die versucht, Spins entgegengesetzt zueinander einzustellen, wenn zwei Elektronen nahe beieinander sind. Wenn zwei Elektronen versuchen, denselben Platz einzunehmen, sind die Spins sehr stark bestrebt, sich entgegengesetzt auszurichten. Diese Kraft, die versucht, die beiden Spins entgegengesetzt zueinander auszurichten, ist sehr viel stärker als die geringe Kraft zwischen den beiden magnetischen Momenten der Elektronen. Sie erinnern sich: Als wir über den Ferromagnetismus sprachen, gab es das Rätsel, warum die Elektronen in verschiedenen Atomen die starke Bestrebung haben, sich parallel auszurichten. Obwohl es noch immer keine quantitative Erklärung dafür gibt, glaubt man doch, dass Folgendes geschieht: Die Elektronen um den Kern eines Atoms stehen durch das Ausschließungsprinzip in Wechselwirkung mit den ursprünglich äußeren Elektronen, die nun im Kristall frei beweglich geworden sind. Diese Wechselwirkung führt dazu, dass die Spins der freien und der inneren Elektronen entgegengesetzte Richtungen einnehmen. Aber die Spins der freien Elektronen und die der inneratomaren Elektronen können nur dann entgegengesetzt sein, wenn alle inneren Elektronen dieselbe Spinrichtung haben, wie in Abbildung 4.15 angedeutet. Der Ferromagnetismus scheint also eine Folge des Ausschließungsprinzips zu sein, das, indirekt über die freien Elektronen wirkend, die starken Ausrichtungskräfte entstehen lässt.
Abb. 4.15: Der wahrscheinliche Mechanismus in einem ferromagnetischen Kristall; das Leitungselektron ist antiparallel zu den nicht gepaarten inneren Elektronen.
Wir wollen ein weiteres Beispiel für die Konsequenzen des Ausschließungsprinzips geben. Wir haben bereits erwähnt, dass die Kernkräfte zwischen Neutron und Proton, zwischen Proton und Proton sowie zwischen Neutron und Neutron gleich sind. Warum können dann ein Proton und ein Neutron zusammenhaften, um einen Deuteriumkern zu bilden, während es keinen Kern gibt, der einfach aus zwei Protonen oder aus zwei Neutronen besteht? Das Deuteron ist mit einer
4.7 Das Ausschließungsprinzip
71
Energie von 2,2 Millionen Elektronenvolt gebunden, doch gibt es keine entsprechende Bindung zwischen einem Protonenpaar, die zur Bildung eines Heliumisotops mit dem Atomgewicht 2 führen würde. Solche Kerne existieren nicht. Die Kombination von zwei Protonen ergibt keinen gebundenen Zustand. Die Erklärung ergibt sich aus zwei Effekten: erstens aus dem Ausschließungsprinzip und zweitens aus der Tatsache, dass die Kernkräfte etwas empfindlich gegenüber der Spinrichtung sind. Die Kernkraft zwischen einem Neutron und einem Proton ist anziehend und etwas stärker, wenn die Spins parallel sind, als wenn sie entgegengesetzt sind. Zufällig sind diese Kräfte gerade so unterschiedlich, dass ein Deuteron nur dann gebildet werden kann, wenn das Neutron und das Proton parallele Spins haben; wenn ihre Spins entgegengesetzt sind, ist die Anziehung nicht ausreichend, um sie zu binden. Da die Spins vom Neutron wie auch vom Proton 12 sind und die gleiche Richtung haben, hat das Deuteron den Spin eins. Wir wissen jedoch, dass zwei Protonen nicht aufeinander sitzen dürfen, wenn ihre Spins parallel sind. Ohne das Ausschließungsprinzip würden sich zwei Protonen verbinden; aber da sie nicht an demselben Ort mit denselben Spinrichtungen sein können, gibt es keinen He2 -Kern. Die Protonen könnten natürlich mit entgegengesetztem Spin zusammenkommen, aber dann wäre die Bindung nicht stark genug, um einen stabilen Kern zu bilden, weil die Kernkräfte bei entgegengesetzten Spins zu schwach sind, um ein Nukleonenpaar zu binden. Die anziehende Kraft zwischen Neutron und Proton mit entgegengesetzten Spins kann in Streuversuchen beobachtet werden. Ähnliche Streuversuche mit zwei Protonen mit parallelen Spins zeigen, dass es dort die entsprechende Anziehung ebenfalls gibt. Somit ist das Ausschließungsprinzip die Erklärung, warum Deuterium existieren kann, He2 dagegen nicht.
5
Spin eins
Siehe auch: Band IV, Kapitel 6, Paramagnetismus und magnetische Resonanz.
5.1
Das Filtern von Atomen mit einem Stern-Gerlach-Apparat
In diesem Kapitel beginnen wir nun wirklich mit der eigentlichen Quantenmechanik – das heißt, wir werden ein quantenmechanisches Phänomen auf vollständig quantenmechanische Art beschreiben. Wir wollen keine Ausflüchte mehr machen und nicht versuchen, Verbindungen zur klassischen Mechanik zu finden. Wir wollen über etwas Neues in einer neuen Sprache sprechen. Die spezielle Situation, die wir beschreiben werden, ist das Verhalten der so genannten Quantisierung des Drehimpulses für ein Teilchen mit Spin eins. Aber wir wollen vorläufig keine Wörter wie „Drehimpuls“ oder andere Begriffe der klassischen Mechanik benutzen. Wir haben dieses spezielle Beispiel gewählt, weil es relativ einfach, aber wiederum nicht zu einfach ist. Es ist hinreichend kompliziert, um als Prototyp zu dienen, der zur Beschreibung aller quantenmechanischen Phänomene verallgemeinert werden kann. Obwohl wir nur ein konkretes Beispiel behandeln, können doch alle Gesetze, die wir erwähnen, sofort verallgemeinert werden, und wir werden die Verallgemeinerungen angeben, damit Sie die Grundzüge der quantenmechanischen Beschreibung erkennen. Wir beginnen mit dem Phänomen der Aufspaltung eines Atomstrahls in drei getrennte Strahlen in einem Stern-Gerlach-Experiment. Wenn wir einen Apparat mit einem inhomogenen Magnetfeld betrachten, das von einem Magneten mit spitzem Pol erzeugt wird, und einen Teilchenstrahl durch diesen Apparat senden, so kann dieser Teilchenstrahl, wie Sie sich erinnern werden, in mehrere Strahlen aufgespalten werden. Die Anzahl der Strahlen hängt dabei von der speziellen Atomsorte und dem Zustand der Atome ab. In unserem Fall nehmen wir ein Atom, das drei Strahlen ergibt, und wir werden es ein Teilchen mit Spin eins nennen. Sie können für sich den Fall von fünf Strahlen, sieben Strahlen usw. annehmen – Sie schreiben einfach alles ab, und wo wir drei Terme haben, werden Sie fünf oder sieben Terme usw. erhalten. Atomstrahl
∇B
z y
Abb. 5.1: In einem Stern-Gerlach-Experiment werden Atome mit Spin eins in drei Strahlen aufgespalten.
74
5 Spin eins
Der beschriebene Stern-Gerlach-Apparat ist in Abbildung 5.1 schematisch gezeichnet. Ein Strahl von Atomen (oder Teilchen beliebiger Art) wird durch einige Spalte kollimiert und geht durch ein inhomogenes Feld. Wir nehmen an, dass der Strahl in die y-Richtung geht und dass das magnetische Feld und sein Gradient beide in z-Richtung verlaufen. Bei seitlicher Betrachtung werden wir dann erkennen, dass sich der Strahl vertikal in drei Strahlen aufspaltet, wie in der Abbildung gezeigt. Nun könnten wir an die Ausgangsseite des Magneten kleine Zähler stellen, die die ankommenden Teilchen in jedem der drei Strahlen zählen. Oder wir können zwei der Strahlen ausblenden und nur den dritten weiterlaufen lassen. Nehmen wir an, wir würden die unteren beiden Strahlen ausblenden und nur den obersten Strahl weiterlaufen und in einen zweiten, gleichartigen Stern-Gerlach-Apparat eintreten lassen, wie in Abbildung 5.2 gezeigt. Was geschieht? Es gibt keine drei Strahlen im zweiten Apparat; es gibt nur den oberen Strahl.1 Dies erwartet man auch, wenn man sich den zweiten Apparat einfach als Verlängerung des ersten vorstellt. Diejenigen Atome, die schon im ersten Apparat nach oben abgelenkt werden, werden im zweiten Apparat noch weiter nach oben abgelenkt. ∇B ∇B
Abb. 5.2: Die Atome aus einem der Strahlen werden in einen zweiten, identischen Apparat geschickt.
Sie können daraus ersehen, dass der erste Apparat einen Strahl „bereinigter“ Objekte erzeugt hat – einen Strahl aus Atomen, die in dem speziellen inhomogenen Feld nach oben abgelenkt werden. Wenn die Atome in den ersten Stern-Gerlach-Apparat eintreten, bestehen sie aus drei „Sorten“, und diese drei Sorten nehmen verschiedene Wege. Wenn wir alle Sorten bis auf eine ausfiltern, können wir einen Strahl erzeugen, dessen künftiges Verhalten in einem gleichartigen Apparat vorherbestimmt und vorhersagbar ist. Wir können ihn einen gefilterten Strahl nennen oder einen polarisierten Strahl oder einen Strahl, von dem man weiß, dass alle Atome in einem bestimmten Zustand sind. Für den weiteren Verlauf unserer Diskussion wird es bequemer sein, wenn wir einen etwas abgeänderten Apparat vom Stern-Gerlach-Typ betrachten. Der Apparat sieht auf den ersten Blick komplizierter aus, aber er wird die weitere Erörterung vereinfachen. Es kostet jedenfalls nichts, den Aufbau komplizierter zu gestalten, da es sich nur um ein „Gedankenexperiment“ handelt. (Es hat, nebenbei gesagt, noch niemand alle Experimente, die wir beschreiben werden, genau in dieser Weise durchgeführt. Wir wissen aber aus den Gesetzen der Quantenmechanik, die sich natürlich auf andere ähnliche Experimente gründen, was passieren würde. Diese anderen Experimente sind für den Anfang schwieriger zu verstehen, wir wollen daher einige idealisierte – aber mögliche – Experimente beschreiben.) In Abbildung 5.3 (a) ist der „abgeänderte Stern-Gerlach-Apparat“ skizziert, den wir benutzen möchten. Er besteht aus einer Folge von drei stark ablenkenden Magneten. Der erste (auf der linken Seite) ist einfach der normale Stern-Gerlach-Apparat, und er spaltet den einfallenden Strahl von Spin-eins-Teilchen in drei getrennte Strahlen auf. Der zweite Apparat hat densel1
Wir nehmen an, dass die Ablenkungswinkel sehr klein sind.
5.1 Das Filtern von Atomen mit einem Stern-Gerlach-Apparat
S
A
N
z
75
N
S
S
N
B
y
(a)
+ A (b)
0
z y
B
−
Abb. 5.3: (a) Eine gedachte Änderung eines Stern-Gerlach-Apparates. (b) Die Wege der Spin-einsAtome.
ben Querschnitt wie der erste, ist aber doppelt so lang und die Polarität seines magnetischen Feldes ist dem Feld im ersten Apparat entgegengesetzt. Der zweite Apparat lenkt die atomaren Magnete in entgegengesetzter Richtung ab und führt sie zur Achse zurück, wie die im unteren Teil der Abbildung gezeichneten Flugbahnen zeigen. Der dritte Apparat ist genau wie der erste und bringt die drei Strahlen zueinander zurück, sodass sie alle drei längs der Achse das Ausgangsloch verlassen. Schließlich wollen wir uns vorstellen, dass sich vor dem Loch bei A ein Mechanismus befindet, der die Atome aus der Ruhelage beschleunigt, und dass sich hinter dem Ausgangsloch bei B ein Bremsmechanismus befindet, der die Atome bei B wieder zum Stillstand bringt. Diese Annahme ist für die Physik nicht wesentlich; sie bedeutet einfach, dass wir uns in unserer Rechnung nicht um irgendwelche Bewegungseffekte beim Austritt der Atome kümmern müssen und uns auf die Abläufe konzentrieren können, die nur mit dem Spin zu tun haben. Der ganze Zweck des „verbesserten“ Apparates besteht darin, dass wir alle Teilchen an derselben Stelle mit der Geschwindigkeit null erhalten. Wenn wir nun ein Experiment wie das in Abbildung 5.2 durchführen wollen, können wir zuerst einen gefilterten Strahl herstellen, indem wir in die Mitte des Apparates eine Platte stellen, die zwei der Strahlen ausblendet, wie in Abbildung 5.4 gezeigt. Wenn wir nun die polarisierten Atome durch einen zweiten gleichartigen Apparat schicken, werden alle Atome den oberen Weg nehmen. Man kann dies nachweisen, indem man den einzelnen Strahlen im zweiten S -Filter Platten in den Weg stellt und beobachtet, ob noch Teilchen hindurchkommen.
76
5 Spin eins
+
z
0
+ 0
−
− S
S
y Abb. 5.4: Der „verbesserte“ Stern-Gerlach-Apparat als ein Filter.
Bezeichnen wir den ersten Apparat mit S . (Wir werden alle möglichen Kombinationen betrachten und benötigen deshalb geeignete Bezeichnungen, um die Übersicht zu behalten.) Wir sagen, dass die Atome, die den oberen Weg in S nehmen, im „Plus-Zustand bezüglich S “ sind; die Atome, die den mittleren Weg nehmen, sind im „Null-Zustand bezüglich S “; und die Atome, die den unteren Weg nehmen, sind im „Minus-Zustand bezüglich S “. (In der gebräuchlichen Terminologie würden wir sagen, dass die z-Komponente des Drehimpulses +1, 0 und −1 ist, aber wir benutzen diese Sprechweise jetzt nicht.) Nun ist in Abbildung 5.4 der zweite Apparat genauso angeordnet wie der erste, sodass alle gefilterten Atome den oberen Weg nehmen. Oder wenn wir im ersten Apparat den oberen und unteren Strahl ausgeblendet hätten und nur den Null-Zustand durchgehen ließen, dann würden alle gefilterten Atome im zweiten Apparat den mittleren Weg nehmen; und wenn wir im ersten Apparat alle Strahlen bis auf den untersten ausgeblendet hätten, dann gäbe es auch im zweiten Apparat nur den untersten Strahl. Wir können sagen, dass unser erster Apparat in jedem Falle einen gefilterten Strahl erzeugt hat, der bezüglich S in einem reinen Zustand (+, 0 oder −) ist. Welcher Zustand vorliegt, können wir nachprüfen, indem wir die Atome durch einen zweiten, gleichartigen Apparat schicken. Unseren zweiten Apparat können wir nun so einrichten, dass er nur Atome eines einzelnen Zustandes durchlässt – wir stellen innen Masken auf, wie wir es beim ersten getan haben –, dann können wir den Zustand des einfallenden Strahls überprüfen, indem wir beobachteten, ob irgendetwas am anderen Ende herauskommt. Wenn wir zum Beispiel im zweiten Apparat von Abbildung 5.4 die unteren beiden Wege versperren, kommen immer noch 100 % der Atome hindurch, aber wenn wir den oberen Weg versperren, kommt nichts hindurch. Um diese Art der Diskussion einfacher zu gestalten, führen wir eine Symbolik ein, die einen unserer verbesserten Stern-Gerlach-Apparate darstellen soll. Das Symbol + 0 − S
(5.1)
soll für einen vollständigen Stern-Gerlach-Apparat stehen. (Dies ist kein Symbol, das Sie irgendwo anders in der Quantenmechanik finden werden, wir haben es nur für dieses Kapitel eingeführt. Es soll nur eine kompakte Darstellung des Apparates von Abbildung 5.3 sein.) Da wir gleichzeitig mehrere Apparate mit verschiedenen Orientierungen benutzen werden, werden wir jeden mit einem darunterstehenden Buchstaben bezeichnen. Das Symbol in (5.1) steht also für den Apparat S . Wenn wir im Inneren des Apparates einen oder mehrere Strahlen aus-
5.1 Das Filtern von Atomen mit einem Stern-Gerlach-Apparat
77
blenden, werden wir dies durch vertikale Balken kennzeichnen, die anzeigen, welcher Strahl gesperrt ist: + 0 . − S
(5.2)
Die möglichen Kombinationen, die wir benutzen werden, sind in Abbildung 5.5 gezeigt. + 0 −
=
+ 0 −
=
+ 0 −
=
+ 0 −
=
(a)
(b)
(c)
Abb. 5.5: Spezielle Symbolik für Filter vom Stern-Gerlach-Typ.
(d)
Wenn wir zwei aufeinanderfolgende Filter (wie in Abbildung 5.4) verwenden, werden wir die beiden Symbole nebeneinander setzen: + 0 − S
+ 0 − S
(5.3)
Bei diesem Aufbau geht alles, was durch das erste Filter kommt, auch durch das zweite. Selbst wenn wir den „Null-“ und den „Minus-“ Kanal des zweiten Apparates versperren, sodass gilt + 0 − S
+ 0 , − S
(5.4)
haben wir im zweiten Apparat immer noch 100 % Durchlass. Wenn wir dagegen + 0 − S
+ 0 , − S
(5.5)
78
5 Spin eins
haben, kommt am anderen Ende überhaupt nichts heraus. Ebenso kommt bei + + 0 0 − − S S nichts heraus. Die Kombination + + 0 0 − − S S ist hingegen das Gleiche wie + 0 . − S
(5.6)
(5.7)
Wir wollen nun diese Experimente quantenmechanisch beschreiben. Wir sagen, dass ein Atom im (+S )-Zustand ist, wenn es durch den Apparat der Abbildung 5.5 (b) gegangen ist. Wir sagen, dass es in einem (0 S )-Zustand ist, wenn es durch (c) gegangen ist, und in einem (−S )-Zustand, wenn es durch (d) gegangen ist.2 Dann sei � b | a � die Amplitude, dass ein Atom, welches sich im Zustand a befindet, durch einen Apparat geht und im Zustand b herauskommt. Wir können sagen, � b | a � ist die Amplitude dafür, dass ein Atom im a-Zustand in den b-Zustand übergeht. Das Experiment gemäß (5.4) ergibt � +S | +S � = 1 ,
während das Experiment (5.5) � −S | +S � = 0 .
ergibt. Weiterhin ist das Ergebnis des Experiments (5.6) � +S | −S � = 0
und des Experiments (5.7)
� −S | −S � = 1 .
Solange wir uns nur mit „reinen“ Zuständen befassen – das heißt, wenn nur ein einziger Kanal geöffnet ist –, gibt es neun solche Amplituden, und wir können sie in einer Tabelle anordnen
nach
+S 0S −S
+S
von 0S
1 0 0
0 1 0
−S 0 0 1
(5.8)
Diese Anordnung von neun Zahlen – Matrix genannt – fasst die Experimente, die wir beschrieben haben, zusammen. 2
Lies: (+S ) = „Plus-S “; (0 S ) = „Null-S “; (−S ) = „Minus-S “.
5.2 Experimente mit gefilterten Atomen
5.2
79
Experimente mit gefilterten Atomen
Nun kommt die große Frage: Was geschieht, wenn der zweite Apparat um einen Winkel gekippt wird, sodass seine Feldachse nicht mehr parallel zu der des ersten Apparats ist? Er könnte auch nicht nur gekippt sein, sondern in eine völlig andere Richtung zeigen – er könnte zum Beispiel den Strahl in einem Winkel von 90◦ zur ursprünglichen Richtung aufnehmen. Um es zuerst einmal leicht zu machen, denken wir uns eine Anordnung, bei der der zweite Stern-GerlachApparat um einen Winkel α um die y-Achse gekippt ist, wie in Abbildung 5.6 gezeigt. Wir wollen den zweiten Apparat T nennen. Angenommen, wir führen jetzt das folgende Experiment durch: + + 0 0 − − S T oder das Experiment: + 0 − S
+ 0 − T
Was kommt in diesen Fällen am anderen Ende heraus? α
z
S y
T
Abb. 5.6: Zwei Filter vom Stern-Gerlach-Typ in Serie; das zweite Filter ist in Bezug auf das erste um den Winkel α um die y-Achse gekippt.
Die Antwort lautet wie folgt: Wenn die Atome bezüglich S in einem bestimmten Zustand sind, dann sind sie bezüglich T nicht in demselben Zustand – ein (+S )-Zustand ist nicht gleichzeitig ein (+T )-Zustand. Es gibt jedoch eine gewisse Amplitude, das Atom in einem (+T )-Zustand – oder in einem (0 T )-Zustand oder in einem (−T )-Zustand – vorzufinden. Mit anderen Worten: Obwohl wir uns sorgfältig vergewissert haben, dass wir das Atom in einem bestimmten Zustand erhalten, muss es sich doch beim Durchgang durch einen Apparat, der um einen Winkel gekippt ist, „reorientieren“ – was es, nicht zu vergessen, zufällig tut. Zu einem Zeitpunkt können wir nur ein Teilchen hindurchschicken, und dann können wir nur fragen: Wie groß ist die Wahrscheinlichkeit, dass es hindurchkommt? Einige der Atome, die durch S gegangen sind, werden in einem (+T )-Zustand enden, einige von ihnen werden in einem (0 T )- und einige in einem (−T )-Zustand enden – alle mit verschiedenen Wahrscheinlichkeiten. Diese Wahrscheinlichkeiten können jeweils aus dem Absolutquadrat der komplexen Amplituden berechnet werden. Was wir wollen, ist eine mathematische Methode oder eine quantenmechanische Beschreibung für diese Amplituden. Was wir wissen müssen, sind die einzelnen Größen wie � −T | +S � ,
80
5 Spin eins
womit wir die Amplitude meinen, dass ein Atom, das ursprünglich im (+S )-Zustand war, in den (−T )-Zustand übergeht. (Diese Amplitude ist nicht null, solange T und S nicht parallel zueinander sind.) Es gibt andere Amplituden wie � +T | 0 S �
oder
� 0 T | −S �
usw.
Es gibt tatsächlich neun solche Amplituden – eine weitere Matrix –, deren Berechnung aus der Quantenmechanik hervorgehen sollte. So wie man aus F = ma berechnen kann, wie sich ein klassisches Teilchen unter gegebenen Umständen verhält, so gestatten uns die Gesetze der Quantenmechanik, die Amplitude zu bestimmen, dass ein Teilchen durch einen gewissen Apparat geht. Das zentrale Problem besteht dann darin – für einen Winkel α oder eine sonstige Orientierung –, die folgenden neun Amplituden zu berechnen: � +T | +S � � 0 T | +S � � −T | +S �
� +T | 0 S � �0T |0S � � −T | 0 S �
� +T | −S � , � 0 T | −S � , � −T | −S � .
(5.9)
Wir können bereits eine Beziehung zwischen diesen Amplituden angeben. Zunächst einmal ist gemäß unserer Definition das Absolutquadrat | � +T | +S � |2 gleich der Wahrscheinlichkeit, dass ein Atom aus einem (+S )-Zustand in einen (+T )-Zustand übergeht. Es wird oft bequemer sein, solche Quadrate in der äquivalenten Form � +T | +S � � +T | +S �∗ zu schreiben. In dieser Notation ist die Zahl � 0 T | +S � � 0 T | +S �∗ die Wahrscheinlichkeit, dass ein Teilchen aus dem (+S )-Zustand in den (0 T )-Zustand übergeht, und � −T | +S � � −T | +S �∗ ist die Wahrscheinlichkeit, dass es in den (−T )-Zustand übergeht. Aufgrund der Bauweise unserer Apparate muss aber jedes Atom, das in den T -Apparat im (+S )-Zustand hineingeht, in einem der drei Zustände des T -Apparates gefunden werden – es gibt für eine vorgegebene Atomart keine Ausweichmöglichkeit. Daher muss die Summe der drei Wahrscheinlichkeiten, die wir gerade aufgeschrieben haben, gleich 1 sein. Wir erhalten die Gleichung � +T | +S � � +T | +S �∗ + � 0 T | +S � � 0 T | +S �∗ + � −T | +S � � −T | +S �∗ = 1 .
(5.10)
Es gibt natürlich zwei weitere solche Gleichungen. Wir erhalten sie, wenn wir von einem (0 S )bzw. einem (−S ) -Zustand ausgehen. Das ist aber auch schon alles, was wir leicht angeben können; wir wollen daher zu einigen anderen allgemeinen Fragen übergehen.
5.3 Stern-Gerlach-Filter in Serie
5.3
81
Stern-Gerlach-Filter in Serie
Interessant ist die folgende Frage: Angenommen, wir haben Atome in den (+S )-Zustand gefiltert, dann schicken wir sie durch ein zweites Filter, sagen wir in einen (0 T )-Zustand, und dann durch ein weiteres +S -Filter. (Wir wollen das letzte Filter S � nennen, um es vom ersten S -Filter unterscheiden zu können.) Werden sich die Atome daran erinnern, dass sie schon einmal in einem (+S )-Zustand waren? Wir betrachten also das Experiment + + + (5.11) 0 0 0 − − − S S� T und möchten wissen, ob alle Atome, die aus T herauskommen, auch durch S � gehen. Sie tun es nicht. Wenn sie einmal von T gefiltert worden sind, erinnern sie sich in keiner Weise daran, dass sie schon einmal in einem (+S )-Zustand waren, als sie in T eintraten. Man beachte, dass der zweite S -Apparat in (5.11) genauso orientiert ist wie der erste, sodass er immer noch ein Filter vom S -Typ ist. Die Zustände, die von S � ausgefiltert werden, sind natürlich noch (+S ), (0 S ) und (−S )-Zustände. Der wichtige Punkt ist folgender: Wenn das T-Filter nur einen Strahl durchlässt, dann hängt der Anteil, der durch das zweite S -Filter geht, nur vom Aufbau des T -Filters ab und ist von der Vorgeschichte vollkommen unabhängig. Die Tatsache, dass dieselben Atome schon einmal von einem S -Filter sortiert worden sind, hat keinerlei Einfluss auf das, was sie tun werden, wenn sie danach von einem T -Apparat zu einem reinen Strahl aussortiert werden. Von da an besteht dieselbe Wahrscheinlichkeit, in verschiedene Zustände zu gelangen, ganz gleich, was geschah, bevor sie in den T -Apparat kamen. Als Beispiel wollen wir das Experiment von (5.11) mit dem Experiment + + + 0 0 0 − − − S S� T
(5.12)
vergleichen, in dem nur das erste S -Filter geändert ist. Der Winkel α (zwischen S und T ) sei derart, dass im Experiment (5.11) ein Drittel der Atome, die durch T gehen, auch durch S � gehen. Obwohl im Experiment (5.12) im Allgemeinen eine andere Anzahl von Atomen durch T kommen wird, wird derselbe Anteil von diesen – ein Drittel – auch durch S � gehen. Wir können tatsächlich aus unseren vorherigen Überlegungen herleiten, dass der Anteil der Atome, die aus T kommen und durch irgendein spezielles S � gehen, nur von T und S � abhängt und nicht von irgendetwas, was vorher geschah. Vergleichen wir das Experiment (5.12) mit + + + (5.13) 0 0 0 . − − − S S� T Die Amplitude, dass ein Atom, das aus S kommt, sowohl durch T als auch durch S � geht, ist im Experiment von (5.12) � +S | 0 T � � 0 T | 0 S � .
82
5 Spin eins
Die entsprechende Wahrscheinlichkeit ist | � +S | 0 T � � 0 T | 0 S � |2 = | � +S | 0 T � |2 | � 0 T | | 0 S � |2 . Die Wahrscheinlichkeit für das Experiment (5.13) ist | � 0 S | 0 T � � 0 T | 0 S � |2 = | � 0 S | 0 T � |2 | � 0 T | 0 S � |2 . Das Verhältnis der Wahrscheinlichkeiten von (5.13) zu (5.12) ist | � 0 S | 0 T � |2 | � +S | 0 T � |2 und hängt nur von T und S � ab und überhaupt nicht davon, welcher der Strahlen (+S ), (0 S ) oder (−S ) von S ausgewählt wurde. (Die absoluten Zahlen können natürlich gemeinsam schwanken. Das hängt davon ab, wie viel durch T geht.) Natürlich erhalten wir das gleiche Ergebnis, wenn wir die Wahrscheinlichkeiten vergleichen, dass die Atome in den Plus- oder Minus-Zustand bezüglich S � gehen, oder das Verhältnis der Wahrscheinlichkeiten, in den Null- oder MinusZustand zu gehen. Da diese Verhältnisse tatsächlich nur davon abhängen, welchen Strahl man durch T gehen lässt, und nicht von der Auswahl, die das erste S -Filter trifft, ist es klar, dass man dasselbe Ergebnis auch dann erhalten würde, wenn der letzte Apparat kein S -Filter wäre. Wenn wir als dritten Apparat – den wir jetzt R nennen wollen – einen Apparat benutzen, der um einen beliebigen Winkel bezüglich T gedreht ist, würden wir feststellen, dass ein Verhältnis wie | � 0 R | 0 T � |2 | � +R | 0 T � |2 unabhängig davon ist, welchen Strahl das erste S -Filter durchlässt.
5.4
Basiszustände
Diese Ergebnisse veranschaulichen eines der Grundprinzipien der Quantenmechanik: Jedes atomare System kann durch einen Filterungsprozess in einen Satz von so genannten Basiszuständen aufgespalten werden, und das zukünftige Verhalten der Atome in jedem gegebenen Basiszustand hängt nur von der Art des Basiszustandes ab – es ist unabhängig von jeglicher Vorgeschichte.3 Die Basiszustände hängen natürlich von dem benutzten Filter ab; die drei Zustände (+T ), (0 T ) und (−T ) sind zum Beispiel ein Satz von Basiszuständen; die drei Zustände (+S ), (0 S ) und (−S ) sind ein weiterer. Es gibt beliebig viele Möglichkeiten, eine ist so gut wie die andere. Wir sollten vorsichtshalber sagen, dass wir gute Filter betrachten, die tatsächlich „reine“ Strahlen erzeugen. Wenn unser Stern-Gerlach-Apparat zum Beispiel keine gute Aufspaltung der drei Strahlen erzeugt hat, sodass wir sie mit unseren Masken nicht sauber trennen können, dann können wir keine vollständige Aufspaltung in Basiszustände erreichen. Wir können sagen, ob reine Basiszustände vorliegen, wenn wir beobachten, ob die Strahlen in einem anderen gleichartigen 3
In das Wort „Basiszustand“ sollte nicht mehr hineingelegt werden als das, was hier gesagt wurde. Man darf sich die Basiszustände nicht in irgendeinem Sinn als „grundlegend“ vorstellen. Das Wort Basis bezieht sich darauf, dass diese Zustände die Basis der Beschreibung bilden, ähnlich wie man von Zahlen zur Basis zehn spricht.
5.4 Basiszustände
83
Filter noch einmal aufgespalten werden. Wenn wir zum Beispiel mit einem reinen (+T )-Zustand starten, gehen alle Atome durch + 0 − T und keines geht durch + 0 − T oder durch + 0 . − T Unsere Feststellung über Basiszustände bedeutet, dass es möglich ist, reine Zustände auszufiltern, sodass mit einem gleichartigen Apparat keine weitere Filterung mehr möglich ist. Wir müssen auch hervorheben, dass unsere Aussage nur in idealisierten Situationen exakt gilt. In jedem realen Stern-Gerlach-Apparat müssten wir die Beugung an den Spalten berücksichtigen, die dazu führt, dass einige Atome in Zustände übergehen, die anderen Winkeln entsprechen, oder wir müssten prüfen, ob die Strahlen Atome unterschiedlicher Anregung ihrer inneren Zustände enthalten, und so weiter. Wir haben die Situation so stark idealisiert, dass wir nur über Zustände sprechen, die in einem magnetischen Feld aufgespalten werden; Effekte, die mit Ort, Impuls, innerer Anregung und Ähnlichem zu tun haben, beachten wir nicht. Im Allgemeinen müsste man auch die Basiszustände betrachten, die im Hinblick auf diese Effekte aussortiert werden. Um aber die Beschreibung einfach zu halten, betrachten wir nur unseren Satz von drei Zuständen, der für die genaue Beschreibung der idealisierten Situation genügt, in der die Atome beim Durchgang durch den Apparat nicht aufgerissen oder auf andere Art schlecht behandelt werden und zum Stillstand kommen, wenn sie den Apparat verlassen. Sie werden bemerkt haben, dass wir unsere Gedankenexperimente immer mit einem Filter beginnen, bei dem nur ein Kanal geöffnet ist, sodass wir mit einem bestimmten Basiszustand anfangen. Wir tun dies, weil die Atome aus einem Ofen in verschiedenen Zuständen herauskommen, die zufällig durch die Geschehnisse innerhalb des Ofens bestimmt sind. (Der Ofen erzeugt einen so genannten „unpolarisierten“ Strahl.) Diese Zufälligkeit führt zu Wahrscheinlichkeiten der „klassischen“ Art – wie beim Münzwurf –, die sich von den quantenmechanischen Wahrscheinlichkeiten, mit denen wir uns jetzt befassen, unterscheiden. Die Behandlung eines unpolarisierten Strahls würde uns zusätzliche Schwierigkeiten bereiten, die wir besser so lange vermeiden, bis wir das Verhalten von polarisierten Strahlen verstanden haben. Denken Sie daher erst einmal nicht darüber nach, was passiert, wenn der erste Apparat mehr als einen Strahl durchlässt. (Am Ende des Kapitels werden Sie erfahren, wie Sie solche Fälle behandeln können.)
84
5 Spin eins
Schauen wir uns nun an, was passiert, wenn wir von einem Basiszustand eines Filters zu einem Basiszustand eines anderen Filters übergehen. Wir beginnen wieder mit + + 0 0 . − − S T Die Atome, die aus T kommen, sind im Basiszustand (0 T ) und „wissen“ nicht mehr, dass sie schon einmal im Zustand (+S ) waren. Man könnte meinen, dass bei der Filterung durch T „die Information“ über den früheren Zustand (+S ) „verloren gegangen“ ist, weil die Atome „gestört“ wurden, als sie im Apparat T in drei Strahlen aufgeteilt wurden. Aber das ist nicht richtig. Die Information ist nicht wegen der Aufteilung in drei Strahlen verloren gegangen, sondern wegen der sperrenden Masken, die eingesetzt wurden. Dies könnnen wir aus der folgenden Versuchsreihe ersehen. Wir beginnen mit einem +S -Filter und wollen die Anzahl der durchkommenden Atome N nennen. Wenn wir diesem ein 0 T -Filter folgen lassen, dann ist die Anzahl der Atome, die herauskommen, ein gewisser Anteil der ursprünglichen Anzahl, sagen wir αN. Wenn wir dann noch ein +S -Filter aufstellen, wird nur ein Anteil β dieser Atome bis zum Ende gelangen. Wir können dies auf folgende Weise schreiben: + + + βαN N αN −→ 0 −→ 0 −→ . (5.14) 0 − − − S S� T Wenn unser dritter Apparat S � einen anderen Zustand, sagen wir den (0 S )-Zustand, auswählen würde, käme ein anderer Anteil, sagen wir γ, hindurch.4 Wir würden erhalten + + + γαN N αN −→ 0 −→ 0 −→ . (5.15) 0 − − − S S� T Nun nehmen wir an, wir wiederholen diese beiden Experimente, entfernen aber alle Masken aus T . Wir würden dann die folgenden bemerkenswerten Ergebnisse erhalten: + + + N N N −→ 0 −→ 0 −→ , 0 − − − S� S T + + + N N 0 −→ 0 −→ 0 −→ . 0 − − − S S� T
(5.16)
(5.17)
Im ersten Fall gehen alle Atome durch S � , aber im zweiten Fall keines! Dies ist ein wichtiges Gesetz der Quantenmechanik. Dass sich die Natur so verhält, ist nicht selbstverständlich, entspricht aber in unserer idealisierten Situation dem quantenmechanischen Verhalten, das in unzähligen Versuchen beobachtet wurde. 4
In unserer früheren Notation: α = | � 0 T | +S � |2 , β = | � +S | 0 T � |2 und γ = | � 0 S | 0 T � |2 .
5.5 Interferierende Amplituden
5.5
85
Interferierende Amplituden
Wie kommt es, dass beim Übergang von (5.15) nach (5.17) – wenn wir mehr Kanäle öffnen – weniger Atome durchgelassen werden? Dies ist das alte, tiefe Geheimnis der Quantenmechanik – die Interferenz der Amplituden. Es gleicht dem, was wir anfangs beim Interferenzversuch mit Elektronen an zwei Spalten gesehen haben. Wir haben gesehen, dass wir an manchen Stellen weniger Elektronen erhalten, wenn beide Spalte offen sind, als wenn nur ein Spalt offen ist. Quantitativ sieht das folgendermaßen aus. Wir können die Amplitude, dass ein Atom durch T und S � im Experiment (5.17) geht, als Summe von drei Amplituden schreiben, wobei jede für einen der drei Strahlen in T gilt; die Summe ist gleich null: � 0 S | +T � � +T | +S � + � 0 S | 0 T � � 0 T | +S � + � 0 S | −T � � −T | +S � = 0 .
(5.18)
Keine der drei einzelnen Amplituden ist null – das Absolutquadrat der zweiten Amplitude ist zum Beispiel γα, siehe (5.15) – aber die Summe ist null. Dieselbe Antwort würden wir auch erhalten, wenn S � den (−S )-Zustand auswählen würde. In der Anordnung von (5.16) ist das Ergebnis jedoch anders. Wenn wir in diesem Fall die Amplitude, durch T und S � zu gehen, a nennen, erhalten wir5 a = � +S | +T � � +T | +S � + � +S | 0 T � � 0 T | +S � + � +S | −T � � −T | +S � = 1 .
(5.19)
Im Experiment (5.16) wurde der Strahl aufgespalten und wieder zusammengeführt. „Humpty Dumpty“6 wurde wieder zusammengesetzt. Die Information über den ursprünglichen (+S )Zustand bleibt erhalten – es ist so, als wäre der T -Apparat überhaupt nicht da. Dies gilt, ganz gleich was man hinter den „weit geöffneten“ T -Apparat stellt. Wir könnten ihm ein R-Filter – ein Filter, das in irgendeinem Winkel steht – oder was immer wir möchten folgen lassen. Die Antwort wird immer so aussehen, als ob die Atome direkt aus dem ersten S -Filter kämen. Daher ist dies das wichtige Prinzip: Ein T -Filter – oder irgendein Filter – mit weit geöffneten Masken bewirkt überhaupt keine Änderung. Wir sollten eine zusätzliche Bedingung angeben. Das weit offene Filter muss nicht nur alle drei Strahlen durchlassen, sondern es darf auch keine unterschiedliche Störung der drei Strahlen verursachen. Es sollte zum Beispiel im Apparat kein starkes elektrisches Feld geben, das nur in der Nähe eines Strahles und nicht bei den anderen ist. Das hat folgenden Grund: Selbst wenn diese zusätzliche Störung alle Atome durch das Filter ließe, könnte sie doch die Phasen von einigen Amplituden ändern. Dann würde die Überlagerung verändert und die Amplituden in (5.18) und (5.19) wären verschieden. Wir werden immer annehmen, dass es keine solchen zusätzlichen Störungen gibt. Wir notieren die Gleichungen (5.18) und (5.19) noch einmal in einer verbesserten Notation. Wenn wir für die drei Zustände (+T ), (0 T ) und (−T ) die Variable i einführen, dann können die Gleichungen geschrieben werden als � 0 S | i � � i | +S � = 0 (5.20) alle i
5
6
Wir können eigentlich nicht aus dem Experiment schlussfolgern, dass a = 1 ist, sondern nur |a|2 = 1. Es wäre daher auch a = eiδ möglich, doch man kann zeigen, dass die Wahl δ = 0 keine Beschränkung der Allgemeinheit darstellt. „Humpty Dumpty“ ist eine Figur aus Lewis Carrolls „Alice hinter den Spiegeln“: ein menschenähnliches Ei, das als Sinnbild für etwas Zerbrechliches gilt, das nur schwer wieder zusammengesetzt werden kann.
86 und
5 Spin eins
alle i
� +S | i � � i | +S � = 1 .
(5.21)
Analoge Ergebnisse erhalten wir für ein Experiment, in dem S � durch ein beliebiges Filter R ersetzt wird, + + + (5.22) 0 0 0 . − − − S T R Die Ergebnisse werden immer genauso aussehen, als ob der T -Apparat gar nicht vorhanden wäre und wir nur + + 0 0 − − S R hätten. Oder mathematisch ausgedrückt � +R | i � � i | +S � = � +R | +S � . (5.23) alle i
Das ist unser fundamentales Gesetz, und es gilt allgemein, solange i für die drei Basiszustände eines Filters steht.
Sie werden bemerkt haben, dass es im Experiment (5.22) keine spezielle Beziehung von S und R zu T gibt. Außerdem waren die Argumente unabhängig davon, welche Zustände sie auswählen. Um die Gleichung allgemeingültig zu schreiben, also ohne uns auf die spezifischen Zustände zu beziehen, die durch S und R ausgewählt werden, bezeichnen wir den Zustand, den das erste Filter herstellt (in unserem speziellen Beispiel +S ), mit φ und den Zustand, der vom letzten Filter nachgewiesen wird (in unserem Beispiel +R), mit χ. Dann können wir unser fundamentales Gesetz (5.23) in der Form �χ|φ� = �χ|i��i|φ� (5.24) alle i
schreiben, wobei sich i über die drei Basiszustände eines einzelnen Filters erstreckt.
Wir wiederholen noch einmal, was wir mit Basiszuständen meinen. Sie entsprechen den drei Zuständen, die mit einem von unseren Stern-Gerlach-Apparaten ausgewählt werden können. Eine Bedingung ist, dass die Zukunft von der Vergangenheit unabhängig ist, wenn ein Basiszustand vorliegt. Eine andere Bedingung ist, dass bei einem vollständigen Satz von Basiszuständen die Gleichung (5.24) für jeden Satz von Anfangs- und Endzuständen φ und χ gilt. Es gibt nicht nur einen einzigen Satz von Basiszuständen. Wir sind davon ausgegangen, Basiszustände im Hinblick auf einen besonderen Apparat T zu betrachten. Genauso gut könnten wir einen anderen Satz von Basiszuständen in Bezug auf einen Apparat S oder R betrachten.7 Wir sprechen gewöhnlich von Basiszuständen „in einer bestimmten Darstellung“. 7
Für atomare Systeme mit drei oder mehr Basiszuständen gibt es tatsächlich andere Arten von Filtern – völlig verschieden von einem Stern-Gerlach-Apparat –, die benutzt werden können, um eine größere Auswahl für den Satz der Basiszustände zu bekommen (jeder Satz mit der gleichen Anzahl von Zuständen).
5.5 Interferierende Amplituden
87
Eine andere Bedingung für einen Satz von Basiszuständen in einer bestimmten Darstellung ist, dass sie alle vollständig verschieden sind. Damit meinen wir, dass ein (+T )-Zustand keine Amplitude hat, in einen (0 T )- oder (−T )-Zustand überzugehen. Wenn i und j für zwei beliebige Basiszustände eines speziellen Satzes stehen, lauten die allgemeinen Regeln, die im Zusammenhang mit der Matrix (5.8) besprochen wurden � j|i� = 0
für alle i j. Natürlich wissen wir, dass �i|i� = 1 gelten muss. Diese beiden Gleichungen werden gewöhnlich in der Form � j | i � = δ ji
(5.25)
geschrieben, wobei das Symbol δ ji (das „Kronecker-Delta“) für i j als null und für i = j als eins definiert ist. Die Gleichung (5.25) ist von den anderen Gesetzen, die wir bisher erwähnt haben, nicht unabhängig. Es ist zwar so, dass wir hier an dem mathematischen Problem, die minimale Anzahl unabhängiger Axiome zu finden, aus denen alle Gesetze folgen, nicht besonders interessiert sind.8 Wir sind schon zufrieden, wenn wir eine Aufstellung haben, die vollständig und nicht offensichtlich inkonsistent ist. Wir können jedoch zeigen, dass die Gleichungen (5.25) und (5.24) nicht unabhängig voneinander sind. Angenommen, in (5.24) steht φ für den Basiszustand j des Satzes, zu dem auch i gehört, dann ergibt sich �χ| j� = �χ|i��i| j� . i
Aber (5.25) sagt aus, dass � i | j � null ist, es sei denn, es gilt i = j. Damit wird die Summe zu � χ | j � und wir erhalten eine Identität, die zeigt, dass die beiden Gesetze voneinander nicht unabhängig sind. Wir können erkennen, dass es noch eine andere Beziehung zwischen den Amplituden geben muss, wenn sowohl (5.10) als auch (5.24) richtig ist. Gleichung (5.10) lautet � +T | +S � � +T | +S �∗ + � 0 T | +S � � 0 T | +S �∗ + � −T | +S � � −T | +S �∗ = 1 .
Wenn wir in (5.24) sowohl φ als auch χ als (+S )-Zustand annehmen, dann wird die linke Seite � +S | +S �, was offenbar = 1 ist; daher erhalten wir wieder (5.19) � +S | +T � � +T | +S � + � +S | 0 T � � 0 T | +S � + � +S | −T � � −T | +S � = 1 .
Diese beiden Gleichungen sind nur dann miteinander verträglich (für alle relativen Orientierungen des T - und S -Apparates), wenn � +S | +T � = � +T | +S �∗ , � +S | 0 T � = � 0 T | +S �∗ , � +S | −T � = � −T | +S �∗ . 8
Redundante wahre Aussagen stören uns nicht.
88
5 Spin eins
Und es folgt für alle Zustände φ und χ (5.26)
� φ | χ � = � χ | φ �∗ .
Wenn dies nicht richtig wäre, bliebe die Wahrscheinlichkeit nicht „erhalten“ und Teilchen gingen „verloren“. Bevor wir fortfahren, möchten wir die drei wichtigen allgemeinen Gesetze über Amplituden zusammenstellen. Es sind dies die Gleichungen (5.24), (5.25) und (5.26): I II
� j | i � = δ ji , �χ|i��i|φ�, �χ|φ� = alle i
III
(5.27)
� φ | χ � = � χ | φ �∗ .
In diesen Gleichungen beziehen sich i und j auf alle Basiszustände einer Darstellung, während φ und χ irgendeinen möglichen Zustand eines Atoms darstellen. Beachten Sie, dass II nur dann gültig ist, wenn die Summe über alle Basiszustände des Systems genommen wird (in unserem Fall drei: +T , 0 T , −T ). Diese Gesetze sagen nichts darüber aus, was wir als Basis für unseren Satz von Basiszuständen wählen sollten. Wir benutzten anfangs einen T -Apparat, der ein SternGerlach-Apparat mit einer willkürlichen Orientierung ist; aber jeder andere Apparat W wäre genauso gut. Wir müssten dann zwar einen anderen Satz von Zuständen für i und j benutzen, aber alle Gesetze blieben gültig – es gibt keinen einzig gültigen Satz. Einer der wichtigen Tricks der Quantenmechanik besteht gerade darin, von der Tatsache Gebrauch zu machen, dass man die gewünschten Ergebnisse auf mehr als eine Art ausrechnen kann.
5.6
Die Maschinerie der Quantenmechanik
Wir möchten Ihnen nun zeigen, wozu diese Gesetze nützlich sind. Angenommen, wir betrachten ein Atom in einem gegebenen Zustand (womit wir meinen, dass es in einer bestimmten Weise präpariert ist), und wir möchten wissen, wie es sich in einem Experiment verhält. Mit anderen Worten, wir gehen von unserem Atom im Zustand φ aus und möchten wissen, wie groß die Wahrscheinlichkeit ist, dass es durch einen Apparat hindurchgeht, der nur Atome im Zustand χ durchlässt. Die Gesetze sagen aus, dass wir den Apparat mit drei komplexen Zahlen � χ | i � vollständig beschreiben können. Dies sind die Amplituden für jeden einzelnen Basiszustand, im Zustand χ zu sein. Außerdem folgt aus den Gesetzen, dass wir sagen können, was geschehen wird, wenn wir den Zustand des Atoms durch Angabe dreier Zahlen � i | φ � beschreiben, durch die Amplituden dafür, dass das Atom in seinem ursprünglichen Zustand in jeweils einem der drei Basiszustände gefunden wird. Dies ist eine wichtige Aussage. Wir wollen uns die Sachlage noch anders veranschaulichen. Stellen wir uns das folgende Problem vor: Wir beginnen mit einem S -Apparat; dann folgt ein kompliziertes Durcheinander, das wir A nennen können, und dann ein R-Apparat – etwa so: + 0 − S
A
+ 0 . − R
(5.28)
5.6 Die Maschinerie der Quantenmechanik
89
Mit A meinen wir eine beliebige komplizierte Anordnung von Stern-Gerlach-Apparaten mit Masken oder Halbmasken, in schrägen Winkeln ausgerichtet, mit komplizierten elektrischen und magnetischen Feldern. . . fast alles, was einem zu nehmen einfällt. (Es ist bequem, Gedankenexperimente durchzuführen – man hat nicht die ganze Mühe, den Apparat wirklich bauen zu müssen!) Dann lautet die Frage: Mit welcher Amplitude kommt ein Teilchen, das den Abschnitt A in einem (+S )-Zustand betritt, aus A im (0 R)-Zustand heraus, sodass es durch das letzte R-Filter geht? Für diese Amplitude gibt es eine bestimmte Notation, nämlich � 0 R | A | +S � . Wie gewöhnlich muss man sie von rechts nach links lesen (wie hebräisch): � enden | durchgehen | anfangen � . Wenn A zufällig nichts bewirkt, sondern einfach ein offener Kanal ist, schreiben wir � 0 R | 1 | +S � = � 0 R | +S � ;
(5.29)
die beiden Symbole sind gleichwertig. Bei einem allgemeineren Problem könnten wir (+S ) durch einen allgemeinen Anfangszustand φ und (0 R) durch einen allgemeinen Endzustand χ ersetzen, und wir wüssten dann gern die Amplitude �χ|A|φ� . Eine vollständige Analyse des Apparates A müsste die Amplitude � χ | A | φ � für jedes mögliche Zustandspaar φ und χ ergeben – eine unendliche Anzahl von Kombinationen! Wie können wir dann eine knappe Beschreibung des Verhaltens des Apparates A angeben? Wir können es auf folgende Weise tun. Stellen wir uns vor, dass der Apparat aus (5.28) folgendermaßen abgeändert wird + + + + (5.30) 0 0 A 0 0 . − − − − S T T R Dies ist eigentlich überhaupt keine Abänderung, da die weit geöffneten T -Apparate nichts bewirken. Aber es führt uns zu einer Analyse des Problems. Es gibt eine gewisse Gruppe von Amplituden � i | +S �, dass die Atome aus S in den i-ten Zustand von T gehen. Dann gibt es noch eine Amplitudengruppe, dass ein i-Zustand (bezüglich T ), der in A eintritt, als j-Zustand (bezüglich T ) herauskommen wird. Und schließlich gibt es eine Amplitude, dass ein j-Zustand durch das letzte Filter als (0 R)-Zustand hindurchgeht. Für jeden möglichen Weg gibt es eine Amplitude der Form � 0 R | j � � j | A | i � � i | +S � , und die Gesamtamplitude ist die Summe der Ausdrücke, die wir aus allen möglichen Kombinationen von i und j erhalten können. Die gesuchte Amplitude ist � 0 R | j � � j | A | i � � i | +S � . (5.31) ij
90
5 Spin eins
Wenn (0 R) und (+S ) durch die allgemeinen Zustände χ und φ ersetzt werden, bekommen wir einen gleichartigen Ausdruck; daher erhalten wir das allgemeine Resultat �χ|A|φ� = �χ| j�� j| A|i��i|φ� . (5.32) ij
Beachten Sie, dass die rechte Seite von (5.32) letztlich „einfacher“ als die linke Seite ist. Der Apparat A ist vollständig beschrieben durch die neun Zahlen � j | A | i �, die die Reaktion von A bezüglich der drei Basiszustände des Apparates T beschreiben. Wenn wir erst einmal diese neun Zahlen kennen, können wir zwei beliebige ankommende und ausgehende Zustände φ und χ behandeln, indem wir jeden durch die drei Amplituden für den Übergang in jeden oder aus jedem der drei Basiszustände beschreiben. Das Ergebnis eines Versuches wird durch Anwendung von (5.32) vorhergesagt. Dies ist also die Maschinerie der Quantenmechanik für ein Teilchen vom Spin eins: Jeder Zustand wird durch drei Zahlen beschrieben, die die Amplituden angeben, in einem Zustand eines ausgewählten Satzes von Basiszuständen zu sein. Jeder Apparat wird durch neun Zahlen beschrieben, die die Amplituden für den Übergang von einem Basiszustand in einen anderen innerhalb des Apparates angeben. Mit diesen Zahlen kann alles berechnet werden. Die neun Amplituden, die den Apparat beschreiben, werden oft als quadratische Matrix, bezeichnet mit � j | A | i �, geschrieben:
nach
+ 0 −
+ �+| A|+� �0| A|+� �−| A|+�
von 0 �+|A|0� �0|A|0� �−|A|0�
− �+| A|−� �0| A|−� �−| A|−�
(5.33)
Die gesamte Mathematik der Quantenmechanik ist nur eine Erweiterung dieses Prinzips. Betrachten wir ein einfaches Beispiel. Nehmen wir an, wir wollen einen Apparat C analysieren, d. h. die neun Zahlen � j | C | i � berechnen. Wir können zum Beispiel wissen wollen, was im folgenden Experiment geschieht + 0 − S
C
+ 0 . − R
(5.34)
Aber dann stellen wir fest, dass C eigentlich aus zwei Teilapparaten A und B in Reihe aufgebaut ist, sodass die Teilchen zunächst durch A und dann durch B gehen. Dann können wir symbolisch schreiben (5.35) C = A · B . Den C-Apparat können wir als das „Produkt“ von A und B bezeichnen. Nehmen wir außerdem an, dass wir schon wissen, wie die beiden Teilapparate zu analysieren sind, sodass wir die
5.7 Transformation auf eine andere Basis
91
Matrizen von A und B (bezüglich T ) ermitteln können. Unser Problem ist dann schon gelöst. Wir können leicht �χ|C |φ�
für jeden Eingangs- und Ausgangszustand berechnen. Zuerst schreiben wir �χ|C |φ� = �χ| B|k��k|A|φ� . k
Wissen Sie warum? (Hinweis: Stellen Sie sich einen zwischen A und B platzierten T -Apparat vor.) Wenn wir dann den Spezialfall betrachten, dass φ und χ auch Basiszustände (von T ) sind, nennen wir sie i und j, dann erhalten wir � j|C |i� = � j| B|k��k|A|i� . (5.36) k
Diese Gleichung liefert die Matrix für den „Produkt“-Apparat C, ausgedrückt durch die beiden Matrizen der Apparate A und B. Die neue Matrix � j | C | i � (gebildet aus den beiden Matrizen � j | B | i � und � j | A | i � gemäß der in (5.36) angegebenen Summe) wird von Mathematikern „Produkt“-Matrix BA der beiden Matrizen B und A genannt. (Man beachte, dass die Reihenfolge wichtig ist, AB BA.) Folglich können wir sagen, dass die Matrix für das Hintereinanderschalten zweier Teilapparate gleich dem Matrizenprodukt der Matrizen für die beiden Apparate ist (hierbei steht der erste Apparat im Produkt auf der rechten Seite). Jeder, der die Matrix-Algebra kennt, versteht dann, dass wir einfach Gleichung (5.36) meinen.
5.7
Transformation auf eine andere Basis
Wir möchten diese Diskussion mit einer Feststellung über die in den Rechnungen benutzten Basiszustände abschließen. Nehmen wir an, wir haben uns dafür entschieden, mit einer bestimmten Basis zu arbeiten – sagen wir mit der S -Basis –, und ein Anderer entschließt sich, dieselben Rechnungen mit einer anderen Basis – zum Beispiel mit der T -Basis – durchzuführen. Um die Dinge klar zu halten, wollen wir unsere Basiszustände die (iS )-Zustände nennen, wobei i = +, 0 oder − ist. Analog dazu bezeichnen wir die Basiszustände des Anderen mit ( jT ). Wie können wir unsere Arbeitsweise mit der des Anderen vergleichen? Bei jeder Messung werden natürlich dieselben Endergebnisse herauskommen, aber in der Rechnung werden die verschiedenen Amplituden und Matrizen, die verwendet werden, unterschiedlich sein. Welche Beziehung besteht zwischen ihnen? Wenn wir und der Andere beide zum Beispiel mit demselben φ beginnen, werden wir es mit den drei Amplituden � iS | φ � beschreiben, dass φ in unsere Basiszustände in der S -Darstellung übergeht, während der Andere es durch die drei Amplituden � jT | φ � beschreiben wird, dass der Zustand φ in die Basiszustände in seiner T -Darstellung übergehen wird. Wie können wir prüfen, ob wir wirklich beide denselben Zustand φ beschreiben? Das können wir mit der Regel II von (5.27). Wenn wir χ durch einen seiner Zustände jT ersetzen, erhalten wir � jT | φ � = � jT | iS � � iS | φ � . (5.37) i
Zur Verknüpfung der beiden Darstellungen müssen wir nur die neun komplexen Zahlen der Matrix � jT | iS � angeben. Diese Matrix kann dann verwendet werden, um alle unsere Gleichungen
92
5 Spin eins
in die Form des Anderen zu übertragen. Sie sagt uns, wie man von einem Satz von Basiszuständen auf einen anderen transformiert. (Aus diesem Grund wird � jT | iS � manchmal „die Transformationsmatrix von der Darstellung S in die Darstellung T “ genannt. Große Worte!) Im Falle der Spin-eins-Teilchen, bei denen es nur drei Basiszustände gibt (bei größeren Spins gibt es mehr), ist die mathematische Situation analog zu der, die wir in der Vektoralgebra kennengelernt haben. Jeder Vektor kann durch die Angabe dreier Zahlen – durch die Komponenten in Richtung der x-, y- und z-Achse – dargestellt werden. Das heißt, jeder Vektor kann in drei „Basisvektoren“ zerlegt werden, die Vektoren in Richtung der drei Achsen sind. Aber angenommen, ein Anderer zieht es vor, drei andere Achsen x� , y� und z� zu benutzen. Er wird dann zur Darstellung eines Vektors andere Zahlen benutzen. Seine Rechnungen werden anders aussehen, aber seine Endergebnisse werden dieselben sein. Wir haben uns dies schon früher überlegt und wir kennen die Regeln, um Vektoren von einem Koordinationssystem in ein anderes zu transformieren. Vielleicht möchten Sie sehen, wie die quantenmechanischen Transformationen in der Praxis funktionieren. Darum wollen wir hier, ohne Beweis, die Transformationsmatrizen zur Übertragung der Spin-eins-Amplituden aus einer Darstellung S in eine andere Darstellung T angeben, und zwar für spezielle relative Orientierungen der S - und T -Filter. (In einem späteren Kapitel werden wir Ihnen zeigen, wie man diese Ausdrücke herleitet.) Erster Fall: Der T -Apparat hat dieselbe y-Achse (in deren Richtung sich die Teilchen bewegen) wie der S -Apparat, ist aber um die gemeinsame y-Achse um den Winkel α gedreht (wie in Abbildung 5.6). (Um genau zu sein: Im T -Apparat ist ein Koordinatensystem x� , y� , z� festgelegt, das mit den x-, y-, z-Koordinaten des S -Apparates verknüpft ist durch z� = z cos a + x sin α, x� = x cos α − z sin α, y� = y.) Dann lauten die Transformationsamplituden � +T | +S � = 21 (1 + cos α) , 1 � 0 T | +S � = − √ sin α , 2 � −T | +S � = 12 (1 − cos α) , 1 � +T | 0 S � = + √ sin α , 2 � 0 T | 0 S � = cos α , 1 � −T | 0 S � = − √ sin α , 2 1 � +T | − S � = 2 (1 − cos α) , 1 � 0 T | −S � = + √ sin α , 2 1 � −T | −S � = 2 (1 + cos α) .
(5.38)
Zweiter Fall: Der T -Apparat hat dieselbe z-Achse wie S , ist aber um den Winkel β um die z-Achse gedreht. (Die Koordinatentransformation lautet z� = z, x� = x cos β + y sin β, y� =
5.8 Andere Situationen
93
y cos β − x sin β.) Dann lauten die Transformationsamplituden: � +T | +S � = e+iβ , �0T |0S � = 1, � −T | −S � = e−iβ , alle anderen = 0 .
(5.39)
Beachten Sie, dass jede beliebige Drehung von T aus den beiden beschriebenen Drehungen zusammengesetzt werden kann. Wenn ein Zustand φ durch die drei Zahlen C+ = � +S | φ � ,
C0 = � 0 S | φ � ,
C− = � −S | φ �
(5.40)
beschrieben wird und derselbe Zustand aus der Sicht von T durch die drei Zahlen C+� = � +T | φ � ,
C0� = � 0 T | φ � ,
C−� = � −T | φ �
(5.41)
beschrieben wird, dann ergeben die Koeffizienten � jT | iS � von (5.38) oder (5.39) die Transformation, die Ci und Ci� miteinander verbindet. Die Ci sind also den Komponenten eines Vektors sehr ähnlich, die aus der Sicht von S und T verschieden erscheinen. Nur für ein Spin-eins-Teilchen – weil es genau drei Amplituden verlangt – besteht eine sehr enge Korrespondenz zu einem Vektor. In beiden Fällen gibt es drei Zahlen, die sich auf ganz bestimmte Weise transformieren, wenn sich die Koordinatensysteme ändern. Es gibt tatsächlich einen Satz von Basiszuständen, die sich genau wie die drei Komponenten eines Vektors transformieren. Die drei Kombinationen 1 C x = − √ (C+ − C− ) , 2
i Cy = − √ (C+ + C− ) , 2
Cz = C0
(5.42)
transformieren sich zu C �x , Cy� und Cz� genauso, wie sich x, y, z zu x� , y� , z� transformieren. (Sie können nachprüfen, dass dies zutrifft, wenn Sie die Transformationsgesetze (5.38) und (5.39) anwenden.) Deshalb wird ein Spin-eins-Teilchen oft als „Vektorteilchen“ bezeichnet.
5.8
Andere Situationen
Wir haben anfangs betont, dass unsere Diskussion des Spin-eins-Teilchens ein Musterbeispiel für jedes quantenmechanische Problem ist. Die Verallgemeinerung betrifft nur die Anzahl der Zustände. Anstelle von nur drei Basiszuständen können in einer speziellen Situation n Basiszustände erforderlich sein.9 Unsere allgemeinen, in (5.27) zusammengefassten Gesetze haben dann genau dieselbe Form – mit der Bedingung, dass i und j alle n Basiszustände durchlaufen müssen. Jedes Phänomen kann berechnet werden, wenn man alle Amplituden angibt, dass es in einem bestimmten Basiszustand startet und in einem anderen endet, und dann über das ganze System von Basiszuständen summiert. Jedes geeignete System von Basiszuständen kann benutzt werden, und wenn jemand ein anderes System benutzen möchte, ist es auch recht; die 9
Die Anzahl der Basiszustände n kann unendlich sein, und im Allgemeinen ist sie das auch.
94
5 Spin eins
beiden Systeme können durch Anwendung einer n × n-Transformationsmatrix ineinander transformiert werden. Wir werden über solche Transformationen später mehr aussagen. Schließlich haben wir versprochen zu erwähnen, was zu tun ist, wenn Atome direkt aus einem Ofen kommen, durch einen Apparat A gehen und dann in einem Filter, das den Zustand χ auswählt, analysiert werden. Sie wissen nicht, von welchem Zustand φ sie ausgehen. Es ist aber vielleicht am besten, wenn Sie sich im Augenblick um dieses Problem nicht kümmern, sondern sich auf Probleme beschränken, die von reinen Zuständen ausgehen. Wenn Sie aber doch darauf bestehen, geben wir hier an, wie das Problem behandelt werden kann. Zuerst müssen Sie vernünftig abschätzen können, wie die Zustände in den Atomen, die aus dem Ofen kommen, verteilt sind. Wenn es zum Beispiel nichts „Spezielles“ über den Ofen zu sagen gibt, können Sie vernünftigerweise annehmen, dass die Atome den Ofen mit zufälligen „Orientierungen“ verlassen. Quantenmechanisch entspricht das der Aussage, dass Sie nichts über die Zustände wissen, außer dass ein Drittel im (+S )-Zustand, ein Drittel im (0 S )-Zustand und ein Drittel im (−S )-Zustand ist. Für die, die im (+S )-Zustand sind, ist die Amplitude für den Durchgang � χ | A | +S � und die Wahrscheinlichkeit | � χ | A | +S � |2 ; Entsprechendes gilt für die anderen. Die Gesamtwahrscheinlichkeit ist dann 1 1 1 |� χ | A | +S �|2 + |� χ | A | 0 S �|2 + |� χ | A | −S �|2 . 3 3 3 Warum benutzen wir S und nicht zum Beispiel T ? Das Resultat ist erstaunlicherweise dasselbe, ganz gleich, welche Anfangszerlegung wir wählen – solange wir vollkommen zufällige Orientierungen voraussetzen. In jedem Fall gilt: | � χ | iS � |2 = | � χ | jT � |2 i
j
für jedes χ. (Den Beweis überlassen wir Ihnen.) Beachten √ Sie, dass es nicht √ richtig ist, wenn√man sagt, dass die Eingangszustände die Amplituden, 1/3 im (+S )-, 1/3 im (0 S )- und 1/3 im (−S )-Zustand zu sein, haben; das würde bedeuten, dass gewisse Interferenzen möglich wären. Es ist einfach so, dass Sie nicht wissen, welches der Anfangszustand ist; Sie müssen von der Wahrscheinlichkeit ausgehen, dass das System in den verschiedenen möglichen Anfangszuständen beginnt, und dann müssen Sie über die verschiedenen Möglichkeiten ein gewichtetes Mittel bilden.
6
Spin 1/2
Dieses Kapitel ist ein ziemlich langer und abstrakter Exkurs, und es führt keine Konzepte ein, zu denen wir nicht auch in späteren Kapiteln auf anderen Wegen kommen werden. Sie können es daher überspringen, und wenn Sie Interesse haben, später darauf zurückkommen.
6.1
Transformation von Amplituden
Im vorangegangenen Kapitel haben wir eine Übersicht über die allgemeinen Prinzipien der Quantenmechanik gegeben, wobei wir ein System vom Spin eins als Beispiel benutzten: Jeder Zustand ψ kann durch ein System von Basiszuständen beschrieben werden, indem man die Amplituden für den Aufenthalt in jedem der Basiszustände angibt. Die Amplitude für den Übergang von einem Zustand in einen anderen kann allgemein als Summe von Produkten geschrieben werden, wobei jedes Produkt die Amplitude für den Aufenthalt in einem der Basiszustände multipliziert mit der Amplitude für den Übergang von diesem Basiszustand in den Endzustand ist und die Summe einen Term für jeden Basiszustand enthält: �χ|ψ� = �χ|i��i|ψ� . (6.1) i
Die Basiszustände sind orthogonal – die Amplitude für den Aufenthalt in einem Basiszustand ist null, wenn sich das System in einem anderen Basiszustand befindet: � i | j � = δi j .
(6.2)
� χ | ψ �∗ = � ψ | χ � .
(6.3)
Die Amplitude für den direkten Übergang von einem Zustand in einen anderen ist das komplex Konjugierte des umgekehrten Vorgangs
Wir haben auch darüber gesprochen, dass es mehr als eine Basis für die Beschreibung der Zustände geben kann und dass wir (6.1) verwenden können, um von einer Basis zu einer anderen überzugehen. Nehmen wir zum Beispiel an, wir kennen die Amplituden � iS | ψ �, den Zustand ψ in den Basiszuständen i des Basissystems S zu finden, entschließen uns dann aber, den Zustand doch lieber durch ein anderes System von Basiszuständen zu beschreiben, sagen wir durch die Zustände j, die zu der Basis T gehören. In der allgemeinen Formel (6.1) können wir jT für χ substituieren und erhalten die Formel � jT | ψ � = � jT | iS � � iS | ψ � . (6.4) i
96
6 Spin 1/2
Die Amplituden, dass der Zustand | ψ � in einem der Basiszustände | jT � ist, sind mit den Amplituden, dass er in den Basiszuständen | iS � ist, durch ein System von Koeffizienten � jT | iS � verknüpft. Wenn es N Basiszustände gibt, dann gibt es N 2 solche Koeffizienten. Ein solches Koeffizientensystem wird oft „Transformationsmatrix für den Übergang von der S -Darstellung in die T -Darstellung“ genannt. Das sieht furchtbar mathematisch aus, aber wenn wir es ein wenig umbenennen, können wir sehen, dass es gar nicht so schlimm ist. Wenn wir die Amplitude, dass der Zustand ψ im Basiszustand | iS � ist, Ci nennen – das heißt Ci = � iS | ψ � – und mit C �j die entsprechende Amplitude für das Basissystem T bezeichnen – das heißt C �j = � jT | ψ � –, dann kann (6.4) geschrieben werden als R jiCi , (6.5) C �j = i
wobei R ji dasselbe bedeutet wie � jT | iS �. Jede Amplitude C �j ist gleich der Summe über alle i vom jeweiligen Koeffizienten R ji multipliziert mit der Amplitude Ci . Sie hat dieselbe Form wie bei der Transformation eines Vektors von einem Koordinatensystem in ein anderes.
Um nicht nur abstrakt zu bleiben, haben wir einige Beispiele für diese Koeffizienten im Spineins-Fall angegeben. So können Sie sehen, wie man sie in der Praxis anwendet. Andererseits hat die Quantenmechanik eine sehr schöne Eigenschaft – nämlich, dass man aus der bloßen Tatsache, dass es drei Zustände gibt, und aus den Symmetrieeigenschaften des Raumes bei Drehungen diese Koeffizienten allein durch abstrakte Überlegungen herleiten kann. Wenn wir Ihnen in diesem frühen Stadium solche Erörterungen vorführen, hat das den Nachteil, dass Sie mit einem weiteren System von Abstraktionen konfrontiert werden, bevor wir „auf festem Grund“ stehen. Diese Tatsache ist jedoch so schön, dass wir es trotzdem tun werden. Wir werden in diesem Kapitel zeigen, wie die Transformationskoeffizienten für Teilchen mit Spin 1/2 hergeleitet werden können. Wir ziehen diesen Fall dem Fall Spin eins vor, weil er etwas einfacher zu behandeln ist. Unser Problem besteht in der Bestimmung der Koeffizienten R ji für ein Teilchen – ein atomares System –, das in einem Stern-Gerlach-Apparat in zwei Strahlen aufgespalten wird. Wir werden alle Koeffizienten für die Transformation von einer Darstellung in eine andere durch reine Überlegung – plus einige Annahmen – herleiten. Einige Annahmen sind immer notwendig, wenn man „reine“ Überlegung anstellen will! Obwohl die Ausführungen abstrakt und kompliziert sein werden, wird das Ergebnis doch relativ einfach darzustellen und leicht zu verstehen sein – und das Ergebnis ist schließlich das Wichtigste. Sie können die folgenden Ausführungen, wenn Sie wollen, als eine Art kulturellen Exkurs ansehen. Tatsächlich können alle wesentlichen Ergebnisse, die wir hier herleiten, auch auf andere Art erhalten werden, wenn wir sie später benötigen. Sie müssen daher nicht befürchten, den roten Faden unserer quantenmechanischen Betrachtungen zu verlieren, wenn Sie dieses Kapitel ganz auslassen oder es zu einem späteren Zeitpunkt durcharbeiten. Der Exkurs ist „kulturell“ in dem Sinne, dass er zu zeigen beabsichtigt, dass die Prinzipien der Quantenmechanik nicht nur interessant, sondern so tiefgehend sind, dass wir durch Hinzufügen von nur wenigen zusätzlichen Hypothesen über die Struktur des Raumes eine große Anzahl von Eigenschaften physikalischer Systeme ableiten können. Es ist auch wichtig zu wissen, woher die Konsequenzen der Quantenmechanik kommen, weil es, solange unsere physikalischen Gesetze unvollständig sind – und wir wissen, dass sie es sind –, interessant ist herauszufinden, ob die Stellen, an denen unsere Theorien nicht mehr mit dem Experiment übereinstimmen, dort liegen, wo unsere Logik am besten oder wo unsere Logik am schlechtesten ist. Bis jetzt scheint es, dass wir dort, wo unsere Logik völlig abstrakt ist, immer korrekte Ergebnisse erhalten – sie stimmen mit dem Experiment überein. Nur wenn
6.2 Transformation auf ein gedrehtes Koordinatensystem
97
wir versuchen, spezielle Modelle von der inneren Mechanik der Elementarteilchen und ihren Wechselwirkungen aufzustellen, sind wir nicht mehr in der Lage, eine Theorie zu finden, die mit dem Experiment übereinstimmt. Die Theorie also, die wir jetzt beschreiben werden, stimmt mit dem Experiment überein, wann immer sie getestet wurde – sowohl für die seltsamen Teilchen als auch für Elektronen, Protonen usw. Bevor wir fortfahren, noch eine Bemerkung über einen störenden, aber interessanten Aspekt: Es ist nicht möglich, die Koeffizienten R ji eindeutig zu bestimmen, weil es immer eine gewisse Willkür in den Wahrscheinlichkeitsamplituden gibt. Wenn Sie ein System von Amplituden verwenden, beispielsweise die Amplituden, auf einer großen Anzahl von verschiedenen Wegen an einem Ort anzukommen, und wenn Sie jede einzelne Amplitude mit demselben Phasenfaktor eiδ multiplizieren, dann erhalten Sie ein anderes System, das genauso gut ist. Daher ist es immer möglich, wenn man möchte, bei einem gegebenen Problem die Phasen aller Amplituden nach Belieben – aber alle in gleicher Weise – zu ändern. Angenommen, Sie berechnen eine Wahrscheinlichkeit, indem Sie die Summe von mehreren Amplituden, sagen wir (A + B + C + . . .), aufschreiben und das Absolutquadrat bilden. Dann berechnet ein Anderer dasselbe unter Verwendung der Summe der Amplituden (A� + B� + C � + . . .) und Bildung des Absolutquadrates. Wenn alle A� , B� , C � usw. gleich den A, B, C usw. sind, abgesehen von einem Faktor eiδ , sind alle durch Bildung des Absolutquadrates erhaltenen Wahrscheinlichkeiten genau gleich, da dann (A� + B� + C � + . . .) gleich eiδ (A + B + C + . . .) ist. Oder nehmen wir zum Beispiel an, dass wir etwas mithilfe von (6.1) ausrechnen, aber dann plötzlich alle Phasen des Basissystems ändern. Jede der Amplituden � i | ψ � würde dann mit demselben Faktor eiδ multipliziert. In gleicher Weise würden auch die Amplituden � i | χ � durch eiδ geändert, aber die Amplituden � χ | i � sind das komplex Konjugierte der Amplituden � i | χ �; daher wird die erstere Amplitude durch den Faktor e−iδ geändert. Die Exponenten +iδ und −iδ heben sich auf, und wir erhalten denselben Ausdruck wie zuvor. So ist es eine allgemeine Regel, dass es keinen Unterschied macht, wenn wir alle Amplituden bezüglich eines gegebenen Basissystems um dieselbe Phase ändern – oder wenn wir sogar alle Amplituden in irgendeinem Problem um dieselbe Phase ändern. Es besteht daher eine gewisse Freiheit bei der Wahl der Phasen in unserer Transformationsmatrix. Ab und an werden wir deshalb eine willkürliche Wahl treffen – gewöhnlich folgen wir dabei den allgemein gebräuchlichen Konventionen.
6.2
Transformation auf ein gedrehtes Koordinatensystem
Wir betrachten wieder den „verbesserten“ Stern-Gerlach-Apparat, der im vorigen Kapitel beschrieben wurde. Ein Strahl von Spin- 21 -Teilchen, der von links eintritt, wird im Allgemeinen in zwei Strahlen aufgespalten, wie in Abbildung 6.1 schematisch gezeigt ist. (Für Spin eins gab es drei Strahlen.) Wie zuvor werden die Strahlen wieder zusammengeführt, wenn nicht der eine oder der andere von ihnen durch eine „Sperre“ blockiert wird, die den Strahl auf halbem Wege unterbricht. In der Abbildung ist ein Pfeil gezeigt, der in Richtung wachsender Feldstärke weist – sagen wir zum Magnetpol mit der scharfen Kante. Der Pfeil soll die „Aufwärtsachse“ von einem einzelnen Apparat darstellen. Die Achse ist mit dem Apparat verbunden, und sie wird es uns gestatten, die relativen Orientierungen aufzuzeigen, wenn wir mehrere Apparate benutzen. Außerdem nehmen wir an, dass die Richtung des magnetischen Feldes in jedem Magnet
98
6 Spin 1/2 Seitenansicht + z
y
− Feldgradient
Aufsicht
y x
Abb. 6.1: Aufsicht und Seitenansicht eines „verbesserten“ Stern-Gerlach-Apparates mit Strahlen eines Spin- 21 Teilchens.
bezüglich des Pfeiles die gleiche ist. Wir sagen, dass diejenigen Atome, die im „oberen“ Strahl laufen, im (+)-Zustand in Bezug auf diesen Apparat sind und jene im „unteren“ Strahl im (−)-Zustand. (Es gibt keinen (0)-Zustand für Spin- 21 -Teilchen.) Nehmen wir an, wir stellen jetzt zwei unserer verbesserten Stern-Gerlach-Apparate in Reihe auf, wie in Abbildung 6.2 (a) gezeigt. Der erste, den wir mit S bezeichnen, kann dazu benutzt werden, durch Blockierung des einen oder des anderen Strahls einen reinen (+S )- oder einen reinen (−S )-Zustand zu erzeugen. (In unserer Zeichnung stellt er einen reinen (+S )-Zustand her.) Für jeden Zustand gibt es für ein Teilchen, das aus S herauskommt, eine Amplitude, entweder im (+T )- oder (−T )-Zustand des zweiten Apparates zu sein. Insgesamt gibt es vier Amplituden: Die Amplituden für den Übergang von (+S ) nach (+T ), von (+S ) nach (−T ), von (−S ) nach (+T ) und von (−S ) nach (−T ). Diese Amplituden bilden die vier Koeffizienten der Transformationsmatrix R ji für den Übergang von der S -Darstellung in die T -Darstellung. Wir können es so interpretieren, dass der erste Apparat einen gewissen Zustand in der einen Darstellung „herstellt“ und dass der zweite Apparat diesen Zustand in Termen der zweiten Darstellung „analysiert“. Die Frage, die wir nun beantworten wollen, lautet: Wenn wir ein Atom durch Blockieren von einem der Strahlen im Apparat S in einen gegebenen Zustand – sagen wir in den (+S )-Zustand – gebracht haben, welche Wahrscheinlichkeit gibt es dann, dass es durch den zweiten Apparat T geht, wenn dieser für den (−T )-Zustand eingerichtet ist? Das Ergebnis wird natürlich von den Winkeln zwischen den beiden Apparaten S und T abhängen. Wir sollten erklären, warum wir überhaupt hoffen können, die Koeffizienten R ji durch reine Deduktion zu finden. Sie wissen, dass für ein Teilchen mit Spin in die +z-Richtung kaum eine Wahrscheinlichkeit dafür besteht, es mit Spin in der +x-Richtung – oder in irgendeiner anderen Richtung – vorzufinden. Tatsächlich ist das beinahe unmöglich, aber eben nicht ganz. Es ist so nahe am Unmöglichen, dass es nur einen Lösungsweg gibt, und darum können wir diesen einen Weg finden. Das erste Argument, das wir heranziehen können, ist folgendes. Nehmen wir an, wir betrachten einen Aufbau wie in Abbildung 6.2 (a) mit zwei Apparaten S und T , wobei T bezüglich S um den Winkel α gekippt ist, und wir lassen durch S nur den (+)-Strahl und durch T nur den (−)-Strahl hindurchgehen. Aus der Beobachtung erhalten wir einen gewissen Wert für die
99
T
6.2 Transformation auf ein gedrehtes Koordinatensystem
α S
(a)
S
T
α (b)
Abb. 6.2: Zwei gleichwertige Experimente.
Wahrscheinlichkeit, dass die Teilchen, die aus S kommen, durch T gehen. Nehmen wir jetzt an, wir führen noch eine Messung mit dem Apparat aus Abbildung 6.2 (b) durch. Die relative Orientierung von S und T ist die gleiche, nur liegt das ganze System im Raum in einem anderen Winkel. Wir wollen voraussetzen, dass diese beiden Experimente denselben Betrag für die Wahrscheinlichkeit ergeben, dass ein Teilchen in einem bezüglich S reinen Zustand in einen speziellen Zustand bezüglich T geht. Wir setzen mit anderen Worten voraus, dass jedes Experiment dieser Art das gleiche Ergebnis liefert – dass die Physik dieselbe ist –, unabhängig davon, wie der gesamte Apparat im Raum orientiert ist. (Sie sagen: „Das versteht sich von selbst“. Aber es ist eine Annahme, und sie ist nur dann „richtig“, wenn sie der Wirklichkeit entspricht.) Das bedeutet, dass die Koeffizienten R ji nur von der relativen Lage von S und T im Raum abhängen und nicht von der absoluten Lage. Oder anders formuliert, R ji hängt nur von der Drehung ab, die S in T überführt, denn offensichtlich ist das, was in den Teilen (a) und (b) der Abbildung 6.2 gleich ist, die dreidimensionale Drehung, die den Apparat S in die Orientierung des Apparates T bringt. Wenn die Transformationsmatrix R ji nur von einer Drehung abhängt, wird sie eine Drehmatrix genannt. Für unseren nächsten Schritt benötigen wir eine weitere Information. Angenommen, wir fügen einen dritten Apparat U hinzu, der auf T in einem beliebigen Winkel folgt, wie in Abbildung 6.3 (a). (Es fängt an, unübersichtlich zu werden, aber das ist das Schöne am abstrakten Denken – durch bloßes Zeichnen von Linien können Sie die wildesten Experimente durchführen!) Was ist nun die S → T → U-Transformation? Was wir eigentlich wissen wollen, ist die Amplitude für den Übergang von einem Zustand bezüglich S in einen Zustand bezüglich U, wenn wir die Transformation von S nach T und von T nach U kennen. Wir untersuchen dann ein Experiment, in dem beide Kanäle von T geöffnet sind. Die Antwort erhalten wir, wenn wir (6.5) zweimal hintereinander anwenden. Für den Übergang von der S -Darstellung zur T -Darstellung gilt C �j = RTjiS Ci , (6.6) i
100
6 Spin 1/2
U (b)
T
(a)
U S
S
Abb. 6.3: Wenn T „weit geöffnet“ ist, ist (b) gleichwertig mit (a).
wobei wir die oberen Indizes T S an das R schreiben, damit wir es von den Koeffizienten RUT unterscheiden können, die wir für den Übergang von T nach U erhalten. Wenn wir annehmen, dass Ck die Amplituden sind, in den Basiszuständen der U-Darstellung zu sein, können wir sie durch nochmalige Anwendung von (6.5) auf die T -Amplituden beziehen. Wir erhalten: Ck = RUT (6.7) kj Cj . j
Um die Transformation von S direkt nach U zu erhalten, setzen wir das in (6.6) gegebene C j in (6.7) ein: Ck = RUT RTjiS Ci . (6.8) kj j
i
Da i in RUT k j nicht vorkommt, können wir die Summation über i vorziehen und schreiben TS Ck = RUT (6.9) k j R ji Ci . i
j
Dies ist die Formel für eine doppelte Transformation. Beachten Sie jedoch, dass die Zustände, die aus T herauskommen, dieselben sind wie die, die hineingehen, solange kein Strahl in T blockiert wird. Wir hätten ebenso gut eine Transformation aus der S -Darstellung direkt in die U-Darstellung ausführen können. Es muss dasselbe sein, als wenn der U-Apparat direkt hinter S aufgestellt wäre, wie in Abbildung 6.3 (b). In diesem Fall hätten wir geschrieben Ck = RUS (6.10) ki Ci , i
wobei zu dieser Transformation die Koeffizienten RUS ki gehören. Nun müssen die Gleichungen (6.9) und (6.10) offenbar dieselben Amplituden Ck ergeben, und dies muss unabhängig davon
6.2 Transformation auf ein gedrehtes Koordinatensystem
101
gelten, wie der ursprüngliche Zustand φ aussah, der uns die Amplituden Ci lieferte. Daher muss gelten: TS RUS RUT (6.11) ki = k j R ji . j
Mit anderen Worten, für jede Drehung S → U einer Bezugsbasis, die als Zusammensetzung zweier aufeinanderfolgender Drehungen S → T und T → U angesehen wird, kann die Drehmatrix RUS ki aus den Matrizen der beiden Drehungen mittels (6.11) ermittelt werden. Wenn Sie wollen, können Sie (6.11) direkt aus (6.1) gewinnen, denn diese Beziehung ist nur eine andere Schreibweise für � kU | iS � = j � kU | jT � � jT | iS �. Der Vollständigkeit halber wollen wir die folgenden Bemerkungen einschieben. Sie sind jedoch nicht so furchtbar wichtig. Sie können daher, wenn Sie wollen, gleich zum nächsten Abschnitt springen. Was wir gesagt haben, ist nicht ganz richtig. Wir können nicht wirklich sagen, dass die Gleichungen (6.9) und (6.10) genau die gleichen Amplituden liefern müssen. Nur die Physik muss die gleiche sein, alle Amplituden können um einen gemeinsamen Phasenfaktor wie eiδ verschieden sein, ohne das Ergebnis irgendeiner Berechnung der realen Welt zu verändern. Was wir anstelle von (6.11) tatsächlich wissen, ist TS eiδ RUS RUT (6.12) ki = k j R ji , j
wobei δ eine beliebige reelle Konstante ist. Dieser zusätzliche Faktor eiδ bedeutet natürlich, dass die Amplituden, die wir durch Anwendung der Matrix RUS erhalten, sich alle um die gleiche Phase (e−iδ ) von den Amplituden unterscheiden können, die wir erhalten würden, wenn wir die beiden Drehungen RT S und RUT verwenden. Wir wissen, dass es nichts ausmacht, wenn alle Amplituden um dieselbe Phase geändert werden, daher können wir, wenn wir wollen, diesen Phasenfaktor einfach ignorieren. Es stellt sich jedoch heraus, dass bei einer speziellen Definition all unserer Drehmatrizen dieser zusätzliche Phasenfaktor niemals auftreten wird – das δ in (6.12) wird immer null sein. Obwohl es für den weiteren Gang unserer Ausführungen nicht wichtig ist, können wir das durch Anwendung eines mathematischen Satzes über Determinanten kurz beweisen. (Wenn Sie noch nicht viel über Determinanten wissen, kümmern Sie sich nicht um den Beweis, sondern springen Sie einfach zur Definition von R in (6.15).) Zuerst sollten wir sagen, dass (6.11) die mathematische Definition eines „Produktes“ von zwei Matrizen ist. (Es ist einfach bequem, sagen zu können: „RUS ist das Produkt von RUT und RT S “.) Außerdem gibt es einen mathematischen Satz – den Sie leicht für die 2×2-Matrizen, mit denen wir es hier zu tun haben, beweisen können –, welcher besagt, dass die Determinante eines „Produktes“ von zwei Matrizen das Produkt ihrer Determinanten ist. Wenn wir diesen Satz auf (6.12) anwenden, erhalten wir (6.13) ei2δ det RUS = det RUT · det RT S .
(Wir lassen die unteren Indizes weg, weil sie nichts Brauchbares aussagen.) Ja, das 2δ ist richtig. Bedenken iδ Sie, dass wir uns mit 2×2-Matrizen befassen. Jeder Term in der Matrix RUS ki wird mit e multipliziert, daher wird jedes Produkt in der Determinante – das zwei Faktoren hat – mit ei2δ multipliziert. Nun dividieren wir (6.12) durch die Quadratwurzel aus (6.13) und erhalten RUT RTjiS RUS kj ki = . √ √ √ det RUS det RUT det RT S j Der zusätzliche Phasenfaktor ist verschwunden.
(6.14)
102
6 Spin 1/2
Wenn wir alle unsere Amplituden in einer gegebenen Darstellung als normiert ansehen wollen (was, wie Sie sich erinnern, bedeutet, dass i � φ | i � � i | φ � = 1 ist), stellt sich heraus, dass alle Drehmatrizen Determinanten haben, die rein imaginäre Exponentialausdrücke wie eiα sind. (Wir wollen das nicht beweisen, Sie werden sehen, dass es immer so ist.) Daher können wir, wenn wir wollen, es so einrichten, dass alle unsere Drehmatrizen R eine einheitliche Phase haben, wenn wir det R = 1 setzen. Man macht das so: Angenommen, wir finden auf irgendeine Weise eine Drehmatrix R. Wir stellen eine Regel zur „Umwandlung“ in die „Standardform“ auf, indem wir definieren R RStandard = √ . det R
(6.15)
Wir können dies tun, weil wir jeden Term von R einfach mit demselben Phasenfaktor multiplizieren, um die gewünschten Phasen zu erhalten. Im Folgenden werden wir immer voraussetzen, dass unsere Matrizen in die Standardform gebracht sind. Dann können wir (6.11) verwenden, ohne dass wir zusätzliche Phasenfaktoren berücksichtigen müssen.
Drehungen um die z-Achse
6.3
Jetzt sind wir in der Lage, die Transformationsmatrix R ji zwischen zwei verschiedenen Darstellungen zu ermitteln. Mit unserer Regel für die Zusammensetzung von Drehungen und der Annahme, dass der Raum keine Vorzugsrichtung hat, haben wir alle Voraussetzungen, die wir benötigen, um die Matrix für eine beliebige Drehung zu ermitteln. Es gibt nur eine Lösung. Wir beginnen mit der Transformation, die einer Drehung um die z-Achse entspricht. Nehmen wir an, wir verwenden zwei Apparate S und T , die in Reihe längs einer geraden Linie aufgestellt sind, wobei ihre Achsen parallel sind und aus der Buchseite herauszeigen (siehe Abbildung 6.4 (a)).
(b)
(a) y
Feldgradient
x
y
T y�
x
P1 S
P1 T
x�
S
Abb. 6.4: 90◦ -Drehung um die z-Achse.
Wir legen unsere „z-Achse“ in diese Richtung. Wenn der Strahl in dem S -Apparat „nach oben“ (nach +z) geht, wird er sicher dasselbe im T -Apparat tun. Ebenso wird er, wenn er in S nach unten geht, auch in T nach unten gehen. Nehmen wir jedoch an, dass der T -Apparat in einem anderen Winkel aufgestellt ist, seine Achse aber immer noch parallel zur Achse von S verläuft (siehe Abbildung 6.4 (b)). Intuitiv würden Sie sicher sagen, dass ein (+)-Strahl in S mit einem (+)-Strahl in T einhergeht, weil die Felder und Feldgradienten immer noch in derselben Richtung liegen. Das wäre auch ganz richtig. Auch würde ein (−)-Strahl in S immer noch in einen
6.3 Drehungen um die z-Achse
103
(−)-Strahl in T gehen. Dasselbe Ergebnis würde für jede Orientierung von T in der xy-Ebene von S zutreffen. Was sagt dies aus über die Beziehung zwischen C+� = � +T | ψ �, C−� = � −T | ψ � und C+ = � +S | ψ �, C− = � −S | ψ �? Sie könnten schließen, dass jede Drehung um die z-Achse des „Bezugssystems“ der Basiszustände die Amplituden wie zuvor „oben“ und „unten“ belässt. Wir könnten C+� = C+ und C−� = C− schreiben – aber das ist falsch. Alles, was wir folgern können, ist, dass für solche Drehungen die Wahrscheinlichkeiten, im „oben“-Strahl zu sein, für die S - und T -Apparate gleich sind. Das heißt, es gilt |C+� | = |C+ |
und |C−� | = |C− | .
Wir können nicht sagen, dass die Phasen der Amplituden, bezogen auf den T -Apparat, für die zwei verschiedenen Orientierungen in (a) und (b) von Abbildung 6.4 gleich sein müssen. Die zwei Apparate in (a) und (b) von Abbildung 6.4 sind tatsächlich verschieden, wie wir folgendermaßen erkennen können. Nehmen wir an, dass wir in der Anordnung (a) einen Apparat vor S aufstellen, der einen reinen (+x)-Zustand erzeugt. (Die x-Achse zeigt in der Abbildung nach unten.) Solche Teilchen würden in S in (+z)- und (−z)-Strahlen aufgespalten. Aber die beiden Strahlen würden bei P1 – dem Ausgang von S – wieder zum Zustand (+x) vereinigt werden. Dasselbe geschieht in T wieder. Wenn wir auf T einen dritten Apparat U folgen ließen, dessen Achse sich in der (+x)-Richtung befindet, wie in Abbildung 6.5 (a) gezeigt, würden alle Teilchen in den (+)-Strahl von U gehen. Nun stellen Sie sich vor, was geschieht, wenn T und U zusammen um 90◦ in die Positionen, die in Abbildung 6.5 (b) gezeigt sind, gedreht würden. Wieder gibt der Apparat T genau das heraus, was er auch aufnimmt, sodass die Teilchen, die in U eintreten, in einem (+x)-Zustand bezüglich S sind. Aber U weist jetzt den (+y)-Zustand bezüglich S nach, der vom (+x)-Zustand verschieden ist. (Aus Symmetriegründen würden wir nun erwarten, dass nur die Hälfte der Teilchen hindurchgeht.) (?) U (b)
(a)
y
y
T
x
x (+x)
(+x) S
P1
T
U
(+x)
P1
y� x�
S
Abb. 6.5: Ein Teilchen in einem (+x)-Zustand verhält sich in (a) und (b) verschieden.
Was hat sich geändert? Die Apparate T und U haben immer noch dieselbe physikalische Beziehung zueinander. Kann sich die Physik ändern, nur weil T und U anders ausgerichtet sind? Nach unserer ursprünglichen Voraussetzung dürfte das nicht sein. Die Amplituden bezüglich T müssen also in den beiden in Abbildung 6.5 gezeigten Fällen verschieden sein – und daher auch in Abbildung 6.4. Für ein Teilchen muss es eine Möglichkeit geben zu erkennen, dass es bei P1 abgebogen ist. Wie könnte es das feststellen? Nun, alles, was wir festgestellt haben, ist,
104
6 Spin 1/2
dass die Beträge von C+� und C+ in beiden Fällen gleich sind, aber sie können – und tatsächlich müssen sie – verschiedene Phasen haben. Wir schließen daraus, dass C+� und C+ verknüpft sind durch C+� = eiλC+ , und dass C−� und C− verknüpft sind durch C−� = eiμC− , wobei λ und μ reelle Zahlen sind, die irgendwie mit dem Winkel zwischen S und T in Zusammenhang stehen. Das Einzige, was wir im Moment über λ und μ sagen können, ist, dass sie nicht gleich zu sein brauchen (außer für den speziellen, in Abbildung 6.5 (a) gezeigten Fall, in dem T dieselbe Orientierung wie S hat). Wir haben gesehen, dass gleiche Änderungen der Phasen in allen Amplituden keine physikalische Auswirkung haben. Aus diesem Grund können wir immer denselben beliebigen Betrag zu λ und μ addieren, ohne etwas zu verändern. Es ist uns daher gestattet, λ und μ so zu wählen, dass sie denselben Betrag haben, aber verschiedene Vorzeichen. Das heißt, wir können immer setzen λ� = λ −
λ+μ , 2
μ� = μ −
λ+μ . 2
Damit erhalten wir λ� =
λ μ − = −μ� . 2 2
Wir führen daher die Konvention1 μ = −λ ein. Wir haben dann folgende allgemeine Regel für die Transformation für eine Drehung des Bezugsapparates um einen Winkel um die z-Achse: C+� = e+iλC+ ,
C−� = e−iλC− .
(6.16)
Die absoluten Beträge sind gleich, nur die Phasen sind verschieden. Diese Phasenfaktoren sind der Grund für die unterschiedlichen Ergebnisse der beiden Experimente von Abbildung 6.5. Nun würden wir gern das Gesetz kennen, das λ zu dem Winkel zwischen S und T in Beziehung setzt. Für einen Fall kennen wir die Antwort schon. Wenn der Winkel null ist, ist λ null. Nun wollen wir voraussetzen, dass die Phasenverschiebung λ eine stetige Funktion des Winkels φ zwischen S und T ist (siehe Abbildung 6.4), wenn φ gegen null geht – wie es auch vernünftig erscheint. Wenn wir also T um den kleinen Winkel � aus der Geraden durch S herausdrehen, ist λ ebenfalls eine kleine Größe, sagen wir m�, wobei m irgendeine Zahl ist. Wir schreiben dies so, weil wir zeigen können, dass λ proportional zu � sein muss. Stellen wir uns vor, wir würden 1
Wenn man es anders betrachtet, bringen wir die Transformation einfach in die „Standardform“, die in Abschnitt 6.2 durch Anwendung von (6.15) beschrieben ist.
6.3 Drehungen um die z-Achse
105
hinter T einen weiteren Apparat T � aufstellen, der seinerseits den Winkel � mit T bildet und daher den Winkel 2� mit S . Dann erhalten wir bezüglich T C+� = eiλC+ und bezüglich T � C+�� = eiλC+� = ei2λC+ . Aber wir wissen, dass wir dasselbe Ergebnis erhalten müssen, wenn wir T � direkt hinter S stellen würden. Folglich wird, wenn der Winkel verdoppelt wird, auch die Phase verdoppelt. Offensichtlich können wir den Beweis erweitern und jede beliebige Drehung aus einer Folge infinitesimaler Drehungen aufbauen. Wir ziehen daraus den Schluss, dass λ für jeden Winkel φ zu diesem Winkel proportional ist. Wir können daher schreiben λ = mφ. Wir erhalten dann das allgemeine Resultat, dass für eine Drehung von T bezüglich S um die z-Achse um den Winkel φ gilt C+� = eimφC+ ,
C−� = e−imφC− .
(6.17)
Für den Winkel φ und für alle Drehungen, von denen wir in Zukunft sprechen werden, führen wir die Standardkonvention ein, dass eine positive Drehung eine Rechtsdrehung um die positive Richtung der Bezugsachse ist. Ein positives φ hat den Drehsinn einer Rechtsschraube, die in positive z-Richtung eingeschraubt wird. Nun müssen wir herausfinden, was m ist. Zuerst probieren wir einmal folgenden Ansatz: Angenommen, T würde um 360◦ gedreht; dann ist T offenbar wieder bei null Grad angelangt, und wir sollten C+� = C+ und C−� = C− erhalten oder, was dasselbe ist, eim2π = 1. Wir erhalten m = 1. Diese Argumentation ist aber falsch! Um zu verstehen warum, denken Sie sich T um 180◦ gedreht. Wenn m gleich 1 wäre, würden wir C+� = eiπ C+ = −C+ und C−� = e−iπ C− = −C− erhalten. Dies ist jedoch schon wieder der ursprüngliche Zustand. Beide Amplituden sind einfach mit −1 multipliziert worden, was wieder das ursprüngliche physikalische System ergibt. (Es ist wieder ein Fall von gemeinsamer Phasenänderung.) Das bedeutet, dass bei einem Anwachsen des Winkels zwischen S und T in Abbildung 6.5 (b) auf 180◦ das System (bezüglich T ) von der Null-Grad-Situation nicht zu unterscheiden wäre, und die Teilchen würden wieder durch den (+)-Zustand des U-Apparates gehen. Bei 180◦ ist also der (+)-Zustand des U-Apparates der (−x)-Zustand des ursprünglichen S -Apparates. Daher würde also ein (+x)-Zustand zu einem (−x)-Zustand werden. Aber wir haben nichts getan, um den ursprünglichen Zustand zu ändern; die Antwort ist falsch. Wir können nicht m = 1 erhalten. Die Situation muss so sein, dass nur eine Drehung um 360◦ und kein kleinerer Winkel denselben physikalischen Zustand reproduziert. Dies wird zutreffen, wenn m = 21 ist. Dann und nur dann ist der erste Winkel, der denselben physikalischen Zustand reproduziert, φ = 360◦.2 Es ergibt sich ⎫ C+� = −C+ ⎪ ⎪ ⎬ ◦ (6.18) ⎪ ⎪ 360 um die z-Achse. � C = −C ⎭ −
2
−
Es scheint, dass m = − 12 es auch tun würde. In (6.17) sehen wir jedoch, dass eine Änderung des Vorzeichens lediglich die Notation für ein Teilchen mit Spin up umdefiniert.
106
6 Spin 1/2
Es ist sehr eigenartig, wenn man sagt, dass man bei einer Drehung des Apparates um 360◦ neue Amplituden erhält. Wirklich neu sind sie aber denn doch nicht, weil die gemeinsame Änderung des Vorzeichens keine andere Physik ergibt. Wenn sich ein Anderer entschlossen hat, sämtliche Vorzeichen der Amplituden zu ändern, weil er gedacht hat, er hätte um 360◦ gedreht, dann ist das auch in Ordnung, er erhält dieselbe Physik.3 Daher lautet unsere abschließende Antwort: Wenn wir die Amplituden C+ und C− für Spin- 21 -Teilchen im Hinblick auf ein Bezugssystem S kennen, und wenn wir dann das auf T bezogene Basissystem benutzen, das wir aus S durch eine Drehung um φ um die z-Achse erhalten, dann werden die neuen Amplituden durch die alten folgendermaßen ausgedrückt ⎫ C+� = eiφ/2C+ ⎪ ⎪ ⎬ ⎪ ⎪ φ um z . � −iφ/2 C− = e C− ⎭
6.4
(6.19)
Drehungen um 180◦ und um 90◦ um die y-Achse
Als Nächstes wollen wir versuchen, die Transformation für eine Drehung von T bezüglich S um 180◦ um eine Achse senkrecht zur z-Achse – sagen wir um die y-Achse – zu ermitteln. (Die Koordinatenachsen haben wir in Abbildung 6.1 festgelegt.) Mit anderen Worten, wir beginnen mit zwei identischen Stern-Gerlach-Apparaten, wobei der zweite, T , in Bezug auf den ersten, S , „auf dem Kopf steht“ (siehe Abbildung 6.6).
T
S z
Abb. 6.6: Eine Drehung um 180◦ um die y-Achse.
y
Wenn wir uns unsere Teilchen als kleine magnetische Dipole denken, wird ein Teilchen, das im (+S )-Zustand ist – sodass es den „oberen“ Weg im ersten Apparat nimmt –, auch im zweiten Apparat den „oberen“ Weg nehmen, sodass es bezüglich T im Minus-Zustand ist. (Im umgekehrten T -Apparat sind sowohl die Gradienten als auch die Feldrichtung umgedreht, die Kraft auf ein Teilchen, dessen magnetisches Moment eine gegebene Richtung hat, bleibt somit unverändert.) Jedenfalls wird das, was bezüglich S „oben“ ist, bezüglich T „unten“ sein. Für diese relativen Lagen von S und T wissen wir dann, dass die Transformation ergeben muss |C+� | = |C− | , 3
|C−� | = |C+ | .
Wenn etwas in einer Folge von kleinen Drehungen gedreht worden ist, sodass es im Endergebnis wieder in die Ausgangslage zurückkehrt, ist es auch möglich, die Auffassung zu vertreten, dass es um 360◦ gedreht worden ist – im Unterschied zur reinen Null-Drehung –, wenn Sie die ganze Geschichte verfolgt haben. (Interessanterweise gilt dies nicht für eine Drehung um 720◦ .)
6.4 Drehungen um 180◦ und um 90◦ um die y-Achse
107
Wie zuvor können wir zusätzliche Phasenfaktoren nicht ausschließen; wir könnten (für 180◦ um die y-Achse) erhalten C+� = eiβC−
und C−� = eiγ C+ ,
(6.20)
wobei β und γ noch bestimmt werden müssen. Was ist nun mit einer Drehung um 360◦ um die y-Achse? Nun ja, wir kennen bereits die Antwort für eine Drehung um 360◦ um die z-Achse – die Amplitude, in irgendeinem Zustand zu sein, ändert das Vorzeichen. Eine Drehung von 360◦ um eine beliebige Achse bringt uns immer in die ursprüngliche Lage zurück. Für jede 360◦ -Drehung muss dasselbe Ergebnis herauskommen wie bei einer 360◦ -Drehung um die z-Achse – alle Amplituden ändern einfach das Vorzeichen. Nun stellen wir uns vor, wir würden zwei aufeinanderfolgende Drehungen um 180◦ um y vornehmen – wobei wir (6.20) benutzen –, wir sollten das Ergebnis (6.18) erhalten. Es gilt also und
C+�� = eiβ C−� = eiβ eiγ C+ = −C+ C−��
=e
iγ
C+�
(6.21)
iγ iβ
= e e C− = −C− .
Das bedeutet eiβ eiγ = −1 oder eiγ = −e−iβ . Daher kann die Transformation für eine Drehung um 180◦ um die y-Achse geschrieben werden als C+� = eiβC− ,
C−� = −e−iβC+ .
(6.22)
Die eben benutzten Argumente sind genauso gut auf eine Drehung um 180◦ um jede Achse in der xy-Ebene anwendbar, wobei verschiedene Achsen natürlich verschiedene Zahlen für β ergeben können. Das ist jedoch das Einzige, worin sie sich unterscheiden können. Nun besteht eine gewisse Willkür für die Zahl β, aber wenn sie einmal für eine Drehachse in der xy-Ebene spezifiziert ist, ist sie für jede andere Achse festgelegt. Es ist üblich, für eine 180◦-Drehung um die y-Achse β = 0 zu wählen. Um zu zeigen, dass wir diese Wahlmöglichkeit haben, wollen wir uns vorstellen, dass β für eine Drehung um die y-Achse nicht gleich null wäre; dann können wir zeigen, dass es eine andere Achse in der xy-Ebene gibt, für die der entsprechende Phasenfaktor null ist. Wir wollen den Phasenfaktor βA für eine Achse A finden, die den Winkel α mit der y-Achse bildet, wie in Abbildung 6.7 (a) gezeigt. (Im Interesse der Übersichtlichkeit hat α in der Abbildung einen negativen Wert, aber das spielt keine Rolle.) Wenn wir nun einen T -Apparat verwenden, der ursprünglich mit S in einer Linie stand und dann 180◦ um die Achse A gedreht worden ist, werden seine Achsen – die wir x�� , y�� und z�� nennen wollen – so sein, wie in Abbildung 6.7 (a) gezeigt ist. Die Amplituden bezüglich T sind dann gegeben durch C+�� = eiβA C− ,
C−�� = −e−iβA C+ .
(6.23)
Wir können uns nun vorstellen, zu derselben Orientierung durch die zwei aufeinanderfolgenden Drehungen zu gelangen, die in den Teilen (b) und (c) der Abbildung dargestellt sind. Zuerst
108
6 Spin 1/2 z
z x�
(a)
x��
180◦ α
(b)
y
y, y�
α x
180◦
A x
y�� z��
z�
z
x�� (c) 2α x z��
y
y��
Abb. 6.7: Eine 180◦ -Drehung um die Achse A liefert das gleiche Ergebnis wie eine Drehung um 180◦ um y, gefolgt von einer Drehung um z� .
stellen wir uns einen Apparat U vor, der bezüglich S um 180◦ um die y-Achse gedreht ist. Die Achsen x� , y� und z� von U werden dann so sein, wie in Abbildung 6.7 (b) dargestellt, und die Amplituden bezüglich U sind durch (6.22) gegeben. Beachten Sie nun, dass wir durch eine Drehung um die „z-Achse“ von U, nämlich um z� , von U nach T übergehen können, wie in Abbildung 6.7 (c) gezeigt. Aus der Abbildung ist ersichtlich, dass der erforderliche Winkel doppelt so groß ist wie α, aber in die entgegengesetzte Richtung zeigt (bezüglich z� ). Durch Anwendung der Transformation (6.19) mit φ = −2α erhalten wir C+�� = e−iαC+� ,
C−�� = e+iα C−� .
(6.24)
Durch Verknüpfung von (6.24) und (6.22) erhalten wir C+�� = ei(β−α) C− ,
C−�� = −e−i(β−α) C+ .
(6.25)
Diese Amplituden müssen natürlich dieselben wie in (6.23) sein. Daher muss βA mit α und β in der folgenden Beziehung stehen: βA = β − α .
(6.26)
Wenn also der Winkel α zwischen der A-Achse und der y-Achse (von S ) gleich β ist, hat die Transformation für eine Drehung um 180◦ um A ein βA = 0. Wenn nun irgendeine Achse senkrecht zur z-Achse β = 0 hat, können wir sie genauso gut als y-Achse verwenden. Es ist nur eine Frage der Konvention, und wir verwenden die allgemein
6.4 Drehungen um 180◦ und um 90◦ um die y-Achse
109
gebräuchliche. Unser Ergebnis: Für eine Drehung um 180◦ um die y-Achse erhalten wir C+� = C− 180◦ um y . (6.27) C−� = −C+ Da wir gerade über die y-Achse nachdenken, wollen wir als Nächstes nach der Transformationsmatrix für eine Drehung um 90◦ um die y-Achse fragen. Wir können sie finden, weil wir wissen, dass zwei aufeinanderfolgende 90◦ -Drehungen um dieselbe Achse gleich einer 180◦ Drehung sein müssen. Wir beginnen, indem wir die Transformation für 90◦ in der allgemeinsten Form aufschreiben: C+� = a C+ + b C− ,
C−� = c C+ + d C− .
(6.28)
Eine zweite Drehung von 90◦ um dieselbe Achse würde dieselben Koeffizienten haben: C+�� = a C+� + b C−� ,
C−�� = c C+� + d C−� .
(6.29)
Durch Verbindung von (6.28) und (6.29) erhalten wir C+�� = a (a C+ + b C− ) + b (c C+ + d C− ) , C−�� = c (a C+ + b C− ) + d (c C+ + d C− ) .
(6.30)
Aus (6.27) wissen wir jedoch, dass C+�� = C− ,
C−�� = −C+ ,
sodass gelten muss ab + bd = 1 , a2 + bc = 0 , ac + cd = −1 , bc + d 2 = 0 .
(6.31)
Aus diesen vier Gleichungen können wir alle Unbekannten a, b, c und d bestimmen. Es ist nicht schwierig. Betrachten wir die zweite und vierte Gleichung. Aus diesen folgt a2 = d 2 und somit a = d oder a = −d. Aber a = −d entfällt, weil dann die erste Gleichung nicht erfüllt wäre. Daher ist d = a. Wenn wir dies benutzen, erhalten wir sofort, dass b = 1/2a und dass c = −1/2a ist. Nun haben wir alles durch a ausgedrückt. Wenn wir die zweite Gleichung vollständig durch a ausdrücken, erhalten wir a2 −
1 1 = 0 oder a4 = . 4 4a2
Diese Gleichung hat mehrere Lösungen, aber nur ihnen geben den Standardwert für √ zwei von 4 die Determinante. Wir könnten wirklich a = 1/ 2 setzen. Dann ist √ √ b = 1/ 2 , a = 1/ 2 , √ √ d = 1/ 2 , c = −1/ 2 , 4
Die andere Lösung ändert alle Vorzeichen von a, b, c und d und entspricht einer −270◦ -Drehung.
110
6 Spin 1/2
Die Transformation für zwei Apparate S und T , wobei T bezüglich S um 90◦ um die y-Achse gedreht ist, ist somit gegeben durch ⎫ 1 ⎪ C+� = √ (C+ + C− ) ⎪ ⎪ ⎪ ⎪ ⎪ 2 ⎬ ◦ 90 um y . ⎪ ⎪ ⎪ 1 ⎪ � ⎪ ⎪ C− = √ (−C+ + C− ) ⎭ 2
(6.32)
Wir können diese Gleichungen natürlich nach C+ und C− auflösen. Das liefert uns die Transformation für eine Drehung um minus 90◦ um y. Durch Umändern der Striche folgern wir ⎫ 1 ⎪ C+� = √ (C+ − C− ) ⎪ ⎪ ⎪ ⎪ ⎪ 2 ⎬ −90◦ um y . ⎪ ⎪ ⎪ 1 ⎪ � ⎪ ⎪ C− = √ (C+ + C− ) ⎭ 2
(6.33)
Drehungen um die x-Achse
6.5
Vielleicht denken Sie: „Das wird langsam lächerlich. Was werden wir wohl als Nächstes machen, etwa 47◦ um die y-Achse und dann 33◦ um die x-Achse und so weiter ohne Ende?“ Nein, wir sind fast fertig. Mit genau zwei unserer Transformationen, um 90◦ um die y-Achse und um einen beliebigen Winkel um die z-Achse (was wir, wie Sie sich erinnern werden, zuerst behandelt haben), können wir alle Drehungen erzeugen. z
z
(a)
(b) y��
90◦ α y, y� x, z�
x, z��
x� z���
y α x��
z
(c) −90◦
y��� y
x, x
���
Abb. 6.8: Eine Drehung um α um die x-Achse ist gleichwertig mit (a) einer Drehung von +90◦ um y, gefolgt von (b) einer Drehung um α um z� , gefolgt von (c) einer Drehung von −90◦ um y� .
6.5 Drehungen um die x-Achse
111
Zur Illustration nehmen wir an, dass wir um den Winkel α um die x-Achse drehen wollen. Wir wissen, wie man bei dem Winkel α um die z-Achse vorgeht, aber nun möchten wir ihn um die x-Achse haben. Wie machen wir das? Zuerst drehen wir die z-Achse herunter auf x – das ist eine Drehung von +90◦ um y, wie in Abbildung 6.8 gezeigt. Dann drehen wir um den Winkel α um z� . Dann drehen wir 90◦ um y�� . Das Ergebnis der drei Drehungen ist dasselbe wie bei einer Drehung um x um den Winkel α. Das ist eine Eigenschaft des Raumes. (Diese Tatsachen der Verknüpfung von Drehungen und was daraus entsteht sind anschaulich schwierig zu erfassen. Es ist recht seltsam, wo wir doch in drei Dimensionen leben, aber es ist schwer für uns vorstellbar, was geschieht, wenn wir uns einmal so herum und dann so herum drehen. Wenn wir Fische oder Vögel wären und ein wirkliches Verständnis von dem hätten, was geschieht, wenn wir im Raum Purzelbäume schlagen, könnten wir diese Operationen vielleicht leichter erfassen.) Wir wollen jedenfalls die Transformation für eine Drehung um α um die x-Achse ermitteln, indem wir das benutzen, was wir bereits wissen. Nach der ersten Drehung um +90◦ um y verhalten sich die Amplituden gemäß (6.32). Wenn wir die gedrehten Achsen x� , y� und z� nennen, führt uns die nächste Drehung um den Winkel α um z� zu einem System x�� , y�� , z�� , für das gilt C+�� = eiα/2C+� ,
C−�� = e−iα/2C−� .
Die letzte Drehung um −90◦ um y�� bringt uns zu x��� , y��� , z��� ; aus (6.33) folgt 1 � 1 � � � C+��� = √ C+�� − C−�� , C−��� = √ C+�� + C−�� . 2 2 Durch Verknüpfung der letzten beiden Transformationen erhalten wir � 1 � C+��� = √ eiα/2 C+� − e−iα/2C−� , 2 � 1 � C−��� = √ eiα/2 C+� + e−iα/2C−� . 2
Durch Anwendung von (6.32) für C+� und C−� erhalten wir die vollständige Transformation: � 1 � +iα/2 e (C+ + C− ) − e−iα/2 (−C+ + C− ) , 2 � 1 � +iα/2 e = (C+ + C− ) + e−iα/2 (−C+ + C− ) . 2
C+��� = C−���
Diese Formeln können wir in eine einfachere Form bringen, wenn wir daran denken, dass eiθ + e−iθ = 2 cos θ Wir erhalten C+��� C−���
und eiθ − e−iθ = 2i sin θ .
� α� α� = cos C+ + i sin C− 2 2 � α� � α� = i sin C+ + cos C− 2 2 �
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ α um x . ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
(6.34)
Das ist unsere Transformation für eine Drehung um die x-Achse um einen beliebigen Winkel α. Sie ist nur etwas komplizierter als die anderen.
112
6 Spin 1/2 z
z�
y�
α
x�
y
γ x
β x1
6.6
Abb. 6.9: Die Lage eines beliebigen Koordinatensystems x� , y� , z� bezüglich eines anderen Systems x, y, z kann durch die Eulerschen Winkel α, β, γ beschrieben werden.
Beliebige Drehungen
Nun wollen wir beliebige Drehungen betrachten. Die relative Orientierung zweier Koordinatensysteme zueinander wird im allgemeinen Fall durch drei Winkel beschrieben (siehe Abbildung 6.9). Wenn wir ein Koordinatensystem x� , y� , z� und ein Koordinatensystem x, y, z betrachten, können wir die Beziehung zwischen den beiden Systemen mit Hilfe der drei Eulerschen Winkel α, β und γ beschreiben. Diese definieren drei aufeinanderfolgende Drehungen, die das x, y, z-System in das x� , y� , z� -System überführen. Beginnend mit x, y, z, drehen wir unser System um den Winkel β um die z-Achse, sodass die x-Achse nun auf der Linie x1 liegt. Dann drehen wir um α um diese neue x-Achse, wodurch z in z� überführt wird. Schließlich überführt eine Drehung um die neue z-Achse (das ist z� ) um den Winkel γ die x-Achse in x� und die y-Achse in y� .5 Wir kennen die Transformationen für jede der drei Drehungen – sie sind in (6.19) und (6.34) angegeben. Wenn wir sie in der richtigen Reihenfolge verbinden, erhalten wir α i(β+γ)/2 α e C+ + i sin e−i(β−γ)/2 C− , 2 2 α i(β−γ)/2 α −i(β+γ)/2 � C− = i sin e C+ + cos e C− . 2 2 C+� = cos
(6.35)
Ausgehend von einigen Voraussetzungen über die Eigenschaften des Raumes, haben wir also die Amplitudentransformation für jede beliebige Drehung hergeleitet. Das heißt, dass wir bei Kenntnis der Amplituden für einen beliebigen Zustand eines Spin- 21 -Teilchens, in die zwei Strahlen eines Stern-Gerlach-Apparates S mit den Achsen x, y und z zu gehen, berechnen können, welcher Anteil in jeden Strahl eines Apparates T mit den Achsen x� , y� und z� gehen würde. Mit anderen Worten, wenn wir einen Zustand ψ eines Spin- 21 -Teilchens haben, dessen Amplituden, bezüglich der z-Achse des x, y, z-Systems „up“ und „down“ zu sein, C+ = � + | ψ � und C− = � − | ψ � sind, dann kennen wir auch die Amplituden C+� und C−� , „up“ und „down“ bezüglich der z� -Achse irgendeines anderen Systems x� , y� , z� zu sein. Die vier Koeffizienten in den 5
Mit etwas Aufwand können Sie auch zeigen, dass das x, y, z-System durch die folgenden drei Drehungen um die ursprünglichen Achsen in das x� , y� , z� -System gebracht werden kann: (1) Drehung um den Winkel γ um die ursprüngliche z-Achse, (2) Drehung um den Winkel α um die ursprüngliche x-Achse, (3) Drehung um den Winkel β um die ursprüngliche z-Achse.
6.6 Beliebige Drehungen z
113 A
θ
y
0 B
x
φ
Abb. 6.10: Eine durch die Polarwinkel θ und φ definierte Achse A.
Gleichungen (6.35) sind die Terme der „Transformationsmatrix“, mit der wir die Amplituden eines Spin- 21 -Teilchens in ein anderes Koordinatensystem projizieren können. Wir wollen nun anhand einiger Beispiele zeigen, wie das alles funktioniert. Betrachten wir zunächst das folgende einfache Problem. Wir schicken ein Spin- 21 -Teilchen durch einen SternGerlach-Apparat, der nur den (+z)-Zustand durchlässt. Wie groß ist die Amplitude, dass es im (+x)-Zustand sein wird? Die +x-Achse ist dieselbe wie die +z� -Achse eines um 90◦ um die y-Achse gedrehten Systems. Für dieses Problem ist es dann am einfachsten, die Gleichungen (6.32) zu benutzen – obwohl Sie natürlich auch die vollständigen Gleichungen (6.35) be√ nutzen können. Da C+ = 1 und C− = 0 ist, erhalten wir C+� = 1/ 2. Die Wahrscheinlichkeiten sind das Absolutquadrat dieser Amplituden; es besteht eine Wahrscheinlichkeit von 50 Prozent, dass das Teilchen durch einen Apparat gehen wird, der den (+x)-Zustand auswählt. Wenn wir √ nach dem (−x)-Zustand gefragt hätten, wäre die Amplitude −1/ 2, was auch eine Wahrscheinlichkeit von 1/2 ergibt, wie man wegen der Symmetrie des Raumes erwarten würde. Wenn daher ein Teilchen im (+z)-Zustand ist, befindet es sich mit jeweils der gleichen Wahrscheinlichkeit, aber entgegengesetzten Phasen im (+x)- bzw. (−x)-Zustand. Ebenso gibt es in Bezug auf y keine Vorzugsvariante. Ein Teilchen im (+z)-Zustand ist jeweils mit der Wahrscheinlichkeit 1/2 im (+y)- oder (−y)-Zustand. Für diese (bei Anwen√ sind jedoch √ dung der Formel für eine −90◦-Drehung um x) die Amplituden 1/ 2 und −i 2. In diesem Fall haben die Amplituden die Phasendifferenz 90◦ anstatt 180◦, wie bei (+x) und (−x). Auf diese Weise zeigt sich tatsächlich der Unterschied zwischen x und y. Als letztes Beispiel nehmen wir an, wir wüssten, dass ein Spin- 21 -Teilchen in einem Zustand ψ ist, und zwar, dass es längs einer Achse A, die durch die Winkel θ und φ in Abbildung 6.10 festgelegt ist, „up“ polarisiert ist. Wir möchten die Amplitude C+ wissen, dass das Teilchen längs z „up“ ist, und die Amplitude C− , dass es längs z „down“ ist. Wir können diese Amplituden finden, wenn wir uns vorstellen, dass A die z-Achse eines Systems ist, dessen x-Achse in beliebiger Richtung liegt – sagen wir in der Ebene, die durch A und z gebildet wird. Wir können dann mit drei Drehungen das System von A in x, y, z überführen. Zuerst führen wir eine Drehung um −π/2 um die Achse A aus, wodurch die x-Achse in die Linie B der Abbildung überführt wird. Dann drehen wir um θ um die Gerade B (die neue x-Achse des Systems A), um
114
6 Spin 1/2
A in die z-Achse zu überführen. Schließlich drehen wir um den Winkel (π/2 − φ) um z. Wenn wir bedenken, dass wir bezüglich A nur den (+)-Zustand haben, erhalten wir C+ = cos
θ −iφ/2 e , 2
C− = sin
θ +iφ/2 e . 2
(6.36)
Zum Schluss wollen wir die Ergebnisse dieses Kapitels in einer für unsere weiteren Betrachtungen nützlichen Form zusammenfassen. Zuerst rufen wir uns in Erinnerung, dass unser ursprüngliches Ergebnis, gegeben durch (6.35), in einer anderen Notation geschrieben werden kann. Beachten Sie, dass die Gleichungen (6.35) genau dasselbe bedeuten wie (6.4). Das heißt, in (6.35) sind die Koeffizienten von C+ = � +S | ψ � und C− = � −S | ψ � gerade die Amplituden � jT | iS � von (6.4) – das sind die Amplituden, dass ein Teilchen im i-Zustand bezüglich S im j-Zustand bezüglich T befindet (wenn die Lage von T bezüglich S durch die Winkel α, β und γ gegeben ist). In (6.6) hatten wir sie RTjiS genannt. (Wir haben eine Fülle von Schreibweisen!) Zum Beispiel ist RT−+S = � −T | +S � der Koeffizient von C+ in der Formel für C−� , nämlich i sin(α/2)ei(β−γ)/2 . Wir können daher unsere Ergebnisse in Form der Tabelle 6.1 zusammenfassen.
Tabelle 6.1: Die Amplituden � jT | iS � für eine durch die Eulerschen Winkel α, β, γ aus Abbildung 6.9 definierte Drehung.
R ji (α, β, γ)
� jT | iS � +T −T
+S α i(β+γ)/2 cos e 2 α i(β−γ)/2 i sin e 2
−S α −i(β−γ)/2 i sin e 2 α −i(β+γ)/2 cos e 2
Es wird manchmal praktisch sein, diese Amplituden für einige einfache Spezialfälle schon ausgerechnet zu haben. Mit Rz (φ) wollen wir eine Drehung um den Winkel φ um die z-Achse bezeichnen. Wir können damit auch die entsprechende Drehmatrix bezeichnen (wenn wir die Indizes i und j weglassen, die als mit inbegriffen zu verstehen sind). In demselben Sinne bezeichnen R x (φ) und Ry (φ) Drehungen um den Winkel φ um die x-Achse bzw. die y-Achse. In Tabelle 6.2 geben wir die Matrizen an – die Tabellen der Amplituden � jT | iS � –, die die Amplituden aus dem S -System in das T -System projizieren, wobei T aus S durch die angegebene Drehung hervorgeht.
6.6 Beliebige Drehungen
115
Tabelle 6.2: Die Amplituden � jT | iS � für eine Drehung R(φ) um den Winkel φ um die z-Achse, x-Achse oder y-Achse.
Rz (φ)
� jT | iS �
+S
+T
eiφ/2
−T
0
−S 0
e
−iφ/2
R x (φ) � jT | iS �
+S
−S
+T
cos φ/2
i sin φ/2
−T
i sin φ/2
cos φ/2
Ry (φ) � jT | iS �
+S
−S
+T
cos φ/2
sin φ/2
−T
− sin φ/2
cos φ/2
7
Die Zeitabhängigkeit der Amplituden
Siehe auch: Band I, Kapitel 17, Raumzeit Band II, Kapitel 23, Schwebungen
7.1
Atome in Ruhe; stationäre Zustände
Wir wollen uns nun ein wenig mit dem zeitlichen Verhalten der Wahrscheinlichkeitsamplituden beschäftigen. Wir sagen „ein wenig“, weil in das tatsächliche zeitliche Verhalten auch das räumliche Verhalten mit eingeht. Folglich kommen wir sofort in die denkbar schwierigste Situation, wenn wir es korrekt und detailliert behandeln wollen. Wir haben immer die Schwierigkeit, dass wir etwas entweder streng logisch, jedoch recht abstrakt behandeln können, oder wir können etwas tun, was streng genommen nicht richtig ist, was uns aber eine Vorstellung von den tatsächlichen Gegebenheiten gibt – dabei verschieben wir eine sorgfältigere Behandlung auf später. Was die Energieabhängigkeit betrifft, werden wir den zweiten Weg wählen. Wir wollen eine Reihe von Angaben machen, bei denen wir nicht versuchen, genau zu sein – sondern wir berichten einfach über Dinge, die man herausgefunden hat, um Ihnen ein Gefühl für das Verhalten der Amplituden als Funktionen der Zeit zu geben. Im Voranschreiten wird die Genauigkeit der Beschreibung zunehmen. Werden Sie daher nicht nervös, wenn es so scheint, als seien die Aussagen aus der Luft gegriffen. Natürlich ist alles aus der Luft gegriffen – aus der Luft der Experimente und der Vorstellungskraft des Menschen. Aber es würde zu lange dauern, der historischen Entwicklung zu folgen, wir müssen daher irgendwo hineinspringen. Wir könnten in das Abstrakte hineinspringen und alles herleiten – was Sie nicht verstehen würden – oder wir könnten eine große Anzahl von Experimenten durchgehen, um jede Feststellung zu begründen. Wir werden den Mittelweg wählen. Ein Elektron, allein im leeren Raum, kann unter gewissen Umständen eine konstante Energie haben. Wenn es sich zum Beispiel in Ruhe befindet (sodass es keine Translationsbewegung ausführt, keinen Impuls und keine kinetische Energie hat), hat es doch seine Ruheenergie. Ein kompliziertes Objekt, wie ein Atom, kann auch eine konstante Energie haben, wenn es sich in Ruhe befindet, aber es kann auch intern auf ein höheres Energieniveau angeregt sein. (Wir wollen diesen Mechanismus später beschreiben.) Ein Atom in einem angeregten Zustand können wir oft so betrachten, als hätte es eine konstante Energie, aber das ist nur näherungsweise richtig. Ein Atom bleibt nicht für immer angeregt, weil es ihm früher oder später gelingt, seine Energie durch Wechselwirkung an das elektromagnetische Feld abzugeben. Es gibt daher eine Amplitude für das Entstehen eines neuen Zustands, in dem das Atom in einem niedrigeren und das elektromagnetische Feld in einem höheren Anregungszustand ist. Die Gesamtenergie des Systems ist vorher und hinterher dieselbe, aber die Energie des Atoms hat sich verringert. Es
118
7 Die Zeitabhängigkeit der Amplituden
ist daher nicht ganz richtig, wenn man sagt, ein angeregtes Atom habe eine konstante Energie, aber es ist häufig bequem und nicht allzu falsch, wenn man sagt, dass es sie hätte. (Übrigens, warum läuft der Prozess in dieser Richtung ab und nicht in der anderen? Warum strahlt ein Atom Licht aus? Die Antwort hängt mit der Entropie zusammen. Wenn die Energie in das elektromagnetische Feld übergeht, kann sie darin auf so viele verschiedene Arten verteilt sein, dass wir bei der Suche nach dem Gleichgewichtszustand finden, dass in der wahrscheinlichsten Situation das Feld durch ein Photon angeregt ist und nicht das Atom. Es dauert sehr lange, bis das Photon zurückkommt und feststellt, dass es das Atom wieder aufmuntern kann. Es ist dem klassischen Problem durchaus analog: Warum strahlt eine beschleunigte Ladung? Nicht, weil sie Energie zu verlieren „wünscht“, weil ja tatsächlich, wenn sie strahlt, die Energie der Welt dieselbe wie vorher bleibt. Strahlung oder Absorption läuft in Richtung wachsender Entropie ab.) Kerne können auch auf verschiedenen Energieniveaus existieren, und in einer Näherung, die die elektromagnetischen Effekte außer Acht lässt, können wir sagen, dass ein angeregter Kern in diesem Zustand verbleibt. Obwohl wir wissen, dass er nicht für immer in diesem Zustand verbleibt, ist es doch oft nützlich, mit einer Näherung zu beginnen, die etwas idealisiert und leichter zu erfassen ist. Unter gewissen Umständen ist es oft auch eine gerechtfertigte Näherung. (Als wir anfangs die klassischen Gesetze des fallenden Körpers einführten, haben wir die Reibung nicht berücksichtigt, aber es gibt kaum einen Fall, in dem nicht irgendeine Reibung auftritt.) Dann gibt es die subnuklearen „seltsamen Teilchen“, die verschiedene Massen haben. Aber die schweren zerfallen in andere leichte Teilchen, sodass es wieder nicht richtig ist, wenn man sagt, dass sie eine konstante Energie haben. Das wäre nur dann richtig, wenn sie für immer bestehen würden. Wenn wir daher näherungsweise sagen, dass sie eine konstante Energie haben, blenden wir die Tatsache aus, dass sie zerfallen können. Im Moment wollen wir also solche Vorgänge bewusst ignorieren und erst später lernen, wie man sie berücksichtigt. Nehmen wir an, wir hätten ein Atom, ein Elektron oder irgendein anderes Teilchen, das in Ruhe eine konstante Energie E0 hat. Mit der Energie E0 meinen wir die Masse des Teilchens mal c2 . Diese Masse enthält ggf. innere Energie; ein angeregtes Atom hat daher eine Masse, die sich von der Masse desselben Atoms im Grundzustand unterscheidet. (Der Grundzustand sei der Zustand mit der niedrigsten Energie.) E0 wollen wir die „Ruheenergie“ nennen. Bei einem Atom in Ruhe ist die quantenmechanische Amplitude, das Atom an einem Ort zu finden, überall dieselbe; sie hängt nicht vom Ort ab. Dies bedeutet natürlich, dass die Wahrscheinlichkeit, das Atom irgendwo zu finden, immer dieselbe ist. Aber es bedeutet sogar noch mehr. Die Wahrscheinlichkeit könnte zwar unabhängig vom Ort sein, und doch könnte sich die Phase der Amplitude von Punkt zu Punkt ändern. Aber für ein Teilchen in Ruhe ist die gesamte Amplitude überall gleich. Sie hängt jedoch von der Zeit ab. Für ein Teilchen in einem Zustand mit konstanter Energie E0 ist die Amplitude, das Teilchen zur Zeit t bei (x, y, z) zu finden, gleich ae−i(E0 /)t ,
(7.1)
wobei a eine Konstante ist. Die Amplitude, an irgendeinem Ort im Raum zu sein, ist für alle Orte gleich, hängt aber gemäß (7.1) von der Zeit ab. Wir werden einfach annehmen, dass diese Regel richtig ist.
7.1 Atome in Ruhe; stationäre Zustände
119
Wir könnten (7.1) natürlich auch in der Form ae−iωt
(7.2)
schreiben. Dabei gilt ω = E0 = Mc2 , wobei M die Ruhemasse des atomaren Zustandes oder Teilchens ist. Es gibt drei verschiedene Möglichkeiten, die Energie anzugeben: Durch die Frequenz einer Amplitude, durch die Energie im klassischen Sinne oder durch die Trägheit. Sie sind alle gleichwertig; es sind einfach verschiedene Arten, dasselbe auszudrücken. Sie denken vielleicht, dass es seltsam ist, sich ein „Teilchen“ vorzustellen, dass sich an jedem Ort des Raumes mit der gleichen Amplitude aufhält. Schließlich stellen wir uns ein „Teilchen“ gewöhnlich als kleinen Gegenstand vor, der sich „irgendwo“ befindet. Aber vergessen Sie nicht das Unbestimmtheitsprinzip. Wenn ein Teilchen eine bestimmte Energie hat, hat es auch einen bestimmten Impuls. Wenn die Unbestimmtheit des Impulses null ist, sagt uns die Unbestimmtheitsrelation ΔpΔx ≈ , dass die Unbestimmtheit des Ortes unendlich groß sein muss, und das ist genau das, was wir meinen, wenn wir sagen, dass das Teilchen an jedem Ort des Raumes mit der gleichen Amplitude angetroffen wird. Wenn die Bestandteile eines Atomes in einem anderen Zustand mit einer anderen Gesamtenergie sind, dann ist auch die zeitliche Änderung der Amplitude anders. Wenn Sie nicht wissen, in welchem Zustand es ist, wird es eine gewisse Amplitude dafür geben, dass es in dem einen Zustand ist, und eine gewisse Amplitude, dass es in einem anderen ist – und jede dieser Amplituden wird eine andere Frequenz haben. Es wird eine Interferenz zwischen diesen verschiedenen Amplituden geben – wie eine Schwebung –, die als eine sich ändernde Wahrscheinlichkeit auftreten kann. Es wird etwas in dem Atom „vorgehen“, auch wenn es in dem Sinne „in Ruhe“ ist, dass sein Schwerpunkt sich nicht bewegt. Wenn jedoch das Atom eine bestimmte Energie hat, ist die Amplitude durch (7.1) gegeben, und das Absolutquadrat dieser Amplitude hängt nicht von der Zeit ab. Wenn ein Objekt eine konstante Energie hat und Sie nach irgendwelchen Wahrscheinlichkeiten fragen, dann wird die Antwort unabhängig von der Zeit sein. Obwohl die Amplitude bei konstanter Energie gemäß einer imaginären Exponentialfunktion zeitlich variiert, ändert sich ihr Absolutbetrag nicht. Darum sagen wir oft, dass ein Atom in einem bestimmten Energieniveau in einem stationären Zustand ist. Wenn Sie irgendwelche Messungen durchführen, die sein Inneres betreffen, dann werden Sie feststellen, dass es keine zeitlichen Änderungen (in den Wahrscheinlichkeiten) gibt. Damit sich die Wahrscheinlichkeiten zeitlich ändern, muss es Interferenz von zwei Amplituden mit zwei verschiedenen Frequenzen geben, und das bedeutet, dass wir nicht wissen können, wie groß die Energie ist. Das Objekt wird eine Amplitude haben, in einem Zustand mit der einen Energie zu sein, und eine andere Amplitude, in einem Zustand mit einer anderen Energie zu sein. Das ist die quantenmechanische Beschreibung von Dingen, deren Verhalten von der Zeit abhängt. Wenn wir eine „Gegebenheit“ haben, die eine Mischung aus zwei verschiedenen Zuständen mit verschiedenen Energien ist, dann ändert sich die Amplitude für jeden der beiden Zustände mit der Zeit gemäß (7.2) zum Beispiel wie e−i(E1 /)t
und e−i(E2 /)t .
(7.3)
120
7 Die Zeitabhängigkeit der Amplituden
Und wenn wir eine Kombination der beiden Zustände haben, wird es eine Interferenz geben. Aber beachten Sie, dass die Addition einer Konstanten zu beiden Energien keinen Unterschied ergibt. Wenn jemand anderes eine andere Energieskala benutzen würde, bei der alle Energien um einen konstanten Betrag – sagen wir um den Betrag A – erhöht (oder vermindert) sind, dann wären die Amplituden in den beiden Zuständen von seinem Standpunkt aus e−i(E1 +A)t/
und e−i(E2 +A)t/ .
(7.4)
Seine Amplituden würden alle mit demselben Faktor e−i(A/)t multipliziert, und alle Linearkombinationen oder Interferenzen hätten denselben Faktor. Wenn wir die Absolutquadrate bilden, um die Wahrscheinlichkeiten zu ermitteln, wären alle Ergebnisse die gleichen. Die Wahl des Anfangspunktes für unsere Energieskala ist nicht ausschlaggebend; wir können die Energie bezogen auf jeden beliebigen Nullpunkt messen. Für relativistische Zwecke ist es vorteilhaft, die Energie so zu messen, dass die Ruhemasse mit einbezogen ist, aber für Zwecke, die nicht relativistisch sind, ist es häufig angebracht, einen Standardbetrag von allen auftretenden Energien abzuziehen. Beim Atom zum Beispiel ist es meist bequem, die Energie M s c2 abzuziehen, wobei M s die Masse aller einzelnen Teile – des Kerns und der Elektronen – ist, die natürlich von der Masse des Atoms verschieden ist. Bei anderen Problemen dürfte es nützlich sein, von allen Energien den Betrag Mg c2 abzuziehen, wobei Mg die Masse des ganzen Atoms im Grundzustand ist; dann ist die auftretende Energie gerade die Anregungsenergie des Atoms. Wir können daher manchmal den Nullpunkt für die Energie um eine sehr große Konstante verschieben. Dies spielt aber keine Rolle, solange wir in einer Rechnung alle Energien um dieselbe Konstante verschieben. So viel sei für ein ruhendes Teilchen gesagt.
7.2
Gleichförmige Bewegung
Wenn wir annehmen, dass die Relativitätstheorie richtig ist, kann ein Teilchen, das in einem Inertialsystem in Ruhe ist, in einem anderen Inertialsystem in gleichförmiger Bewegung sein. In dem Ruhesystem des Teilchens ist die Wahrscheinlichkeitsamplitude für alle x, y und z die gleiche, sie ändert sich aber mit t. Der Betrag der Amplitude ist für alle t der gleiche, aber die Phase hängt von t ab. Wir können uns ein Bild von dem Verhalten der Amplitude machen, wenn wir die Linien gleicher Phase – sagen wir die Linien der Nullphase – als Funktion von x und t auftragen. Bei einem ruhenden Teilchen liegen diese Linien gleicher Phase parallel zur x-Achse und haben äquidistante Abstände in der t-Koordinate, was mit den gestrichelten Linien in Abbildung 7.1 dargestellt ist. In einem anderen System – x� , y� , z� , t� –, das sich in Bezug auf das Teilchen zum Beispiel in x-Richtung bewegt, sind die x� - und t� -Koordinaten von einem speziellen Punkt im Raum mit x und t durch die Lorentz-Transformation verknüpft. Diese Transformation kann graphisch dargestellt werden, indem man die x� - und t� -Achsen einzeichnet, wie es in Abbildung 7.1 geschehen ist. (Siehe Kapitel 17, Bd. I, Abbildung 17.2.) Sie können sehen, dass die Punkte gleicher Phase1 im x� , t� -System entlang der t� -Achse einen anderen Abstand haben, sodass die 1
Wir setzen voraus, dass die Phasen an entsprechenden Punkten in den beiden Systemen denselben Wert haben. Das ist jedoch etwas verzwickt, da die Phase einer quantenmechanischen Amplitude weitgehend willkürlich ist. Eine vollständige Rechtfertigung dieser Annahme erfordert eine ausführlichere Diskussion, die Interferenzen von zwei oder mehr Amplituden umfasst.
7.2 Gleichförmige Bewegung t
121
t�
x�
x
Abb. 7.1: Relativistische Transformation der Amplitude eines im x-t-System ruhenden Teilchens.
Frequenz der zeitlichen Änderung anders ist. Auch ändert sich die Phase mit x� , sodass die Wahrscheinlichkeitsamplitude eine Funktion von x� sein muss. Bei einer Lorentz-Transformation für die Geschwindigkeit v, sagen wir in negativer x-Richtung, ist die Zeit t mit der Zeit t� verknüpft durch t� − x� v/c2 t= , 1 − v2 /c2
sodass unsere Amplitude nun gemäß √ √ −(i/) E0 t� / 1−v2 /c2 −E0 vx� /c2 1−v2 /c2 e−(i/)E0 t = e variiert. Im gestrichenen System ändert sie sich sowohl räumlich als auch zeitlich. Wenn wir die Amplitude als e−(i/)(E p t −p x ) � �
� �
schreiben, sehen wir, dass E �p = E0 / 1 − v2 /c2 die Energie ist, die man klassisch für ein Teilchen der Ruheenergie E0 berechnet, das sich mit der Geschwindigkeit v bewegt; p� = E �p v/c2 ist der dazugehörige Teilchenimpuls. Sie wissen, dass xμ = (t, x, y, z) und pμ = (E, p x, py , pz ) Vierervektoren sind und dass pμ xμ = Et − p · x eine skalare Invariante ist. Im Ruhesystem des Teilchens ist pμ xμ gerade gleich E0 t. Wenn wir daher auf ein anderes System transformieren, wird E0 t ersetzt durch E �p t� − p� · x� . Folglich wird die Wahrscheinlichkeitsamplitude eines Teilchens mit Impuls p proportional zu e−(i/)(E p t− p·x) , wobei E p die Energie eines Teilchens mit dem Impuls p ist, das heißt E p = (pc)2 + E02 ,
wobei E0 , wie vorher, die Ruheenergie ist.
(7.5)
(7.6)
122
7 Die Zeitabhängigkeit der Amplituden
Für nichtrelativistische Probleme können wir schreiben E p = M s c2 + W p ,
(7.7)
wobei W p die Energie oberhalb der Ruheenergie M s c2 der Bestandteile des Atoms ist. Im Allgemeinen enthält W p sowohl die kinetische Energie des Atoms als auch seine Bindungs- oder Anregungsenergie, die wir die „innere“ (engl. internal) Energie nennen können. Wir schreiben W p = Wint +
p2 , 2M
(7.8)
und die Amplituden sind proportional zu e−(i/)(W p t− p·x) .
(7.9)
Da wir im Allgemeinen nichtrelativistische Rechnungen ausführen, werden wir diese Form für die Wahrscheinlichkeitsamplituden benutzen. Beachten Sie, dass wir durch die relativistische Transformation die Änderung der Amplitude eines Atoms erhalten haben, welches sich im Raum bewegt, ohne jede zusätzliche Voraussetzung. Die Wellenzahl der räumlichen Änderung ist nach (7.9) k=
p .
(7.10)
Damit wird die Wellenlänge λ=
2π h = . k p
(7.11)
Dies ist dieselbe Wellenlänge, die wir vorher für Teilchen mit dem Impuls p benutzt haben. Zu dieser Formel gelangte zuerst de Broglie auf genau die gleiche Weise. Für ein bewegtes Teilchen ist die Frequenz der Amplitudenvariation immer noch gegeben durch ω = W p .
(7.12)
Das Absolutquadrat von (7.9) ist genau 1. Daher ist für ein bewegtes Teilchen mit bestimmter Energie die Wahrscheinlichkeit, es anzutreffen, überall die gleiche, und sie ändert sich nicht mit der Zeit. (Es ist wichtig zu beachten, dass die Amplitude eine komplexe Welle ist. Wenn wir eine reelle Sinuswelle benutzen würden, würde sich das Quadrat von Punkt zu Punkt ändern, was nicht richtig wäre.) Wir wissen natürlich, dass es Situationen gibt, in denen sich die Teilchen von Ort zu Ort bewegen, sodass die Wahrscheinlichkeit räumlich und zeitlich variiert. Wie beschreiben wir solche Situationen? Nun, wir betrachten dazu Amplituden, die eine Überlagerung von zwei oder mehr Amplituden von Zuständen mit bestimmter Energie sind. Wir haben diese Situation schon in Kapitel 23 von Band II – sogar für Wahrscheinlichkeitsamplituden – besprochen! Wir haben herausgefunden, dass die Summe zweier Amplituden mit verschiedenen Wellenzahlen k (das sind Impulse) und Frequenzen ω (das sind Energien) Interferenzbuckel oder Schwebungen ergeben, sodass sich das Quadrat der Amplitude räumlich und zeitlich ändert. Außerdem haben
7.2 Gleichförmige Bewegung
123
wir festgestellt, dass sich diese Schwebungen mit der so genannten „Gruppengeschwindigkeit“ bewegen, die gegeben ist durch vg =
Δω , Δk
wobei Δk und Δω die Differenzen zwischen den Wellenzahlen bzw. Frequenzen der beiden Wellen sind. Bei komplizierten Wellen – bestehend aus der Summe von vielen Amplituden, die alle nahezu dieselbe Frequenz haben – ist die Gruppengeschwindigkeit vg =
dω . dk
(7.13)
Wenn wir ω = E p / und k = p/ setzen, sehen wir, dass vg =
dE p . dp
(7.14)
Durch Anwendung von (7.6) ergibt sich dE p p = c2 . dp Ep
(7.15)
Es gilt aber E p = Mc2 , und damit wird dE p p = , dp M
(7.16)
was genau die klassische Geschwindigkeit des Teilchens ist. Wenn wir dagegen die nichtrelativistischen Ausdrücke benutzen, erhalten wir ω=
Wp
und k =
p
und d p2 p dω dW p = = = , dk dp dp 2M M
(7.17)
was wieder die klassische Geschwindigkeit ist. Unser Ergebnis ist somit, dass im Falle mehrerer Amplituden für reine Energiezustände von fast derselben Energie ihre Interferenz „Wahrscheinlichkeitsklümpchen“ ergibt, die sich mit der Geschwindigkeit eines klassischen Teilchens dieser Energie durch den Raum bewegen. Es sei angemerkt, dass wir etwas Neues eingeführt haben – was wir nicht aus der Relativitätstheorie herleiten können –, wenn wir sagen, dass wir zwei Amplituden mit verschiedenen Wellenzahlen zu einer Schwebung addieren können, die einem bewegten Teilchen entspricht. Wir haben gesagt, wie sich die Amplitude für ein ruhendes Teilchen verhält, und haben dann abgeleitet, wie sie sich verhalten würde, wenn sich das Teilchen bewegte. Aber aus diesen Voraussetzungen können wir nicht herleiten, was geschehen wird, wenn es zwei Wellen gibt, die sich mit verschiedenen Geschwindigkeiten bewegen. Wenn wir eine anhalten, können wir nicht die andere anhalten. Wir haben daher stillschweigend die zusätzliche Hypothese aufgestellt, dass nicht nur (7.9) eine mögliche Lösung ist, sondern dass es für dasselbe System auch Lösungen mit allen Arten von p’s geben kann und dass die verschiedenen Terme interferieren werden.
124
7 Die Zeitabhängigkeit der Amplituden
7.3
Potentielle Energie; Energieerhaltung
Wir möchten jetzt untersuchen, was geschieht, wenn sich die Energie eines Teilchens ändern kann. Wir beginnen mit einem Teilchen, das sich in einem durch ein Potential beschriebenen Kraftfeld bewegt. Wir besprechen zuerst die Wirkung eines konstanten Potentials. Stellen wir uns vor, wir hätten eine große Metalldose, die wir auf ein elektrostatisches Potential φ gebracht haben (siehe Abbildung 7.2). Wenn in der Dose geladene Objekte sind, ist deren potentielle Energie qφ, wir wollen sie V nennen, und sie ist vollkommen unabhängig vom Ort. Dann kann sich an der Physik darin nichts ändern, weil das konstante Potential auf das, was innerhalb der Dose vorgeht, keinen Einfluss hat. Es gibt nun keine Möglichkeit, die Antwort herzuleiten, wir müssen sie daher erraten. Die Annahme, die brauchbar ist, ist mehr oder weniger die, die Sie auch erwarten würden: Als Energie müssen wir die Summe der potentiellen Energie V und der Energie E p – die ihrerseits die Summe der inneren und der kinetischen Energie ist – verwenden. Die Amplitude ist proportional zu e−(i/)[(E p +V)t− p·x] .
(7.18)
Das allgemeine Prinzip ist, dass der Koeffizient von t, den wir ω nennen können, immer durch die Gesamtenergie des Systems gegeben ist: innere (oder „Massen-“) Energie plus kinetische Energie plus potentielle Energie: ω = E p + V .
(7.19)
Oder für nichtrelativistische Situationen: ω = Wint +
p2 +V. 2M
(7.20)
Was können wir nun über die physikalischen Phänomene innerhalb der Dose aussagen? Was erhalten wir, wenn es mehrere Energiezustände gibt? Für jeden Zustand hat die Amplitude denselben zusätzlichen Faktor e−(i/)Vt zu dem, was sie bei V = 0 hätte. Das ist genau dasselbe wie eine Änderung des Nullpunktes unserer Energieskala. Es erzeugt die gleiche Phasenänderung in allen Amplituden, was aber, wie wir vorher gesehen haben, nicht die Wahrscheinlichkeiten ändert. Die physikalischen Phänomene bleiben dieselben. (Wir haben angenommen, dass wir über verschiedene Zustände desselben
p q
M
φ + −
Abb. 7.2: Ein Teilchen mit der Masse M und dem Impuls p in einem Gebiet konstanten Potentials.
7.3 Potentielle Energie; Energieerhaltung
125
geladenen Objektes sprechen, sodass qφ für alle Zustände gleich ist. Wenn ein Objekt seine Ladung beim Übergang von einem Zustand in einen anderen ändern könnte, hätten wir ein ganz anderes Ergebnis, aber die Erhaltung der Ladung verhindert dies.) Soweit stimmt unsere Annahme mit dem überein, was wir für eine Änderung des Energiebezugsniveaus erwarten würden. Wenn es aber wirklich richtig wäre, sollte es auch für eine potentielle Energie gültig bleiben, die nicht konstant ist. Im Allgemeinen könnte V in beliebiger Weise mit beiden, Zeit und Raum, variieren und das vollständige Ergebnis für die Amplitude muss als Differentialgleichung ausgedrückt werden. Wir wollen uns mit dem allgemeinen Fall jetzt noch nicht beschäftigen, sondern nur eine Vorstellung davon bekommen, wie einige Prozesse ablaufen. Wir wollen uns daher nur ein Potential vorstellen, das zeitlich konstant ist und sich räumlich nur sehr langsam ändert. Dann können wir die klassischen Vorstellungen und die der Quantenphysik miteinander vergleichen.
Re (Amp)
φ1
φ2
Entfernung λ1
λ2 (für φ2 < φ1 )
Abb. 7.3: Die Amplitude für ein Teilchen, das von einem Potential zu einem anderen übergeht.
Stellen wir uns die in Abbildung 7.3 skizzierte Situation vor, in der zwei Dosen auf den konstanten Potentialen φ1 bzw. φ2 gehalten werden. Wir nehmen an, dass sich das Potential in dem dazwischen liegenden Raum stetig ändert. Wir stellen uns ein Teilchen vor, dass eine bestimmte Amplitude hat, in irgendeinem Gebiet gefunden zu werden. Wir nehmen außerdem an, dass der Impuls groß genug ist, sodass in jedem kleinen Gebiet, in dem es viele Wellenlängen gibt, das Potential nahezu konstant ist. Es ist dann anzunehmen, dass die Amplitude in jedem Gebiet des Raumes die Gestalt (7.18) hat, wobei V dem jeweiligen Gebiet des Raumes entspricht. Denken wir an einen Spezialfall, in dem φ1 = 0 ist, sodass die potentielle Energie dort null ist, während qφ2 negativ ist, sodass das Teilchen in der zweiten Dose klassisch gesehen mehr Energie hat. Vom klassischen Standpunkt aus muss es in der zweiten Dose schneller sein – es hat mehr Energie und daher einen größeren Impuls. Wir wollen sehen, wie sich das aus der Quantenmechanik ergibt. Mit unserer Voraussetzung wäre die Amplitude in der ersten Dose proportional zu e−(i/)[(Wint +p1 /2M+V1 )t− p1 ·x] 2
(7.21)
und die Amplitude in der zweiten Dose wäre proportional zu e−(i/)[(Wint +p2 /2M+V2 )t− p2 ·x] . 2
(7.22)
(Wir nehmen an, dass die innere Energie in beiden Bereichen gleich ist.) Die Frage lautet: Wie passen sich die Amplituden im Bereich zwischen den Dosen aneinander an?
126
7 Die Zeitabhängigkeit der Amplituden
Wir nehmen an, dass die beiden Potentiale zeitlich konstant sind – sodass sich an den Bedingungen nichts ändert. Wir wollen weiterhin annehmen, dass die Änderungen der Amplitude (das heißt ihrer Phase) überall dieselbe Frequenz haben – weil sozusagen nichts im „Medium“ ist, was von der Zeit abhängt. Wenn sich nichts im Raum ändert, können wir annehmen, dass die Welle in einem Gebiet im ganzen Raum Nebenwellen „erzeugt“, die alle mit derselben Frequenz schwingen – so wie auch Lichtwellen, die durch ruhende Materie gehen, ihre Frequenz nicht ändern. Wenn die Frequenzen in (7.21) und (7.22) gleich sind, muss gelten Wint +
p21 p2 + V1 = Wint + 2 + V2 . 2M 2M
(7.23)
Auf beiden Seiten steht die klassische Gesamtenergie, daher drückt (7.23) die Erhaltung der Energie aus. Mit anderen Worten ist die klassische Aussage über die Erhaltung der Energie äquivalent zu der quantenmechanischen Aussage, dass die Frequenz für ein Teilchen überall gleich ist, wenn sich die Bedingungen zeitlich nicht ändern. Das stimmt alles mit der Vorstellung überein, dass ω = E ist. Für das spezielle Beispiel mit V1 = 0 und V2 negativ ergibt (7.23), dass p2 größer als p1 ist. Also ist die Wellenlänge im Gebiet 2 kürzer. Die Flächen gleicher Phase sind durch die gestrichelten Linien in Abbildung 7.3 dargestellt. Wir haben auch eine Kurve für den Realteil der Amplitude gezeichnet, die noch einmal zeigt, wie die Wellenlänge beim Übergang vom Gebiet 1 nach Gebiet 2 abnimmt. Die Gruppengeschwindigkeit der Wellen, die gleich p/M ist, wächst auch in der Weise, wie man es gemäß der klassischen Energieerhaltung erwarten würde, da diese durch (7.23) bestimmt ist. Es gibt einen interessanten Sonderfall, nämlich wenn V2 so groß wird, dass V2 − V1 größer als p21 /2M ist. Dann ist p22 , das durch p22 = 2M
p2 1 − (V2 − V1 ) 2M
(7.24)
gegeben ist, negativ. Das bedeutet, dass p2 eine imaginäre Zahl ist, sagen wir ip� . Klassisch würden wir sagen, dass das Teilchen niemals in das Gebiet 2 kommt – es hat nicht genug Energie, um den Potentialberg zu überwinden. Quantenmechanisch ist jedoch die Amplitude durch (7.22) gegeben; ihre räumliche Änderung verläuft noch gemäß e(i/)p2 ·x . Wenn aber p2 imaginär ist, wird die räumliche Abhängigkeit durch einen reellen Exponentialausdruck beschrieben. Angenommen, das Teilchen ging ursprünglich in die +x-Richtung, dann würde die Amplitude variieren wie e−p x/ . �
(7.25)
Die Amplitude nimmt mit wachsendem x schnell ab. Man stelle sich vor, dass die beiden Gebiete mit verschiedenem Potential sehr dicht beieinander liegen, sodass sich die potentielle Energie abrupt von V1 nach V2 ändert, wie in Abbildung 7.4 (a) gezeigt. Wenn wir den Realteil der Wahrscheinlichkeitsamplitude auftragen, erhalten wir die in Teil (b) der Abbildung gezeigte Funktion. Die Welle im ersten Bereich entspricht einem Teilchen, das versucht, in den zweiten Bereich zu gelangen, dort fällt aber die Amplitude schnell ab. Es besteht eine Wahrscheinlichkeit, dass es im zweiten Bereich beobachtet wird – wohin es klassisch niemals kommen
7.3 Potentielle Energie; Energieerhaltung (a)
V1 (p21 /2M > 0)
127
V2 (p22 /2M < 0)
Re (Amp)
(b)
x p1
|p2 |
Abb. 7.4: Die Amplitude für ein Teilchen, das sich einem stark abstoßenden Potential nähert.
könnte –, aber die Amplitude ist, außer in der Nähe der Grenze, sehr klein. Die Situation ist derjenigen sehr ähnlich, die wir für die Totalreflexion des Lichtes gefunden hatten. Das Licht kommt normalerweise nicht hindurch, wir können es aber beobachten, wenn wir es ein bis zwei Wellenlängen von der Oberfläche entfernt nachweisen. Sie werden sich erinnern, dass, wenn wir eine zweite Oberfläche nah an die Grenze gebracht haben, wo das Licht total reflektiert wurde, etwas Licht in das zweite Materialstück überging. Etwas Ähnliches geschieht in der Quantenmechanik mit Teilchen. Wenn es ein schmales Gebiet mit einem Potential V3 gibt, das so groß ist, dass die klassische kinetische Energie negativ wäre, würde das Teilchen klassisch nie hindurchkommen. Quantenmechanisch kann aber die exponentiell abfallende Amplitude über dieses Gebiet hinausreichen und eine kleine Wahrscheinlichkeit ergeben, dass das Teilchen auf der anderen Seite gefunden wird, wo die kinetische Energie wieder positiv ist. Diese Situation ist in Abbildung 7.5 illustriert. Dieser Effekt wird quantenmechanische „Durchdringung einer Potentialbarriere“ oder „Tunneleffekt“ genannt. Das Durchdringen einer Potentialbarriere durch eine quantenmechanische Amplitude gibt die Erklärung – oder Beschreibung – des α-Teilchenzerfalls eines Urankerns. Die potentielle Energie eines α-Teilchens als Funktion der Entfernung vom Mittelpunkt ist in Abbildung 7.6 (a) gezeigt. Wenn man versucht, ein α-Teilchen mit der Energie E in den Kern zu schießen, würde es von der Kernladung z eine elektrostatische Abstoßung erfahren und klassisch nicht näher als bis zum Abstand r1 gelangen, wo seine Gesamtenergie gleich der potentiellen Energie V ist. In größerer Nähe ist die potentielle Energie jedoch wegen der starken Anziehung der kurzreichweitigen Kernkräfte viel niedriger. Wie kommt es dann, dass wir beim radioaktiven Zerfall α-Teilchen beobachten, die im Kern gestartet sind und mit der Energie E herauskommen? Das geschieht, weil sie mit der Energie E innerhalb des Kerns starten und durch die Potentialbarriere „durchsickern“. Die Wahrscheinlichkeitsamplitude ist in Abbildung 7.6 (b) grob skizziert. Tatsächlich ist der exponentielle Abfall viel stärker als dargestellt. Es ist in der Tat recht bemerkenswert, dass die mittlere Lebensdauer eines α-Teilchens im Urankern 4 21 Milliarden Jahre beträgt, obwohl die natürlichen Schwingungen innerhalb des Kerns so außerordentlich schnell
128
7 Die Zeitabhängigkeit der Amplituden V2 (p22 /2M > 0)
(p23 /2M < 0)
V3
Re (Amp)
V1 (p21 /2M > 0)
x Abb. 7.5: Die Amplitude durchdringt eine Potentialbarriere.
sind – etwa 1022 Schwingungen pro Sekunde! Wie kommt man von einer Periodendauer von 10−22 s zu einer Zahl wie 109 Jahre? Die Antwort ist, dass der Exponentialausdruck den äußerst kleinen Faktor von etwa e−45 ergibt – mit dem man die zwar sehr kleine, aber endliche Durchsickerwahrscheinlichkeit erhält. Wenn das α-Teilchen im Kern ist, gibt es fast überhaupt keine Amplitude, es außerhalb zu finden; wenn Sie jedoch viele Kerne nehmen und lange genug warten, können Sie Glück haben und eins, das durchkommt, beobachten. V(r)
(b)
E r1
r
r · Re(Amp)
(a)
r
Abb. 7.6: (a) Die Potentialfunktion für ein α-Teilchen in einem Urankern. (b) Die qualitative Form der Wahrscheinlichkeitsamplitude.
7.4
Kräfte und klassischer Grenzfall
Wir betrachten ein sich bewegendes Teilchen, das durch ein Gebiet geht, in dem sich das Potential rechtwinklig zur Bewegungsrichtung ändert. Klassisch würden wir die Situation wie in Abbildung 7.7 angedeutet beschreiben.
7.4 Kräfte und klassischer Grenzfall
129
niedriges V
y x p
F= − ∂V/∂y
δθ
p
hohes V w
Δp Abb. 7.7: Ablenkung eines Teilchens durch einen transversalen Potentialgradienten.
Wenn sich das Teilchen in x-Richtung bewegt und in ein Gebiet eintritt, in dem es ein Potential gibt, das mit y variiert, wird das Teilchen von der Kraft F = −∂V/∂y eine transversale Beschleunigung erhalten. Wenn die Kraft nur in einem begrenzten Gebiet der Ausdehnung w vorhanden ist, wird die Kraft nur während der Zeit w/v wirken. Das Teilchen wird den transversalen Impuls Δp = F
w v
erhalten. Der Ablenkwinkel δθ ist dann δθ =
Δp Fw , = p pv
wobei p der Anfangsimpuls ist. Wenn wir −∂V/∂y für F einsetzen, erhalten wir δθ = −
w ∂V . pv ∂y
(7.26)
Nun müssen wir prüfen, ob unsere Vorstellung, dass die Wellen gemäß (7.20) laufen, dasselbe Resultat ergibt. Wir betrachten dieselbe Situation quantenmechanisch, wobei wir voraussetzen, dass alles in einem sehr großen Maßstab im Vergleich zur Wellenlänge der Wahrscheinlichkeitsamplituden geschieht. In jedem kleinen Gebiet variiert die Amplitude wie e−(i/)[(W+p
2
/2M+V )t− p·x]
.
(7.27)
Können wir sehen, dass dies auch eine Ablenkung des Teilchens bewirkt, wenn V einen transversalen Gradienten hat? Wir haben in Abbildung 7.8 skizziert, wie die Wellender Wahrscheinlichkeitsamplitude aussehen. Wir haben eine Reihe von „Wellenknoten“ gezeichnet, die Sie sich als die Ebenen vorstellen können, wo die Phase der Amplitude null ist. In jedem kleinen Gebiet ist die Wellenlänge – der Abstand zwischen aufeinanderfolgenden Knoten – λ=
h , p
wobei p mit V verknüpft ist durch W+
p2 + V = konst. 2M
(7.28)
In Gebieten, wo V größer ist, ist p kleiner und die Wellenlänge ist größer. Daher ändert sich der Winkel der Wellenknoten wie in der Abbildung dargestellt.
130
7 Die Zeitabhängigkeit der Amplituden
a D
niedriges V
k
δθ δθ
Wellenknoten
b
hohes V w
Δx
Abb. 7.8: Wahrscheinlichkeitsamplitude in einem Gebiet mit transversalem Potentialgradienten.
Um die Änderung des Winkels der Wellenknoten zu finden, beachten wir, dass für die beiden Wege a und b in Abbildung 7.8 eine Potentialdifferenz ΔV = (∂V/∂y)D besteht, sodass es eine Differenz Δp der Impulse längs der beiden Wege gibt, die man aus (7.28) erhalten kann: p2 p Δ = Δ p = −ΔV . (7.29) 2M M Die Wellenzahl k = p/ ist daher längs der beiden Wege verschieden, was bedeutet, dass die Phase mit unterschiedlicher Geschwindigkeit fortschreitet. Der Unterschied der Zuwachsraten der Phasen ist Δk = Δp/, daher hat sich nach der gesamten Länge w folgende Phasendifferenz angesammelt: Δ(Phase) = Δk · w =
Δp M · w = − ΔV · w . p
(7.30)
Dies ist der Betrag, um den die Phase auf dem Weg b der Phase auf dem Weg a „vorauseilt“, wenn die Wellen den Streifen verlassen. Aber außerhalb des Streifens entspricht ein Phasenvorsprung von diesem Betrag einem Wellenknoten, der um den Betrag Δx =
λ Δ(Phase) = Δ(Phase) 2π p
oder Δx = −
M ΔV · w p2
(7.31)
voraus ist. Wenn wir uns auf Abbildung 7.8 beziehen, sehen wir, dass die neuen Wellenfronten im Winkel δθ stehen werden, der bestimmt ist durch Δx = D δθ . Damit erhalten wir D δθ = −
M ΔV · w . p2
(7.32) (7.33)
Das ist mit Gleichung (7.26) identisch, wenn wir p/M durch v und ΔV/D durch ∂V/∂y ersetzen. Das Resultat, das wir eben erhalten haben, ist nur richtig, wenn die Potentialänderungen langsam und glatt sind – im so genannten klassischen Grenzfall. Wir haben gezeigt, dass wir unter diesen Bedingungen dieselbe Teilchenbewegung erhalten wie aus F = ma, wenn wir nur voraussetzen, dass ein Potential der Wahrscheinlichkeitsamplitude eine Phase zuordnet, die gleich Vt/ ist. Im klassischen Grenzfall stimmt die Quantenmechanik mit der newtonschen Mechanik überein.
7.5 Die „Präzession“ eines Spin-1/2-Teilchens
7.5
131
Die „Präzession“ eines Spin-1/2-Teilchens
Beachten Sie, dass wir über die potentielle Energie nichts Spezielles vorausgesetzt haben – sie ist einfach die Energie, deren negative Ableitung eine Kraft ergibt. Beim Stern-GerlachExperiment hatten wir zum Beispiel die Energie U = −μ · B, die eine Kraft ergibt, wenn B räumlich veränderlich ist. Wenn wir eine quantenmechanische Beschreibung hätten geben wollen, hätten wir gesagt, dass die Teilchen in dem einen Strahl eine Energie hatten, die auf die eine Art variiert, und die Teilchen in dem anderen Strahl eine entgegengesetzte Energievariation. (Wir könnten die magnetische Energie U zur potentiellen Energie V oder zur „inneren“ Energie W zählen, das spielt keine Rolle.) Wegen der Energievariation werden die Wellen gebrochen und die Strahlen nach oben oder unten abgelenkt. (Wir sehen jetzt, dass uns die Quantenmechanik dieselbe Ablenkung liefert, wie wir sie aus der klassischen Mechanik herleiten können.) Wegen der Abhängigkeit der Amplitude von der potentiellen Energie erwarten wir außerdem, dass sich die Wahrscheinlichkeitsamplitude eines Teilchens in einem homogenen Magnetfeld in z-Richtung gemäß e−(i/)(−μz B)t zeitlich ändern muss. (Wir können dies als Definition von μz betrachten.) Mit anderen Worten, wenn wir ein Teilchen für eine Zeit τ in ein homogenes Feld B bringen, wird sich seine Wahrscheinlichkeitsamplitude um den Faktor e−(i/)(−μz B)τ von dem Fall ohne Feld unterscheiden. Da μz bei einem Spin- 21 -Teilchen entweder plus oder minus eine Zahl, sagen wir μ, sein kann, würden die beiden möglichen Zustände in einem gleichförmigen Feld ihre Phasen mit derselben Geschwindigkeit, aber in entgegengesetzten Richtungen ändern. Die beiden Amplituden werden multipliziert mit e±(i/)μBτ .
(7.34)
Dieses Ergebnis hat einige interessante Konsequenzen. Angenommen, wir betrachten ein Spin1 2 -Teilchen in einem Zustand, der kein reiner Spin-up- oder Spin-down-Zustand ist. Wir können seinen Zustand durch die Amplituden für reine up- und reine down-Zustände beschreiben. Aber in einem magnetischen Feld haben diese beiden Zustände Phasen, die sich mit verschiedenen Geschwindigkeiten ändern. Wenn wir daher nach den Amplituden fragen, wird die Antwort davon abhängen, wie lange das Teilchen im Feld gewesen ist. Als Beispiel betrachten wir den Zerfall des Myons in einem magnetischen Feld. Wenn Myonen als Zerfallsprodukte von π-Mesonen entstehen, sind sie polarisiert (mit anderen Worten, es gibt Vorzugsrichtungen für ihre Spins). Die Myonen wiederum zerfallen – in durchschnittlich etwa 2,2 Mikrosekunden – und emittieren dabei ein Elektron und zwei Neutrinos: μ → e + ν + ν¯ . Bei diesem Zerfall (zumindest bei den höchsten Energien) werden die Elektronen vorzugsweise entgegengesetzt zur Spinrichtung des Myons emittiert.
132
7 Die Zeitabhängigkeit der Amplituden B
z x
Spin
e
μ A
μ Elektronenzähler
Abb. 7.9: Ein Myonzerfallsexperiment.
Betrachten wir nun die in Abbildung 7.9 skizzierte Versuchsanordnung. Wenn polarisierte Myonen von links in einen Materialblock A eintreten und zum Stillstand gebracht werden, werden sie kurze Zeit später zerfallen. Die emittierten Elektronen werden im Allgemeinen in alle möglichen Richtungen davonfliegen. Wir wollen jedoch annehmen, dass die Myonen alle mit Spins in x-Richtung bei A in den Abstoppblock eintreten. Ohne magnetisches Feld gäbe es irgendeine Winkelverteilung für die Zerfallsrichtungen. Wir möchten gern wissen, wie diese Verteilung durch das magnetische Feld geändert wird. Wir erwarten, dass sie auf irgendeine Weise mit der Zeit variiert. Wir können herausfinden, was geschieht, wenn wir in jedem Moment danach fragen, wie groß die Amplitude ist, dass das Myon im (+x)-Zustand gefunden wird. Wir können das Problem folgendermaßen beschreiben: Von einem Myon sei bekannt, dass es bei t = 0 den Spin in +x-Richtung hat. Wie groß ist die Amplitude, dass es zur Zeit τ in demselben Zustand sein wird? Wir haben zwar keine Regel für das Verhalten eines Spin- 21 -Teilchens in einem magnetischen Feld, das rechtwinklig zum Spin gerichtet ist, aber wir wissen, was mit den Zuständen geschieht, bei denen der Spin up oder down in Bezug auf das Feld ist – ihre Amplituden werden mit dem Faktor (7.34) multipliziert. Wir wählen deshalb die Darstellung so, dass die Basiszustände den Spin up oder down bezüglich der z-Richtung (der Feldrichtung) haben. Jede Frage kann dann mithilfe der Amplituden für diese Zustände beantwortet werden. Bezeichnen wir den Myon-Zustand mit ψ(t). Wenn das Myon in den Block A eintritt, ist sein Zustand ψ(0), und wir möchten ψ(τ) zum späteren Zeitpunkt τ wissen. Wenn wir die beiden Basiszustände mit (+z) und (−z) bezeichnen, kennen wir die beiden Amplituden � +z | ψ(0) � und � −z | ψ(0) � – wir kennen diese Amplituden, weil wir wissen, dass ψ(0) einen Zustand darstellt, dessen Spin im (+x)-Zustand ist. Mit den Resultaten des vorigen Kapitels ergeben sich diese Amplituden als2 1 � +z | +x � = C+ = √ 2
und
1 � −z | +x � = C− = √ . 2
(7.35)
Sie sind zufällig gleich. Da sich diese Amplituden auf den Zustand bei t = 0 beziehen, bezeichnen wir sie mit C+ (0) bzw. C− (0).
Nun wissen wir, wie sich diese Amplituden zeitlich verhalten. Durch Anwendung von (7.34) erhalten wir C+ (t) = C+ (0)e−(i/)μBt
2
und
C− (t) = C− (0)e+(i/)μBt .
(7.36)
Wenn Sie Kapitel 6 übersprungen haben, können Sie (7.35) erst einmal als Regel ohne Herleitung ansehen. Später (in Kapitel 10) werden wir eine vollständigere Diskussion der Spin-Präzession bringen, einschließlich einer Herleitung dieser Amplituden.
7.5 Die „Präzession“ eines Spin-1/2-Teilchens
133
Aber wenn wir C+ (t) und C− (t) kennen, haben wir alles, was man über den Zustand zum Zeitpunkt t wissen kann. Der einzige Haken ist, dass das, was wir wissen wollen, die Wahrscheinlichkeit dafür ist, dass bei t der Spin in +x-Richtung zeigt. Unsere allgemeinen Regeln können jedoch dieses Problem lösen. Die Amplitude A+ (t) dafür, zur Zeit t im (+x)-Zustand zu sein, schreiben wir als A+ (t) = � +x | ψ(t) � = � +x | +z � � +z | ψ(t) � + � +x | −z � � −z | ψ(t) � oder A+ (t) = � +x | +z � C+ (t) + � +x | −z � C− (t) .
(7.37)
Wieder benutzen wir die Ergebnisse des vorigen Kapitels – oder besser die Gleichung � φ | χ � = � χ | φ �∗ aus Kapitel 5 – und wissen dann, dass 1 � +x | +z � = √ , 2
1 � +x | −z � = √ . 2
Wir kennen daher alle Größen in (7.37). Wir erhalten A+ (t) =
1 (i/)μBt 1 −(i/)μBt e + e 2 2
oder A+ (t) = cos
μB t.
Ein besonders einfaches Ergebnis! Beachten Sie, dass die Lösung mit dem übereinstimmt, was wir für t = 0 erwarten. Wir erhalten A+ (0) = 1, was richtig ist, weil wir vorausgesetzt haben, dass das Myon für t = 0 im (+x)-Zustand war. Die Wahrscheinlichkeit P+ , dass das Myon zum Zeitpunkt t im (+x)-Zustand angetroffen wird, ist (A+ )2 oder P+ = cos2
μB t.
Die Wahrscheinlichkeit oszilliert zwischen null und eins, wie in Abbildung 7.10 gezeigt. Beachten Sie, dass die Wahrscheinlichkeit für μBt/ = π (nicht für 2π) wieder eins wird. Weil wir die Kosinusfunktion quadriert haben, wiederholt sich die Wahrscheinlichkeit mit der Frequenz 2μB/. Folglich finden wir, dass sich die Wahrscheinlichkeit, ein Zerfallselektron im Elektronenzähler von Abbildung 7.9 aufzufangen, periodisch mit der Zeitdauer ändert, die das Myon im Magnetfeld verbracht hat. Die Frequenz hängt vom magnetischen Moment μ ab. Das magnetische Moment des Myons wurde tatsächlich auf diese Art gemessen. Wir können natürlich dieselbe Methode benutzen, um alle anderen Fragen über den Myonzerfall zu beantworten. Wie ist zum Beispiel die Zeitabhängigkeit der Wahrscheinlichkeit, ein Zerfallselektron in y-Richtung, 90◦ zur x-Richtung, aber noch im rechten Winkel zum Feld, nachzuweisen? Wenn Sie es durchrechnen, sehen Sie, dass die Amplitude, im (+y)-Zustand zu
Wahrscheinlichkeit für Spin in +x-Richtung
134
7 Die Zeitabhängigkeit der Amplituden
1
0
π
2π
μB t
Abb. 7.10: Die Zeitabhängigkeit der Wahrscheinlichkeit, dass sich ein Spin- 21 Teilchen in einem (+)-Zustand bezüglich der x-Achse befindet.
sein, wie cos2 {(μBt/)−π/4} variiert. Sie variiert mit derselben Periode, erreicht aber das Maximum eine viertel Schwingungsperiode später, wenn μBt/ = π/4 ist. Tatsächlich geschieht nun Folgendes: Im Laufe der Zeit durchläuft das Myon eine Folge von Zuständen, die einer vollständigen Polarisation in eine Richtung entsprechen, die sich kontinuierlich um die z-Achse dreht. Wir sagen, der Spin präzediert mit der Frequenz ωp =
2μB .
(7.38)
Nach diesen Ausführungen sollten Sie eine Vorstellung davon haben, wie die quantenmechanische Behandlung von zeitabhängigen Phänomenen abläuft.
8
Die Hamilton-Matrix
Siehe auch: Band II, Kapitel 24, Schwingungsmoden.
8.1
Amplituden und Vektoren
Bevor wir mit dem Hauptthema dieses Kapitels beginnen, möchten wir eine Reihe von mathematischen Begriffen erläutern, die vielfach in der Literatur über Quantenmechanik benutzt werden. Ihre Kenntnis wird Ihnen das Lesen anderer Bücher oder Schriften über dieses Gebiet erleichtern. Das Erste, worauf wir hinweisen wollen, ist die große mathematische Ähnlichkeit zwischen den Gleichungen der Quantenmechanik und den Gleichungen für das Skalareprodukt von zwei Vektoren. Sie werden sich erinnern, dass die Amplitude, von einem Zustand φ in einen Zustand χ überzugehen, geschrieben werden kann als Summe über einen vollständigen Satz von Basiszuständen der Amplituden für den Übergang von φ in einen der Basiszustände und dann aus diesem Basiszustand wieder heraus nach χ: �χ|φ� = �χ|i��i|φ� . (8.1) alle i
Wir haben dies anhand eines Stern-Gerlach-Apparats erklärt. Wir möchten Sie aber darauf hinweisen, dass man den Apparat nicht unbedingt braucht. Gleichung (8.1) ist ein mathematisches Gesetz, dessen Gültigkeit nicht davon abhängt, ob wir die Filtereinrichtung einsetzen oder nicht – es ist nicht immer notwendig, sich vorzustellen, dass der Apparat da wäre. Wir können die Gleichung einfach als Formel für die Amplitude � χ | φ � ansehen. Wir möchten (8.1) mit dem inneren Produkt zweier Vektoren B und A vergleichen. Wenn B und A gewöhnliche Vektoren im dreidimensionalen Raum sind, können wir das innere Produkt folgendermaßen schreiben: ( B · ei )( ei · A) , (8.2) alle i
wobei das Symbol ei die drei Einheitsvektoren in x-, y- und z-Richtung bezeichnet. Dann ist B · e1 das, was wir gewöhnlich mit B x bezeichnen; B · e2 ist das, was wir gewöhnlich mit By bezeichnen usw. Gleichung (8.2) ist daher gleichbedeutend mit B x A x + By Ay + Bz Az , was das innere Produkt B · A ist.
Wenn wir (8.1) und (8.2) vergleichen, erkennen wir, dass die Zustände χ und φ den beiden Vektoren B und A entsprechen. Die Basiszustände i entsprechen den speziellen Vektoren ei , auf
136
8 Die Hamilton-Matrix
die wir alle anderen Vektoren beziehen. Jeder Vektor kann durch eine Linearkombination der drei „Basisvektoren“ ei dargestellt werden. Wenn Sie außerdem in dieser Kombination die Koeffizienten vor jedem „Basisvektor“ – also die drei Komponenten eines Vektors – kennen, dann wissen Sie alles über diesen Vektor. Ähnlich kann man jeden quantenmechanischen Zustand durch die Amplituden � i | φ � für seinen Übergang in die Basiszustände vollständig beschreiben. Wenn Sie diese Koeffizienten kennen, dann wissen Sie alles, was man über den Zustand wissen kann. Wegen dieser vollständigen Analogie wird das, was wir einen „Zustand“ genannt haben, oft auch ein „Zustandsvektor“ genannt. Da die Basisvektoren ei alle orthogonal zueinander sind, erhalten wir die Beziehung ei · e j = δ i j .
(8.3)
Dies entspricht den Beziehungen (5.25) zwischen den Basiszuständen i, � i | j � = δi j .
(8.4)
Sie sehen jetzt, warum man sagt, dass die Basiszustände i alle „orthogonal“ zueinander sind. Ein kleiner Unterschied zwischen (8.1) und dem inneren Produkt ist jedoch vorhanden. Es ist nämlich � φ | χ � = � χ | φ �∗ ,
(8.5)
während in der Vektoralgebra gilt A · B = B · A. Bei den komplexen Zahlen der Quantenmechanik müssen wir die Reihenfolge der Ausdrücke streng beachten. Beim inneren Produkt spielt sie dagegen keine Rolle. Betrachten wir nun die Vektorgleichung A= ei ( ei · A) . (8.6) i
Sie ist etwas ungewöhnlich, aber richtig. Sie bedeutet dasselbe wie A i ei = A x e x + A y ey + A z ez . A=
(8.7)
i
Beachten Sie aber, dass (8.6) eine Größe beschreibt, die kein inneres Produkt ist. Ein inneres Produkt ist einfach eine Zahl, während (8.6) eine Vektorgleichung ist. Es war einer der bedeutenden Kunstgriffe der Vektoranalysis, aus den Gleichungen den Begriff des Vektors selbst zu abstrahieren. Gleichermaßen könnte man geneigt sein, etwas aus der quantenmechanischen Formel (8.1) zu abstrahieren, was analog zu einem „Vektor“ ist – und das kann man tatsächlich. Wir entfernen das � χ | auf beiden Seiten von (8.1) und schreiben folgende Gleichung auf: |φ� = |i��i|φ� . (8.8) i
Erschrecken Sie nicht – es ist nur eine Schreibweise, und Sie werden gleich verstehen, was die Symbole bedeuten. Man denke sich die Klammer (= bracket) � χ | φ � in zwei Teile geteilt.
8.2 Zerlegung von Zustandsvektoren
137
Der zweite Teil | φ � wird oft ket genannt, und der erste Teil � χ | wird mit bra bezeichnet (zusammengenommen bilden sie eine Klammer („bra-(c)-ket“) – eine Schreibweise, die von Dirac vorgeschlagen wurde); die Halbsymbole � χ | und | φ � werden auch Zustandsvektoren genannt. Sie sind jedenfalls keine Zahlen. Im Allgemeinen möchten wir aber, dass das Ergebnis unserer Rechnungen eine Zahl ist. Daher sind solche „unfertigen“ Größen nur Schritte auf halbem Wege in unseren Rechnungen. Es hat sich ergeben, dass wir bis jetzt alle unsere Resultate durch Zahlen ausgedrückt haben. Wie ist es uns gelungen, Vektoren zu vermeiden? Es ist amüsant festzustellen, dass wir sogar in der gewöhnlichen Vektoralgebra alle Gleichungen so schreiben könnten, dass sie nur Zahlen beinhalten. Wir konnten zum Beispiel statt einer Vektorgleichung wie F = ma immer schreiben C · F = C · (m a) . Wir haben dann eine Gleichung mit zwei inneren Produkten, die für jeden Vektor C gilt. Wenn sie aber für jedes C gilt, hat es keinen Sinn, das C immer mitzuschreiben! Betrachten Sie jetzt (8.1). Das ist eine Gleichung, die für jedes χ gilt. Wir sollten daher, um Schreibarbeit zu sparen, das χ weglassen und stattdessen (8.8) schreiben. Diese Gleichung enthält dieselbe Information, vorausgesetzt, wir wissen, dass sie immer auf beiden Seiten „ergänzt“ werden sollte durch „Multiplikation von links“ – was einfach ein Wiedereinsetzen bedeutet – mit irgendeinem � χ | . Daher bedeutet (8.8) genau dasselbe wie (8.1) – nicht mehr und nicht weniger. Wenn Sie Zahlen haben wollen, setzen Sie das � χ | ein, das Sie möchten.
Vielleicht haben Sie sich schon über das | φ � in (8.8) gewundert. Da die Gleichung für jedes | φ � gilt, warum behalten wir es dann bei? Tatsächlich schlägt Dirac vor, dass das | φ � genauso gut wegabstrahiert werden kann, sodass wir nur noch behalten |= |i��i| . (8.9) i
Und dies ist die wichtige fundamentale Regel der Quantenmechanik! (Es gibt nichts Analoges in der Vektoranalysis.) Es sagt aus: Wenn Sie zwei beliebige Zustände � χ | und | φ � links und rechts auf beiden Seiten einsetzen, erhalten Sie wieder (8.1). Es ist in der Praxis nicht besonders nützlich, aber es ist ein netter Hinweis, dass die Gleichung für zwei beliebige Zustände gilt.
8.2
Zerlegung von Zustandsvektoren
Betrachten wir noch einmal (8.8). Jeder Zustandsvektor | φ � kann mit geeigneten Koeffizienten dargestellt werden als Linearkombination eines Systems von „Basisvektoren“ – oder, falls Sie diese Formulierung vorziehen, als eine Überlagerung von „Einheitsvektoren“ in geeigneten Verhältnissen. Um hervorzuheben, dass die Koeffizienten � i | φ � nur gewöhnliche (komplexe) Zahlen sind, schreiben wir einmal � i | φ � = Ci .
138
8 Die Hamilton-Matrix
Damit wird (8.8) zu |φ� =
i
| i � Ci .
(8.10)
Für jeden beliebigen anderen Zustandsvektor | χ � können wir eine analoge Gleichung schreiben, natürlich mit anderen Koeffizienten – sagen wir Di . Dann erhalten wir | i � Di . (8.11) |χ� = i
Die Di sind gerade die Amplituden � i | χ �.
Angenommen, wir hätten aus (8.1) das φ entfernt. Wir hätten dann erhalten �χ| = �χ|i��i| .
Wenn wir bedenken, dass � χ | i � = � i | χ �∗ ist, können wir dies schreiben als �χ| = D∗i � i | .
(8.12)
(8.13)
i
Es ist nun interessant, dass wir die Gleichungen (8.13) und (8.10) einfach miteinander multiplizieren können, um wieder � χ | φ � zu erhalten. Wenn wir dies tun, müssen wir mit den Summationsindizes vorsichtig umgehen, da sie in den beiden Gleichungen ganz verschiedene Funktionen haben. Schreiben wir zuerst (8.13) noch einmal als �χ| = D∗j � j | , j
wobei sich nichts ändert. Wenn wir diese Gleichung dann mit (8.10) kombinieren, erhalten wir D∗j � j | i � Ci . (8.14) �χ|φ� = ij
Bedenken Sie aber, dass � j | i � = δi j ist, sodass in der Summe nur der Term mit j = i übrig bleibt. Wir erhalten �χ|φ� = D∗i Ci , (8.15) i
wobei natürlich D∗i = � i | χ �∗ = � χ | i � und Ci = � i | φ � ist. Wieder sehen wir die genaue Analogie zum inneren Produkt: Bi Ai B· A= i
Der einzige Unterschied ist das komplex Konjugierte beim Di . Gleichung (8.15) sagt daher Folgendes aus: Wenn die Zustandsvektoren � χ | und | φ � in die Basisvektoren � i | bzw. | i � aufgespalten werden, dann ist die Amplitude für den Übergang von φ nach χ durch ein inneres Produkt wie in (8.15) gegeben. Diese Gleichung ist natürlich gerade (8.1), nur mit anderen
8.2 Zerlegung von Zustandsvektoren
139
Symbolen geschrieben. Wir sind also eben im Kreis gegangen, um die neuen Symbole zu gebrauchen. Wir sollten vielleicht noch einmal betonen: Während Vektoren im dreidimensionalen Raum durch drei orthogonale Einheitsvektoren beschrieben werden, müssen sich die Basisvektoren | i � der quantenmechanischen Zustände über das vollständige System erstrecken, das für das jeweilige Problem zutreffend ist. Je nach Situation können zwei, drei, fünf oder auch eine unendliche Anzahl von Basiszuständen dazugehören. Wir haben schon darüber gesprochen, was geschieht, wenn Teilchen durch einen Apparat gehen. Wenn wir die Teilchen von einem bestimmten Zustand φ ausgehen lassen, sie dann durch einen Apparat schicken und hinterher eine Messung durchführen, um zu sehen, ob sie im Zustand χ sind, dann wird das Ergebnis beschrieben durch die Amplitude �χ|A|φ� .
(8.16)
Dieses Symbol hat kein genaues Analogon in der Vektoralgebra. (Es ist eher mit der Tensoralgebra verwandt, aber diese Analogie ist nicht besonders nützlich.) Gemäß (5.32) können wir (8.16) schreiben als �χ|A|φ� = �χ|i��i|A| j�� j|φ� . (8.17) ij
Dies ist ein Beispiel für die zweimalige Anwendung der durch (8.9) gegebenen fundamentalen Regel. Wir haben auch herausgefunden, dass wir bei Hinzufügung eines anderen Apparates B in Serie mit A schreiben konnten � χ | BA | φ � = �χ|i��i| B| j�� j| A|k��k|φ� . (8.18) i jk
Mit Diracs Schreibweise für Gleichung (8.9) kommt dies wiederum direkt heraus – bedenken Sie, dass wir immer einen Strich (|), der genau wie der Faktor 1 ist, zwischen B und A setzen können. Wir können (8.17) übrigens auch auf eine andere Art betrachten. Stellen wir uns ein Teilchen vor, das in den Apparat A im Zustand φ eintritt und aus A im Zustand ψ („psi“) herauskommt. Wir können uns mit anderen Worten die Frage stellen: Ist es möglich, ein ψ zu finden, bei dem die Amplitude für den Übergang von ψ nach χ immer identisch und überall die gleiche ist wie die Amplitude � χ | A | φ �? Die Antwort ist ja. Wir ersetzen (8.17) durch �χ|ψ� = �χ|i��i|ψ� . (8.19) i
Wir können dies selbstverständlich tun, wenn gilt �i| A| j�� j|φ� = �i| A|φ� , �i|ψ� =
(8.20)
j
womit ψ bestimmt ist. „Aber das bestimmt ψ doch nicht“, werden Sie sagen, „das bestimmt nur � i | ψ �“. Es ist aber doch so, dass ψ durch � i | ψ � bestimmt ist, denn wenn Sie alle Koeffizienten
140
8 Die Hamilton-Matrix
kennen, die ψ mit den Basiszuständen i verknüpfen, dann ist ψ eindeutig bestimmt. Wir können durchaus mit unserer Schreibweise spielen und den letzten Term von (8.20) schreiben als �i|ψ� = �i| j�� j|A|φ� . (8.21) j
Da diese Beziehung für alle i gilt, können wir außerdem einfach schreiben | j�� j|A|φ� . |ψ� =
(8.22)
j
Dann können wir sagen: „Der Zustand ψ ist das, was wir erhalten, wenn wir mit φ beginnen und durch den Apparat A gehen.“ Ein letztes Beispiel für diese Kunstgriffe. Wir beginnen wieder mit (8.17). Da diese Beziehung für beliebige χ und φ gilt, können wir beide Zustände weglassen! Wir erhalten dann1 A= |i��i|A| j�� j| . (8.23) ij
Was bedeutet das? Es bedeutet nicht mehr und nicht weniger als das, was Sie erhalten, wenn Sie φ und χ wieder einsetzen. So wie es da steht, ist es eine „offene“ Gleichung und unvollständig. Wenn wir sie „von rechts“ mit | φ � multiplizieren, wird daraus A|φ� = |i��i|A| j�� j|φ� , (8.24) ij
was schon wieder Gleichung (8.22) ist. Wir hätten tatsächlich die j’s aus Gleichung (8.22) weglassen und schreiben können |ψ� = A|φ� .
(8.25)
Das Symbol A ist weder eine Amplitude noch ein Vektor; es ist etwas Neuartiges, das Operator genannt wird. Es ist etwas, das auf einem Zustand „operiert“, um einen neuen Zustand herzustellen – Gleichung (8.25) besagt, dass ψ das ist, was sich ergibt, wenn A auf | φ � angewandt wird. Wieder ist sie so lange eine offene Gleichung, bis sie durch irgendein bra wie � χ | vervollständigt wird. Sie ergibt dann �χ|ψ� = �χ|A|φ� .
(8.26)
Der Operator A ist natürlich vollständig beschrieben, wenn wir die Matrix der Amplituden � i | A | j � – auch als Ai j geschrieben – durch irgendein System von Basisvektoren darstellen.
Wir haben mit dieser neuen mathematischen Notation nicht wirklich etwas Neues gewonnen. Ein Grund dafür, dies hier näher auszuführen, bestand darin, Ihnen zu zeigen, wie man Teile von Gleichungen schreibt, weil Sie in vielen Büchern die Gleichungen in unvollständiger Form 1
Sie könnten meinen, wir sollten |A| anstelle von nur A schreiben. Aber dann würde es wie das Zeichen für „absoluter Betrag von A“ aussehen, daher werden die Striche gewöhnlich weggelassen. Im Allgemeinen verhält sich der Strich (|) sehr ähnlich wie der Faktor eins.
8.3 Was sind die Basiszustände der Welt?
141
geschrieben finden werden. Sie müssen also nicht vor Schreck erstarren, wenn Sie ihnen begegnen. Wenn Sie es vorziehen, können Sie immer die fehlenden Teile hinzufügen, um eine Gleichung zwischen Zahlen herzustellen, die dann etwas vertrauter aussehen wird. Sie werden auch bemerken, dass die „bra“- und „ket“-Schreibweise sehr bequem ist. Denn von nun an können wir einen Zustand durch Angabe seines Zustandsvektors kennzeichnen. Wenn wir uns auf einen Zustand mit bestimmtem Impuls p beziehen wollen, können wir sagen: „Der Zustand | p �.“ Oder wir können von einem beliebigen Zustand | ψ � sprechen. Um konsequent zu sein, wollen wir immer das ket benutzen und | ψ � schreiben, um einen Zustand zu kennzeichnen. (Das ist natürlich willkürlich gewählt, wir könnten genauso gut das bra � ψ | nehmen.)
8.3
Was sind die Basiszustände der Welt?
Wir haben festgestellt, dass jeder Zustand in der Welt als eine Überlagerung – eine Linearkombination mit entsprechenden Koeffizienten – von Basiszuständen dargestellt werden kann. Als Erstes werden Sie fragen, was für Basiszustände? Nun ja, es gibt da viele verschiedene Möglichkeiten. Sie können einen Spin zum Beispiel in die z-Richtung oder eine andere Richtung projizieren Es gibt viele, viele verschiedene Darstellungen, die den verschiedenen Koordinatensystemen entsprechen, die man zur Darstellung gewöhnlicher Vektoren benutzen kann. Als Nächstes werden Sie fragen, was für Koeffizienten? Nun, das hängt von den physikalischen Umständen ab. Andere Koeffizientensysteme entsprechen anderen physikalischen Bedingungen. Eine wichtige Sache, die man kennen muss, ist der „Raum“, in dem Sie arbeiten – mit anderen Worten, die physikalische Bedeutung der Basiszustände. Was Sie daher im Allgemeinen zuerst wissen müssen, ist die Beschaffenheit der Basiszustände. Dann können Sie verstehen, wie man eine Situation durch diese Basiszustände beschreibt. Wir möchten ein bisschen vorgreifen und ein wenig darüber berichten, wie die allgemeine quantenmechanische Beschreibung der Natur erfolgt – jedenfalls in den jetzt geläufigen physikalischen Begriffen. Zuerst entscheidet man sich für eine bestimmte Darstellung der Basiszustände – andere Darstellungen sind immer möglich. Zum Beispiel können wir für ein Spin- 21 -Teilchen die Plus- und Minus-Zustände bezüglich der z-Achse benutzen. Aber an der z-Achse ist nichts Besonderes. Sie können auch jede beliebige andere Achse benutzen. Aus Gründen der Einheitlichkeit wollen wir jedoch immer die z-Achse wählen. Angenommen, wir beginnen mit einer Situation, in der ein Elektron vorhanden ist. Zusätzlich zu den beiden Spinmöglichkeiten („up“ und „down“ in Bezug auf die z-Richtung) gibt es noch den Impuls des Elektrons. Wir greifen uns einen Satz von Basiszuständen heraus, wobei jeder einem Impulswert entspricht. Was tun wir, wenn das Elektron keinen definierten Impuls hat? Das spielt erst einmal keine Rolle, wir sagen nur, welches die Basiszustände sind. Wenn das Elektron keinen definierten Impuls hat, dann hat es eine Amplitude für den einen Impuls und eine andere Amplitude für den anderen Impuls usw. Und wenn der Spin auch nicht unbedingt „up“ ist, so hat das Elektron doch eine Amplitude, Spin „up“ zu haben und sich mit diesem Impuls zu bewegen, und es hat eine andere Amplitude, Spin „down“ zu haben und sich mit jenem Impuls zu bewegen usw. Die vollständige Beschreibung eines Elektrons erfordert nur, soweit wir wissen, dass die Basiszustände durch Impuls und Spin beschrieben werden. Für ein einzelnes Elektron bezieht sich daher ein akzeptables System von Basiszuständen | i � auf verschiedene Impulswerte und darauf, ob der Spin „up“ oder „down“ ist. Andere Amplitudenmischungen – das heißt, andere Kombinationen der C’s – beschreiben andere Gegebenheiten. Wie sich jedes einzelne Elektron verhält, wird durch
142
8 Die Hamilton-Matrix
die Angabe beschrieben, mit welcher Amplitude es Spin „up“ oder Spin „down“ und den einen oder den anderen Impuls hat – für alle möglichen Impulse. Sie können daher sehen, was eine vollständige quantenmechanische Beschreibung eines einzelnen Elektrons beinhaltet. Was kann man nun über Systeme mit mehr als einem Elektron sagen? Die Basiszustände werden dann komplizierter. Betrachten wir zwei Elektronen. Wir haben zunächst einmal bezüglich der Spins vier mögliche Zustände: beide Elektronen haben Spin „up“, das erste hat Spin „down“ und das zweite Spin „up“, das erste hat Spin „up“ und das zweite Spin „down“ oder beide haben Spin „down“. Wir müssen auch angeben, dass das erste Elektron den Impuls p1 und das zweite Elektron den Impuls p2 hat. Die Basiszustände für zwei Elektronen erfordern die Angabe von zwei Impulsen und zwei Spinrichtungen. Bei sieben Elektronen müssen wir sieben von jedem angeben. Wenn wir ein Proton und ein Elektron betrachten, müssen wir Spinrichtung und Impuls des Protons sowie Spinrichtung und Impuls des Elektrons angeben. Das stimmt zumindest näherungsweise. Tatsächlich wissen wir nicht, was die richtige Darstellung für die Welt ist. Es ist schön und gut, von der Annahme auszugehen, dass wir die vollständigen Basiszustände haben, wenn wir Spin und Impuls des Elektrons und des Protons angeben, aber was ist mit dem „Inneren“ des Protons? Betrachten wir es einmal so: In einem Wasserstoffatom, das aus einem Proton und einem Elektron besteht, müssen wir viele verschiedene Basiszustände beschreiben – Spin up oder down vom Proton und vom Elektron und die verschiedenen möglichen Impulse des Protons und des Elektrons. Dann gibt es verschiedene Kombinationen der Amplituden Ci , die zusammen die Eigenschaft des Wasserstoffatoms in verschiedenen Zuständen beschreiben. Angenommen aber, wir betrachten das ganze Wasserstoffatom als ein „Teilchen“. Wenn wir nicht wüssten, dass das Wasserstoffatom aus einem Proton und einem Elektron besteht, hätten wir gleich so losgelegt und gesagt „Oh, ich weiß, was die Basiszustände sind – sie entsprechen einem speziellen Impuls des Wasserstoffatoms.“ Falsch, denn das Wasserstoffatom hat innere Bestandteile. Es kann daher verschiedene Zustände mit unterschiedlicher innerer Energie haben und die Beschreibung der wirklichen Natur erfordert eine größere Ausführlichkeit. Die Frage ist: Hat ein Proton innere Bestandteile? Müssen wir ein Proton durch Angabe aller möglichen Zustände von Protonen, Mesonen und seltsamen Teilchen beschreiben? Wir wissen es nicht. Wir nehmen zwar an, dass das Elektron elementar ist, sodass wir allein über seinen Impuls und seinen Spin Aussagen machen müssen, doch vielleicht wird morgen jemand entdecken, dass auch das Elektron einen inneren Mechanismus hat. Das würde bedeuten, dass unsere Darstellung unvollständig oder falsch oder nur eine schlechte Näherung ist – ebenso wie eine Darstellung des Wasserstoffatoms, die nur dessen Impuls beschreibt, unvollständig ist, weil sie die Tatsache außer Acht lässt, dass das Wasserstoffatom eine innere Anregung haben kann. Wenn ein Elektron eine innere Anregung hat und sich in etwas anderes, zum Beispiel in ein Myon, verwandeln kann, dann lässt es sich nicht einfach durch Angabe der Zustände des neuen Teilchens beschreiben, sondern vermutlich nur durch einen komplizierten inneren Mechanismus. Das Hauptproblem beim Studium der Elementarteilchen heute besteht darin herauszufinden, welches die richtige Darstellung für die Beschreibung der Natur ist. Gegenwärtig vermuten wir, dass für das Elektron die Angabe des Impulses und des Spins ausreicht. Wir vermuten auch, dass es ein idealisiertes Proton gibt, das seine π-Mesonen, K-Mesonen usw. hat, die alle einzeln aufgeführt werden müssen. Mehrere Dutzend Teilchen – das ist verrückt! Die Frage, was ein Elementarteilchen ist und was nicht, ist die Frage, wie schließlich die Darstellung in der endgültigen quantenmechanischen Beschreibung der Welt aussehen wird. Wird der Impuls des
8.4 Wie sich die Zustände mit der Zeit ändern
143
Elektrons das richtige Konzept sein, um die Natur zu beschreiben? Oder sollen wir die Frage überhaupt so stellen? Diese Frage muss bei jeder wissenschaftlichen Forschung gestellt werden. Jedenfalls stehen wir vor dem Problem, die richtige Darstellung zu finden. Wir kennen die Antwort nicht. Wir wissen nicht einmal, ob wir das „richtige“ Problem formuliert haben. Und wenn dem so ist, müssen wir zuerst herausfinden, ob ein spezielles Teilchen „elementar“ ist oder nicht. In der nichtrelativistischen Quantenmechanik – wenn die Energien nicht zu hoch sind, sodass sie den inneren Mechanismus der seltsamen Teilchen usw. nicht stören – können Sie ganz gut zurechtkommen, ohne sich um diese Einzelheiten zu kümmern. Sie können einfach beschließen, Impuls und Spin der Elektronen und Kerne anzugeben; dann wird alles in Ordnung sein. Bei den meisten chemischen Reaktionen und anderen niederenergetischen Vorgängen geschieht in den Kernen nichts; sie werden nicht angeregt. Auch wenn sich ein Wasserstoffatom langsam bewegt und sanft gegen andere Wasserstoffatome stößt, können Sie eine Näherung benutzen, in der Sie das Wasserstoffatom wie ein Objekt oder Teilchen behandeln und müssen sich nicht darum kümmern, dass intern etwas geschehen kann. Voraussetzung ist, dass es niemals angeregt wird oder strahlt oder andere komplizierte Sachen tut, sondern immer im Grundzustand bleibt. Das wird eine gute Näherung sein, solange die kinetische Energie bei jedem Zusammenstoß deutlich unter 10 Elektronenvolt ist – das ist die Energie, die benötigt wird, um das Wasserstoffatom in einen höheren inneren Zustand anzuregen. Wir werden oft eine Näherung machen, bei der wir die Möglichkeit innerer Bewegung nicht berücksichtigen, und dabei die Zahl der Details herabsetzen, die wir in unsere Basiszustände aufnehmen. Wir übergehen dabei natürlich einige Phänomene, die (gewöhnlich) bei einer höheren Energie auftreten würden, aber durch solche Näherungen können wir die Berechnung physikalischer Probleme sehr stark vereinfachen. Zum Beispiel können wir den Zusammenstoß von zwei Wasserstoffatomen bei niedriger Energie – oder irgendeinen chemischen Prozess – diskutieren, ohne uns um die Tatsache zu kümmern, dass der Atomkern angeregt werden könnte. Um es zusammenzufassen: Wenn wir die Auswirkungen von inneren angeregten Zuständen eines Teilchens vernachlässigen können, können wir ein Basissystem wählen, das aus den Zuständen mit definiertem Impuls und definierter z-Komponente des Drehimpulses besteht. Ein Problem bei der Beschreibung der Natur besteht dann darin, eine geeignete Darstellung für diese Basiszustände zu finden. Aber das ist nur der Anfang. Wir möchten auch noch sagen können, was „geschieht“. Wenn wir den „Zustand“ der Welt zu einem Zeitpunkt kennen, würden wir gern wissen, wie der Zustand zu einem späteren Zeitpunkt aussieht. Wir müssen daher auch die Gesetze finden, die angeben, wie sich die Dinge mit der Zeit ändern. Wir wenden uns nun dem zweiten Teil im Gerüst der Quantenmechanik zu – wie sich die Zustände mit der Zeit ändern.
8.4
Wie sich die Zustände mit der Zeit ändern
Wir haben schon besprochen, wie wir eine Situation beschreiben können, in der wir ein Objekt durch einen Apparat schicken. Nun ist ein für die Behandlung bequemer und erfreulicher „Apparat“ einfach eine Wartezeit von einigen Minuten, das heißt, Sie präparieren einen Zustand φ und lassen ihn dann vor dem Analysieren einfach eine Zeit lang in Ruhe. Vielleicht lassen Sie ihn in einem elektrischen oder magnetischen Feld – das hängt von den physikalischen Umständen in der Welt ab. Ganz gleich, wie die Bedingungen sind, lassen Sie das Objekt von der Zeit
144
8 Die Hamilton-Matrix
t1 bis zur Zeit t2 in Ruhe. Nehmen Sie an, es wurde aus Ihrem ersten Apparat zur Zeit t1 im Zustand φ herausgelassen. Danach geht es durch einen zweiten „Apparat“, aber dieser „Apparat“ besteht nur aus einer Wartezeit bis t2 . Während der Wartezeit können verschiedene Dinge geschehen – Anwendung äußerer Kräfte oder andere Einflüsse –, sodass etwas passiert. Am Ende dieser Wartezeit ist die Amplitude, das Objekt in einem Zustand χ zu finden, nicht mehr genau die gleiche wie vorher. Da das „Warten“ nur ein Spezialfall eines „Apparates“ ist, können wir das Geschehen durch die Angabe einer Amplitude von derselben Form wie (8.17) beschreiben. Da die Operation des „Wartens“ besonders wichtig ist, wollen wir sie U statt A nennen, und um die Anfangs- und Endzeiten t1 und t2 anzugeben, wollen wir U(t2 , t1 ) schreiben. Die gesuchte Amplitude ist � χ | U(t2 , t1 ) | φ � .
(8.27)
Wie jede andere Amplitude kann sie in dem einen oder anderen Basissystem dargestellt werden, indem man schreibt � χ | i � � i | U(t2 , t1 ) | j � � j | φ � . (8.28) ij
Dann ist U vollständig beschrieben durch Angabe des ganzen Amplitudensatzes – der Matrix � i | U(t2 , t1 ) | j � .
(8.29)
Die Matrix � i | U(t2 , t1 ) | j � gibt übrigens viel mehr Einzelheiten an, als man brauchen kann. Theoretische Physiker, die sich mit Hochenergiephysik beschäftigen, betrachten Probleme von folgender allgemeiner Beschaffenheit (weil die Experimente gewöhnlich so durchgeführt werden). Sie beginnen mit einem Paar von Teilchen, beispielsweise mit zwei Protonen, die aus dem Unendlichen zusammentreffen. (Im Labor befindet sich gewöhnlich ein Teilchen in Ruhe und das andere kommt aus einem Beschleuniger, was im atomaren Maßstab praktisch „aus dem Unendlichen“ bedeutet.) Die Teilchen prallen zusammen und heraus kommen beispielsweise zwei K-Mesonen, sechs π-Mesonen und zwei Neutronen in gewissen Richtungen mit gewissen Impulsen. Was ist die Amplitude dafür, dass dies geschieht? Die Mathematik sieht so aus: Der φ-Zustand gibt die Spins und Impulse der ankommenden Teilchen an. Das χ beschreibt das, was herauskommt. Zum Beispiel, mit welcher Amplitude erhalten Sie sechs Mesonen, die in die und die Richtungen laufen, und zwei Neutronen, die in jene Richtungen davonfliegen mit ihren Spins so und so. Mit anderen Worten, χ ist durch die Angabe aller Impulse, Spins usw. der Endprodukte genau bestimmt. Es ist dann Aufgabe des Theoretikers, die Amplitude (8.27) zu berechnen. Tatsächlich ist er jedoch nur an dem Spezialfall interessiert, in dem t1 gleich −∞ und t2 gleich +∞ ist. (Für die Einzelheiten des Prozesses gibt es keinen experimentellen Nachweis, sondern nur für das, was hineingeht, und das, was herauskommt.) Der Grenzfall von U(t2 , t1 ) für t1 → −∞ und t2 → +∞ wird S genannt, und was der Theoretiker wissen möchte, ist �χ|S |φ� . Oder er berechnet unter Verwendung von (8.28) die Matrix �i|S | j� ,
8.4 Wie sich die Zustände mit der Zeit ändern
145
die S -Matrix genannt wird. Wenn Sie also einen theoretischen Physiker auf und ab gehen sehen und sagen hören: „Alles, was ich tun muss, ist, die S -Matrix zu berechnen,“ werden Sie wissen, worüber er sich Gedanken macht. Wie man die S -Matrix berechnet – wie man ihre Gesetze angibt – ist eine interessante Frage. In der relativistischen Quantenmechanik, also für hohe Energien, kann man es auf die eine Art machen und in der nichtrelativistischen Quantenmechanik auf eine andere, die sehr bequem ist. (Diese andere Methode kann auch im relativistischen Fall angewendet werden, aber dann ist sie nicht mehr so bequem.) Es gilt, die U-Matrix für ein kleines Zeitintervall zu ermitteln – mit anderen Worten, für dicht zusammenliegende Zeitpunkte t2 und t1 . Wenn wir eine Folge solcher U’s für aufeinanderfolgende Zeltintervalle finden können, können wir den Ablauf der Dinge als Funktion der Zeit verfolgen. Sie können sofort einsehen, dass diese Methode im relativistischen Fall nicht so gut ist, weil Sie nicht gern angeben wollen, wie alles überall „gleichzeitig“ aussieht. Wir wollen uns darum aber nicht sorgen – wir werden uns nur mit der nichtrelativistischen Quantenmechanik beschäftigen. Nehmen wir an, wir denken an die Matrix U für eine Wartezeit von t1 bis zum Zeitpunkt t3 , der größer ist als t2 . Mit anderen Worten, wir betrachten drei aufeinanderfolgende Zeitpunkte t1 < t2 < t3 . Dann fordern wir, dass die Matrix, die zwischen t1 und t3 vermittelt, das aufeinanderfolgende Produkt von dem ist, was geschieht, wenn wir von t1 bis t2 warten und dann von t2 bis t3 . Das entspricht genau der Situation, in der wir zwei Apparate B und A in Reihe hatten. Der Schreibweise von Abschnitt 5.6 folgend, können wir dann schreiben U(t3 , t1 ) = U(t3 , t2 ) · U(t2 , t1 ) .
(8.30)
Wir können, mit anderen Worten, jedes Zeitintervall berechnen, wenn wir eine dazwischen liegende Folge von kurzen Zeitintervallen berechnen können. Wir multiplizieren alle Teilstücke miteinander – dies ist die Methode, mit der die Quantenmechanik nichtrelativistisch behandelt wird. Unser Problem reduziert sich somit darauf, die Matrix U(t2 , t1 ) für ein infinitesimales Zeitintervall [t1 , t2 = t1 + Δt] zu verstehen. Wir stellen uns deshalb die folgende Frage: Wenn wir einen Zustand | φ � haben, wie sieht dieser Zustand eine infinitesimale Zeit Δt später aus? Wie können wir das aufschreiben? Der Zustand zur Zeit t sei | ψ(t) � (wir geben die Zeitabhängigkeit von ψ an, damit klar ist, dass wir den Zustand zur Zeit t meinen). Nun fragen wir: Welchen Zustand haben wir ein kurzes Zeitintervall Δt später? Die Antwort ist | ψ(t + Δt) � = U(t + Δt, t) | ψ(t) � .
(8.31)
� χ | ψ(t + Δt) � = � χ | U(t + Δt, t) | ψ(t) � .
(8.32)
� i | ψ(t + Δt) � = � i | U(t + Δt, t) | ψ(t) � .
(8.33)
Dies bedeutet dasselbe wie das, was wir mit (8.25) ausdrücken wollten, nämlich dass die Amplitude, den Zustand χ zur Zeit t + Δt vorzufinden, durch gegeben ist. Da wir diesen abstrakten Formalismus noch nicht allzu gut beherrschen, wollen wir unsere Amplituden in eine bestimmte Darstellung projizieren. Wenn wir beide Seiten von (8.31) mit � i | multiplizieren, erhalten wir Wir können auch das | ψ(t) � in Basiszustände zerlegen und schreiben � i | ψ(t + Δt) � = � i | U(t + Δt, t) | j � � j | ψ(t) � . j
(8.34)
146
8 Die Hamilton-Matrix
Wir können (8.34) folgendermaßen verstehen. Wenn wir mit Ci (t) = � i | ψ(t) � die Amplitude bezeichnen, dass | ψ � zur Zeit t im Basiszustand i ist, dann können wir uns vorstellen, dass diese Amplitude (einfach eine Zahl, wie Sie sich erinnern werden) mit der Zeit variiert. Jedes Ci wird zu einer Funktion von t. Wir haben auch einige Informationen darüber, wie die Amplituden Ci mit der Zeit variieren. Zur Zeit (t + Δt) ist jede Amplitude proportional zu all den anderen Amplituden zur Zeit t, multipliziert mit einem Satz von Koeffizienten. Wir wollen die U-Matrix Ui j nennen, was bedeuten soll Ui j = � i | U | j � . Dann können wir (8.34) folgendermaßen schreiben: Ui j (t + Δt, t) C j (t) . Ci (t + Δt) =
(8.35)
j
So also wird die Dynamik der Quantenmechanik beschrieben. Wir wissen über die Ui j bis jetzt nicht viel, bis auf eins. Wir wissen, dass für Δt gegen null nichts geschehen kann – wir werden einfach den ursprünglichen Zustand erhalten. Daher gilt für Δt → 0 Uii → 1 und Ui j → 0, wenn i j ist. Oder in Kurzschreibweise: für Δt → 0 gilt Ui j → δi j . Wir können auch annehmen, dass für kleine Δt jeder der Koeffizienten Ui j sich von δi j um Beträge unterscheidet, die proportional zu Δt sind; wir können daher schreiben Ui j (t + Δt, t) = δi j + Ki j Δt .
(8.36)
Aus historischen und anderen Gründen ist es jedoch üblich, den Faktor (−i/) aus den Koeffizienten Ki j herauszuziehen; wir schreiben also lieber Ui j (t + Δt, t) = δi j −
i Hi j (t) Δt .
(8.37)
Das ist natürlich dasselbe wie (8.36) und definiert, wenn Sie so wollen, die Koeffizienten Hi j (t). Die Ausdrücke Hi j sind gerade die Ableitungen der Koeffizienten Ui j (t2 , t1 ) nach t2 , berechnet für t2 = t1 = t. Wenn wir diese Form für Ui j in (8.35) benutzen, erhalten wir Ci (t + Δt) =
i δi j − Hi j (t) Δt C j (t) . j
(8.38)
Wenn wir über den δi j -Term summieren, erhalten wir Ci (t), was wir auf die andere Seite der Gleichung bringen können. Wenn wir dann noch durch Δt dividieren, erhalten wir Ci (t + Δt) − Ci (t) i =− Hi j (t) C j (t) , Δt j was wir als Ableitung erkennen, sodass wir schreiben können i
dCi (t) = Hi j (t) C j (t) . dt j
(8.39)
8.5 Die Hamilton-Matrix
147
Sie erinnern sich, dass Ci (t) die Amplitude � i | ψ � dafür ist, den Zustand ψ in einem der Basiszustände i (zur Zeit t) zu finden. Gleichung (8.39) sagt uns daher, wie jeder der Koeffizienten � i | ψ � zeitlich variiert. Das aber entspricht der Aussage, dass Gleichung (8.39) bestimmt, wie sich der Zustand ψ zeitlich verändert, da ψ durch die Amplituden � i | ψ � beschrieben wird. Die zeitliche Veränderung von ψ wird durch die Matrix Hi j beschrieben, die natürlich all das umfassen muss, was mit dem System geschieht, um eine Änderung hervorzurufen. Wenn wir die Hi j kennen – welche die Physik der Situation enthalten und im Allgemeinen zeitabhängig sein können –, haben wir eine vollständige Beschreibung des zeitlichen Verhaltens des Systems. Gleichung (8.39) ist damit das quantenmechanische Gesetz für die Dynamik der Welt. (Wir sollten erwähnen, dass wir immer ein System von Basiszuständen verwenden werden, die zeitlich konstant sind. Es ist auch möglich, zeitlich veränderliche Basiszustände zu benutzen. Das ist jedoch so, als wenn man in der Mechanik ein rotierendes Koordinatensystem benutzt, und wir möchten nicht in solche Komplikationen verwickelt werden.)
8.5
Die Hamilton-Matrix
Das Prinzip ist also, dass wir zur Beschreibung der quantenmechanischen Welt einen Satz von Basiszuständen i auswählen und die dynamischen Gesetze durch Angabe der Koeffizientenmatrix Hi j formulieren. Dann haben wir alles – wir können jede Frage hinsichtlich des zukünftigen Geschehens beantworten. Wir müssen daher lernen, welche Regeln für das Auffinden der H’s gelten, die zu einer physikalischen Situation gehören – was einem magnetischen Feld oder einem elektrischen Feld usw. entspricht. Das ist der schwierigste Teil. Zum Beispiel haben wir keine Ahnung, was für Hi j wir für die neuen seltsamen Teilchen verwenden sollen. Mit anderen Worten, niemand kennt die vollständigen Hi j für die ganze Welt. (Die Schwierigkeiten beginnen damit, dass man kaum hoffen kann, die Hi j zu entdecken, wenn man nicht einmal weiß, welches die Basiszustände sind!) Wir haben jedoch ausgezeichnete Näherungen für nichtrelativistische Phänomene und einige andere Spezialfälle. Insbesondere haben wir die Ausdrücke, die für die Bewegungen der Elektronen in Atomen gebraucht werden – und somit die Voraussetzungen, um die Chemie zu beschreiben. Das vollständige, korrekte H für das gesamte Universum kennen wir aber nicht. Die Koeffizienten Hi j werden Hamilton-Matrix (oder im Englischen einfach kurz Hamiltonian) genannt. (Dass eine quantenmechanische Matrix den Namen von Hamilton trägt, der um 1830 wirkte, hat historische Gründe.) Es wäre viel besser, wenn sie Energiematrix hieße, und zwar aus Gründen, die ersichtlich werden, wenn wir mit ihr arbeiten. Dies ist daher die Aufgabe: Bestimmen Sie Ihre Hamilton-Matrix! Die Hamilton-Matrix hat eine Eigenschaft, die sofort hergeleitet werden kann, nämlich Hi∗j = H ji .
(8.40)
Dies folgt aus der Bedingung, dass sich die Gesamtwahrscheinlichkeit, dass das System in irgendeinem Zustand ist, nicht verändert. Wenn Sie mit einem Teilchen – einem Objekt oder der Welt – beginnen, dann bleibt es Ihnen auch erhalten, wenn die Zeit verstreicht. Die Gesamtwahrscheinlichkeit, es irgendwo zu finden, ist |Ci (t)|2 , i
148
8 Die Hamilton-Matrix
was sich nicht mit der Zeit ändern darf. Wenn dies für jeden Anfangszustand φ gelten muss, dann muss auch (8.40) gelten. Als erstes Beispiel behandeln wir eine Situation, in der sich die physikalischen Verhältnisse nicht mit der Zeit ändern. Wir meinen hiermit die äußeren physikalischen Bedingungen, sodass H unabhängig von der Zeit ist. Niemand schaltet Elektromagnete an oder ab. Außerdem wählen wir das System so, dass nur ein einziger Basiszustand zu seiner Beschreibung erforderlich ist. Dies ist eine Näherung, die wir für ein ruhendes Wasserstoffatom machen könnten. Gleichung (8.39) hat dann die einfache Form i
dC1 = H11C1 . dt
(8.41)
Nur eine Gleichung – das ist alles! Wenn H11 konstant ist, ist die Differentialgleichung leicht zu lösen und man erhält C1 = (konst.) e−(i/)H11 t .
(8.42)
Dies ist die Zeitabhängigkeit eines Zustandes mit der Energie E = H11 . Sie sehen, warum Hi j Energiematrix genannt werden sollte. Sie ist die Verallgemeinerung der Energie für komplexere Situationen. Um etwas mehr von der Bedeutung der Gleichungen zu verstehen, betrachten wir als Nächstes ein System, das zwei Basiszustände hat. Dann hat (8.39) die Form dC1 = H11C1 + H12C2 , dt dC2 = H21C1 + H22C2 . i dt i
(8.43)
Wenn die H’s wieder zeitunabhängig sind, können Sie diese Gleichungen leicht lösen. Wir überlassen es Ihnen, es zum Spaß einmal zu versuchen, und kommen auf die Lösung erst später zurück. Ja, Sie können die quantenmechanische Lösung finden, ohne die H’s zu kennen, solange sie unabhängig von der Zeit sind.
8.6
Das Ammoniakmolekül
Wir möchten Ihnen jetzt zeigen, wie die dynamische Gleichung der Quantenmechanik dazu verwendet werden kann, eine spezielle physikalische Situation zu beschreiben. Wir haben ein interessantes, aber einfaches Beispiel herausgegriffen, aus dem wir durch einige vernünftige Annahmen über die Hamilton-Matrix einige wichtige – und sogar praktische – Ergebnisse erzielen können. Wir nehmen eine durch zwei Zustände beschreibbare Situation: das Ammoniakmolekül. Das Ammoniakmolekül hat ein Stickstoffatom und drei Wasserstoffatome, die sich in einer Ebene unterhalb des Stickstoffs befinden, sodass das Molekül die Form einer Pyramide hat (siehe Abbildung 8.1 (a)). Nun hat dieses Molekül, wie jedes andere, eine unendliche Anzahl von Zuständen. Es kann sich um jede mögliche Achse drehen, es kann sich in jede Richtung bewegen, es kann intern vibrieren usw. Es ist daher eigentlich kein Zweizustandssystem. Wir möchten
8.6 Das Ammoniakmolekül
149
N
(a)
H H
|1�
H
H H H (b)
N
|2� Abb. 8.1: Zwei äquivalente geometrische Anordnungen des Ammoniakmoleküls.
aber als Näherung annehmen, dass fast alle Zustände unverändert bleiben, weil sie in das, was uns im Moment beschäftigt, nicht eingehen. Wir wollen nur in Betracht ziehen, dass das Molekül sich um seine Symmetrieachse dreht (wie in der Abbildung gezeigt), dass es jedoch den Impuls null hat und dass es so wenig wie möglich vibriert. Damit sind alle Bedingungen festgelegt, bis auf eine: Es gibt noch zwei mögliche Positionen für das Stickstoffatom – der Stickstoff kann auf der einen oder der anderen Seite der von den Wasserstoffatomen aufgespannten Ebene sein, wie in Abbildung 8.1 (a) und (b) gezeigt. Wir werden daher das Molekül so behandeln, als wäre es ein Zweizustandssystem. Wir meinen damit, dass es nur zwei Zustände gibt, mit denen wir uns wirklich beschäftigen wollen; alles andere nehmen wir als zeitlich konstant an. Selbst wenn wir wissen, dass es sich mit einem gewissen Drehimpuls um die Achse dreht und sich mit einem gewissen Impuls bewegt und auf bestimmte Art vibriert, gibt es immer noch zwei mögliche Zustände. Wir wollen sagen, dass das Molekül im Zustand | 1 � ist, wenn der Stickstoff „oben“ ist, wie in Abbildung 8.1 (a), und dass es im Zustand | 2 � ist, wenn der Stickstoff „unten“ ist, wie in (b). Die Zustände | 1 � und | 2 � werden als Satz der Basiszustände für unsere Untersuchung des Verhaltens des Ammoniakmoleküls verwendet. Zu jedem Zeitpunkt kann der tatsächliche Zustand | ψ � des Moleküls dargestellt werden durch die Angabe von C1 = � 1 | ψ �, der Amplitude, im Zustand | 1 � zu sein, und von C2 = � 2 | ψ �, der Amplitude, im Zustand | 2 � zu sein. Unter Verwendung von (8.8) können wir dann den Zustandsvektor schreiben als oder
|ψ� = |1��1|ψ� + |2��2|ψ� | ψ � = | 1 � C 1 + | 2 � C2 .
(8.44)
Das Interessante ist nun Folgendes: Wenn man weiß, dass das Molekül zu einem Zeitpunkt in einem bestimmten Zustand ist, dann weiß man auch, dass es kurze Zeit später nicht mehr in
150
8 Die Hamilton-Matrix
demselben Zustand sein wird. Die zwei C-Koeffizienten werden sich mit der Zeit ändern, und zwar gemäß den Gleichungen (8.43), die für jedes Zweizustandssystem gültig sind. Nehmen wir zum Beispiel an, dass Sie eine Beobachtung gemacht haben – oder dass Sie eine Auswahl der Moleküle getroffen haben –, sodass Sie wissen, dass das Molekül anfangs im Zustand | 1 � ist. Einige Zeit später gibt es eine Wahrscheinlichkeit, dass es im Zustand | 2 � vorgefunden wird. Um herauszufinden, wie groß diese Wahrscheinlichkeit ist, müssen wir die Differentialgleichung lösen, die uns sagt, wie sich die Amplituden zeitlich ändern. Die einzige Schwierigkeit besteht darin, dass wir nicht wissen, wie wir die Koeffizienten Hi j in (8.43) wählen sollen. Es gibt jedoch einige Dinge, die wir sagen können. Nehmen wir an, sobald das Molekül einmal im Zustand | 1 � ist, gäbe es keine Wahrscheinlichkeit, dass es jemals in den Zustand | 2 � gelangen kann und umgekehrt. Dann wären H12 und H21 beide null und (8.43) hätte die Form dC1 dC2 = H11C1 , i = H22 C2 . dt dt Diese beiden Gleichungen können wir leicht lösen. Wir erhalten i
C1 = (konst.) e−(i/)H11 t ,
C2 = (konst.) e−(i/)H22 t .
(8.45)
Dies sind die Amplituden für stationäre Zustände mit den Energien E1 = H11 und E2 = H22 . Wir bemerken jedoch, dass die beiden Zustände | 1 � und | 2 � für das Ammoniakmolekül eine bestimmte Symmetrie haben. Wenn die Natur überhaupt vernünftig ist, müssen die Matrixelemente H11 und H22 gleich sein. Wir werden sie beide mit E0 bezeichnen, weil sie der Energie entsprechen, die die Zustände hätten, wenn H12 und H21 null wären. Die Gleichungen (8.45) sagen uns aber nicht, was das Ammoniakmolekül wirklich tut. Es stellt sich heraus, dass es für den Stickstoff möglich ist, sich einen Weg durch die von den drei Wasserstoffatomen aufgespannte Ebene zu bahnen und auf die andere Seite zu wechseln. Das ist recht schwierig, da es viel Energie erfordert. Wie kann der Stickstoff seine Position ändern, wenn er nicht genügend Energie hat? Es gibt eine gewisse Amplitude, dass er die Energiebarriere durchdringen wird. In der Quantenmechanik ist es möglich, schnell durch ein Gebiet zu tunneln, das energetisch verboten ist. Es gibt daher eine kleine Amplitude, dass ein Molekül, das im Zustand | 1 � startet, in den Zustand | 2 � gelangt. Die Koeffizienten H12 und H21 sind nicht wirklich null. Wieder aus Symmetriegründen sollten sie beide – zumindest dem Betrag nach – gleich sein. Wir wissen tatsächlich schon, dass im Allgemeinen Hi j gleich dem konjugiert Komplexen von H ji sein muss, sodass sie sich nur in der Phase unterscheiden können. Es stellt sich heraus, wie Sie sehen werden, dass es keine Beschränkung der Allgemeinheit ist, wenn wir sie als gleich ansehen. Um es später leichter zu haben, setzen wir sie gleich einer negativen Zahl: H12 = H21 = −A. Damit haben wir das folgende Paar von Gleichungen: dC1 = E0C1 − AC2 , (8.46) dt dC2 = E0C2 − AC1 . i (8.47) dt Diese Gleichungen sind recht einfach und können auf viele unterschiedliche Arten gelöst werden. Eine bequeme Methode ist folgende. Wir bilden die Summe der beiden Gleichungen und erhalten d i (C1 + C2 ) = (E0 − A) (C1 + C2 ) . dt i
8.6 Das Ammoniakmolekül
151
Die Lösung ist C1 + C2 = a e−(i/)(E0 −A)t .
(8.48)
Wenn wir dagegen die Differenz von (8.46) und (8.47) bilden, erhalten wir i
d (C1 − C2 ) = (E0 + A)(C1 − C2 ) , dt
und somit C1 − C2 = b e−(i/)(E0 +A)t .
(8.49)
Die beiden Integrationskonstanten a und b sind natürlich so zu wählen, dass sie für das spezielle physikalische Problem die geeigneten Anfangsbedingungen ergeben. Durch Addition und Subtraktion von (8.48) und (8.49) erhalten wir nun C1 und C2 : C1 (t) =
a −(i/)(E0 −A)t b −(i/)(E0 +A)t e + e , 2 2
(8.50)
C2 (t) =
a −(i/)(E0 −A)t b −(i/)(E0 +A)t e − e . 2 2
(8.51)
Sie sind bis auf das Vorzeichen des zweiten Terms gleich. Die Lösungen haben wir nun, aber was bedeuten sie? (Das Schwierige bei der Quantenmechanik ist nicht nur, die Gleichungen zu lösen, sondern auch, die Bedeutung der Lösungen zu verstehen!) Zunächst überlegen wir uns, dass im Falle b = 0 beide Ausdrücke dieselbe Frequenz ω = (E0 − A)/ haben. Wenn sich alles mit einer einheitlichen Frequenz ändert, bedeutet das, dass sich das System in einem Zustand mit bestimmter Energie befindet – in diesem Fall mit der Energie (E0 − A). Daher gibt es einen stationären Zustand mit dieser Energie, in dem die beiden Amplituden C1 und C2 gleich sind. Wir erhalten das Ergebnis, dass das Ammoniakmolekül eine bestimmte Energie (E0 − A) hat, wenn es für das Stickstoffatom gleiche Amplituden dafür gibt, „oben“ oder „unten“ zu sein. Ein zweiter stationärer Zustand ist möglich, wenn a = 0 ist; dann haben beide Amplituden die Frequenz (E0 + A)/. Es gibt daher einen anderen Zustand mit der bestimmten Energie (E0 + A), wenn die beiden Amplituden gleich sind, aber entgegengesetztes Vorzeichen haben, also C2 = −C1 . Dies sind die beiden einzigen Zustände mit bestimmter Energie. Im nächsten Kapitel wollen wir die Zustände des Ammoniakmoleküls ausführlicher diskutieren; hier wollen wir nur noch ein paar Anmerkungen machen. Weil es eine Wahrscheinlichkeit gibt, dass das Stickstoffatom von einer Position in die andere wechselt, folgern wir, dass die Energie des Moleküls nicht genau E0 ist, wie wir anfangs angenommen haben, sondern dass es zwei Energieniveaus (E0 + A) und (E0 − A) gibt. Jeder der möglichen Zustände des Moleküls, gleich welche Energie er hat, ist in zwei Niveaus „aufgespalten“. Wir sagen, jeder Zustand, denn wie Sie sich erinnern werden, haben wir einen einzelnen Zustand der Rotation und inneren Energie usw. herausgegriffen. Für jeden möglichen Zustand dieser Art gibt es wegen des Umklappens des Moleküls ein Doublett von Energieniveaus. Über das Ammoniakmolekül wollen wir nun Folgendes wissen. Angenommen, wir wissen, dass zur Zeit t = 0 ein Molekül im Zustand | 1 � ist oder anders formuliert, dass C1 (0) = 1 und
152
8 Die Hamilton-Matrix
C2 (0) = 0 ist. Wie groß ist dann die Wahrscheinlichkeit, dass das Molekül zur Zeit t schon im Zustand | 2 � oder noch immer im Zustand | 1 � gefunden wird? Unsere Anfangsbedingung sagt uns, was a und b in (8.50) und (8.51) sind. Wenn wir t = 0 setzen, erhalten wir C1 (0) =
a+b = 1, 2
C2 (0) =
a−b = 0. 2
Offensichtlich ist a = b = 1. Wenn wir diese Werte in die Formeln für C1 (t) und C2 (t) einsetzen und einige Terme umordnen, erhalten wir C1 (t) = e−(i/)E0 t
e(i/)At + e−(i/)At
, 2 e(i/)At − e−(i/)At C2 (t) = e−(i/)E0 t . 2
Dies können wir auch so schreiben: C1 (t) = e−(i/)E0 t cos
At
(8.52)
C2 (t) = ie−(i/)E0 t sin
At .
(8.53)
Die beiden Amplituden haben einen Betrag, der harmonisch mit der Zeit variiert. Die Wahrscheinlichkeit, dass das Molekül zur Zeit t im Zustand | 2 � gefunden wird, ist das Absolutquadrat von C2 (t): |C2 (t)|2 = sin2
At .
(8.54)
Die Wahrscheinlichkeit beginnt (wie sie sollte) bei null, steigt auf eins an und oszilliert dann zwischen null und eins hin und her, wie die Kurve P2 in Abbildung 8.2 zeigt. Die Wahrscheinlichkeit, in dem | 1 �- Zustand zu sein, bleibt natürlich nicht bei eins. Sie „fällt ab“, bis die Wahrscheinlichkeit, das Molekül im ersten Zustand zu finden, null ist, wie die Kurve P1 in Abbildung 8.2 zeigt. Die Wahrscheinlichkeit schwankt zwischen den beiden Zuständen hin und her. In Kapitel 24 des zweiten Bandes haben wir gesehen, was mit zwei gleichen Pendeln bei einer schwachen Kopplung geschieht. Wenn wir ein Pendel anheben und dann loslassen, schwingt es, und dann beginnt allmählich das andere zu schwingen. Recht bald hat das zweite Pendel die gesamte Energie aufgenommen. Dann kehrt sich der Vorgang um und das erste Pendel nimmt die Energie auf. Das ist genau derselbe Vorgang. Die Geschwindigkeit, mit der die Energie ausgetauscht wird, hängt von der Kopplung zwischen den beiden Pendeln ab – von der Geschwindigkeit, mit der die „Schwingung“ hinübersickern kann. Erinnern Sie sich auch daran, dass es bei den beiden Pendeln zwei spezielle Bewegungen gibt – jede mit einer bestimmten Frequenz –, die wir die Grundschwingungen nennen. Wenn wir beide Pendel zugleich in die gleiche Richtung auslenken, schwingen sie gemeinsam mit der einen Frequenz. Wenn wir andererseits das eine in die eine Richtung und das andere in die andere Richtung auslenken, gibt es eine andere stationäre Schwingungsmode, ebenfalls mit einer bestimmten Frequenz.
8.6 Das Ammoniakmolekül
153
P 1,0
P1
0,5 P2 0
π 4
3π π 4 (Einheiten von /A) π 2
5π 4
t
Abb. 8.2: Die Wahrscheinlichkeit P1 , dass ein Ammoniakmolekül, das zur Zeit t = 0 im Zustand | 1 � ist, zur Zeit t im Zustand | 1 � gefunden wird. Die Wahrscheinlichkeit P2 , dass es im Zustand | 2 � gefunden wird.
Hier haben wir eine ähnliche Situation – das Ammoniakmolekül entspricht mathematisch zwei gekoppelten Pendeln. Die beiden Frequenzen (E0 − A)/ und (E0 + A)/ gelten für die Fälle, dass sie gemeinsam bzw. entgegengesetzt schwingen. Die Analogie mit dem Pendel geht nicht viel tiefer als bis zu dem Prinzip, dass dieselben Gleichungen dieselben Lösungen haben. Die linearen Gleichungen für die Amplituden (8.39) sind den linearen Gleichungen für harmonische Oszillatoren sehr ähnlich. (In der Tat ist dies der Grund, der hinter dem Erfolg unserer klassischen Theorie des Brechungsindex steht, in der wir das quantenmechanische Atom durch einen harmonischen Oszillator ersetzt haben, obwohl dies klassisch kein vernünftiges Bild von Elektronen ist, die um einen Kern kreisen.) Wenn Sie den Stickstoff auf eine Seite ziehen, dann erhalten Sie eine Überlagerung von diesen beiden Frequenzen, und Sie erhalten eine Art Schwebung, weil das System nicht in dem einen oder dem anderen Zustand mit bestimmter Frequenz ist. Die Aufspaltung der Energieniveaus des Ammoniakmoleküls ist jedoch streng genommen ein quantenmechanischer Effekt. Die Aufspaltung der Energieniveaus des Ammoniakmoleküls hat wichtige praktische Anwendungen, die wir im nächsten Kapitel beschreiben werden. Endlich haben wir ein Beispiel für ein praktisches physikalisches Problem, das Sie mithilfe der Quantenmechanik verstehen können!
9
Der Ammoniak-Maser
MASER = Microwave Amplification by Stimulated Emission of Radiation (= Mikrowellenverstärkung durch induzierte Strahlungsemission)
9.1
Die Zustände eines Ammoniakmoleküls
In diesem Kapitel werden wir eine praktische Anwendung der Quantenmechanik besprechen: den Ammoniak-Maser. Vielleicht wundern Sie sich darüber, dass wir die formale Darstellung der Quantenmechanik unterbrechen, um ein spezielles Problem zu behandeln, aber Sie werden feststellen, dass viele Eigenschaften dieses speziellen Problems in der allgemeinen Theorie der Quantenmechanik allgegenwärtig sind, und Sie werden viel lernen, wenn Sie dieses eine Problem ausführlich analysieren. Der Ammoniak-Maser ist eine Vorrichtung zur Erzeugung elektromagnetischer Wellen, deren Arbeitsweise auf den Eigenschaften des Ammoniakmoleküls beruht, die wir im vorangegangenen Kapitel besprochen haben. Zu Beginn fassen wir die dort gefundenen Ergebnisse zusammen. Das Ammoniakmolekül hat zwar viele Zustände, wir betrachten es aber als ein Zweizustandssystem und interessieren uns jetzt nur dafür, was geschieht, wenn sich das Molekül in einem speziellen Rotations- und Translationszustand befindet. Ein anschauliches physikalisches Modell für die beiden Zustände ist folgendes. Wenn wir annehmen, dass das Ammoniakmolekül um die Achse rotiert, die durch das Stickstoffatom geht und senkrecht auf der Ebene der Wasserstoffatome steht (siehe Abbildung 9.1), dann gibt es noch zwei mögliche Zustände – der Stickstoff kann auf der einen oder der anderen Seite der Ebene der Wasserstoffatome sein. Diese
E
N
Dipolmoment
H H
μ
H H
H
μ Schwerpunkt
N
H |1�
|2�
Abb. 9.1: Ein physikalisches Modell der beiden Basiszustände für das Ammoniakmolekül. Diese Zustände haben die elektrischen Dipolmomente μ.
156
9 Der Ammoniak-Maser
beiden Zustände nennen wir | 1 � und | 2 �. Wir werden sie bei der Untersuchung des Verhaltens des Ammoniakmoleküls als Satz der Basiszustände benutzen. In einem System mit zwei Basiszuständen kann jeder Zustand | ψ � des Systems immer als Linearkombination der beiden Basiszustände beschrieben werden; das heißt, es gibt eine gewisse Amplitude C1 , in dem einen Basiszustand zu sein, und eine Amplitude C2 , in dem anderen zu sein. Wir können einen solchen Zustandsvektor schreiben als | ψ � = | 1 � C1 + | 2 � C2
(9.1)
mit C1 = � 1 | ψ �
und C2 = � 2 | ψ � .
Diese beiden Amplituden ändern sich mit der Zeit, entsprechend den hamiltonschen Gleichungen (8.43). Unter Ausnutzung der Symmetrie dieser beiden Zustände des Ammoniakmoleküls setzen wir H11 = H22 = E0 und H12 = H21 = −A und erhalten die Lösung [siehe (8.50) und (8.51)] a −(i/)(E0 −A)t e + 2 a C2 = e−(i/)(E0 −A)t − 2
C1 =
b −(i/)(E0 +A)t e , 2 b −(i/)(E0 +A)t e . 2
(9.2) (9.3)
Diese allgemeinen Lösungen wollen wir uns nun näher anschauen. Nehmen wir an, dass sich das Molekül anfangs in einem Zustand | ψII � befindet, in dem der Koeffizient b gleich null ist. Dann sind für t = 0 die Amplituden, im Zustand | 1 � bzw. | 2 � zu sein, identisch, und das bleiben sie für alle Zeit. Ihre Phasen variieren zeitlich beide auf die gleiche Weise – mit der Frequenz (E 0 − A)/. Wenn wir das Molekül in einen Zustand | ψI � bringen, für den a = 0 ist, ergibt sich entsprechend, dass die Amplitude C2 das Negative von C1 ist, und diese Beziehung bleibt für immer so bestehen. Beide Amplituden variieren nun zeitlich mit der Frequenz (E0 + A)/. Dies sind die beiden einzigen Möglichkeiten für Zustände, bei denen die Beziehung zwischen C1 und C2 unabhängig von der Zeit ist. Wir haben zwei spezielle Lösungen gefunden, bei denen die beiden Amplituden nicht im Betrag variieren und außerdem Phasen haben, die mit derselben Frequenz variieren. Dies sind stationäre Zustände, wie wir sie in Abschnitt 7.1 definiert haben, was bedeutet, dass es Zustände mit bestimmter Energie sind. Der Zustand | ψII � hat die Energie E II = E0 − A und der Zustand | ψI � hat die Energie E I = E0 + A. Dies sind die beiden einzigen stationären Zustände, die es gibt, wir sehen also, dass das Molekül zwei Energieniveaus hat mit der Energiedifferenz 2A. (Wir meinen natürlich zwei Energieniveaus für den vorausgesetzten Rotations- und Vibrationszustand, auf den wir uns in unseren Anfangsbedingungen bezogen haben.)1 Wenn wir nicht die Möglichkeit berücksichtigt hätten, dass der Stickstoff die Seiten wechselt, hätten wir A gleich null gesetzt und die beiden Energieniveaus würden bei der Energie E0 1
Im Folgenden wird es eine Hilfe sein – wenn Sie für sich lesen oder mit einem anderen diskutieren –, eine bequeme Methode zu haben, zwischen den arabischen 1 und 2 und den römischen I und II zu unterscheiden. Wir finden es praktisch, die Bezeichnungen „one“ und „two“ für die arabischen Zahlen zu reservieren und I und II „eins“ und „zwei“ zu nennen (obwohl „unus“ und „duo“ logischer wären!).
9.1 Die Zustände eines Ammoniakmoleküls
157
aufeinander sitzen. Die tatsächlichen Niveaus sind aber nicht so; ihre mittlere Energie ist zwar E0 , aber sie spalten sich um ±A auf, sodass sich ein Abstand von 2A zwischen den Energien der beiden Zustände ergibt. Da A sehr klein ist, ist auch die Energiedifferenz sehr klein. Um ein Elektron innerhalb eines Atoms anzuregen, bedarf es relativ hoher Energien – es erfordert Photonen im optischen oder ultravioletten Bereich. Die Anregung der Vibrationen des Moleküls erfordert Photonen im Infraroten. Wenn wir von der Anregung von Rotationen sprechen, dann entspricht die Energiedifferenz der Zustände den Photonen im fernen Infraroten. Aber die Energiedifferenz 2A ist niedriger als irgendeine von diesen. Sie liegt unterhalb des Infraroten im Mikrowellenbereich. Experimentell hat man herausgefunden, dass es ein Paar von Energieniveaus mit einem Abstand von 10−4 Elektronenvolt gibt – das entspricht einer Frequenz von 24 000 Megahertz. Dies bedeutet offenbar, dass 2A = h f mit f = 24 000 Megahertz ist (was einer Wellenlänge von 1 1/4 cm entspricht). Wir haben es daher mit einem Molekül zu tun, das einen Übergang hat, der nicht Licht im gewöhnlichen Sinne aussendet, sondern Mikrowellen. Für die folgende Betrachtung müssen wir diese beiden Zustände mit bestimmter Energie etwas besser beschreiben. Nehmen wir an, wir müssten aus der Summe der beiden Zahlen C1 und C2 eine Amplitude C II konstruieren: C II = C1 + C2 = � 1 | Φ � + � 2 | Φ � .
(9.4)
Was würde das bedeuten? Nun, dies ist die Amplitude, den Zustand | Φ � in einem neuen Zustand | II � zu finden, in dem die Amplituden der beiden Basiszustände gleich sind. Das heißt, wenn wir C II = � II | Φ � schreiben, können wir das | Φ � aus (9.4) streichen – weil die Gleichung für jedes Φ gilt –, und wir erhalten � II | = � 1 | + � 2 | ,
was dasselbe bedeutet wie
| II � = | 1 � + | 2 � .
(9.5)
Für den Zustand | II � ist die Amplitude, im Zustand | 1 � zu sein, � 1 | II � = � 1 | 1 � + � 1 | 2 � ,
was natürlich genau 1 ist, da | 1 � und | 2 � Basiszustände sind. Die Amplitude für den Zustand | II �, im Zustand | 2 � zu sein, ist ebenfalls 1, der Zustand | II � ist daher einer, der gleiche Amplituden hat, in den beiden Basiszuständen | 1 � und | 2 � zu sein.
Es gibt dabei jedoch ein kleines Problem. Der Zustand | II � hat eine Gesamtwahrscheinlichkeit größer als eins, in irgendeinem Basis- oder anderen Zustand zu sein. Das bedeutet jedoch einfach, dass der Zustandsvektor nicht richtig „normiert“ ist. Wir können das in Ordnung bringen, wenn wir bedenken, dass � II | II � = 1 sein sollte, was für jeden Zustand gelten muss. Wenn wir die allgemeine Beziehung �χ|Φ� = �χ|i��i|Φ� i
anwenden, dabei für Φ und χ den Zustand II einsetzen und die Summe über die Basiszustände | 1 � und | 2 � bilden, erhalten wir � II | II � = � II | 1 � � 1 | II � + � II | 2 � � 2 | II � .
158
9 Der Ammoniak-Maser
Dies ist dann gleich eins, wie es auch sein sollte, wenn wir die durch (9.4) gegebene Definition von C II folgendermaßen ändern: 1 C II = √ [C1 + C2 ] . 2 Auf analoge Art können wir eine Amplitude 1 C I = √ [C1 − C2 ] 2 oder 1 C I = √ [� 1 | Φ � − � 2 | Φ �] 2
(9.6)
konstruieren. Diese Amplitude ist die Projektion des Zustands | Φ � in einen neuen Zustand | I �, der entgegengesetzte Amplituden dafür hat, in den Basiszuständen | 1 � bzw. | 2 � zu sein. Gleichung (9.6) bedeutet nämlich dasselbe wie 1 � I | = √ [� 1 | − � 2 | ] 2 oder 1 | I � = √ [| 1 � − | 2 �] , 2
(9.7)
woraus folgt, dass 1 �1|I� = √ = −�2|I� . 2 Der Grund, warum wir das alles gemacht haben, besteht darin, dass die Zustände | I � und | II � als ein neuer Satz von Basiszuständen genommen werden können, der besonders bequem zur Beschreibung der stationären Zustände des Ammoniakmoleküls ist. Sie erinnern sich, dass ein Satz von Basiszuständen die Bedingung � i | j � = δi j erfüllen muss. Wir haben die Dinge schon so festgelegt, dass � I | I � = � II | II � = 1 . Aus (9.5) und (9.7) können Sie leicht herleiten, dass � I | II � = � II | I � = 0 gilt. Die Amplituden C I = � I | Φ � und C II = � II | Φ �, dass ein Zustand Φ in unseren neuen Basiszuständen | I � und | II � ist, müssen ebenfalls eine hamiltonsche Gleichung der Form (8.39)
9.1 Die Zustände eines Ammoniakmoleküls
159
erfüllen. Wenn wir die beiden Gleichungen (9.2) und (9.3) voneinander subtrahieren und nach t differenzieren, erhalten wir tatsächlich i
dC I = (E0 + A)C I = E I C I . dt
(9.8)
Und wenn wir die Summe aus (9.2) und (9.3) bilden, erhalten wir i
dC II = (E0 − A)C II = E II C II . dt
(9.9)
Wenn wir | I � und | II � als Basiszustände benutzen, hat die Hamilton-Matrix die einfache Form HI,I = E I ,
HI,II = 0 ,
HII,I = 0 ,
HII,II = E II .
Beachten Sie, dass die Gleichungen (9.8) und (9.9) jeweils so aussehen wie das, was wir in Abschnitt 8.6 als Gleichung für ein System mit einem Zustand hatten. Sie haben eine einfache exponentielle Zeitabhängigkeit, die einer bestimmten Energie entspricht. Im Verlauf der Zeit verhalten sich die Amplituden für die einzelnen Zustände unabhängig voneinander. Die beiden stationären Zustände | ψI � und | ψII �, die wir oben gefunden haben, sind natürlich Lösungen der Gleichungen (9.8) bzw. (9.9). Für den Zustand | ψI � (für den C1 = −C2 ist) gilt C I = e−(i/)(E0 +A)t ,
C II = 0 .
(9.10)
Und für den Zustand | ψII � (für den C1 = C2 ist) gilt CI = 0 ,
C II = e−(i/)(E0 −A)t .
(9.11)
Denken Sie daran, dass die Amplituden in (9.10) C I = � I | ψI �
und C II = � II | ψI �
sind. Daher bedeutet die erste Gleichung in (9.10) dasselbe wie | ψI � = | I � e−(i/)(E0 +A)t . Das heißt, der Zustandsvektor des stationären Zustands | ψI � ist derselbe wie der Zustandsvektor des Basiszustandes | I � bis auf den der Energie des Zustands entsprechenden Exponentialfaktor. Tatsächlich ist bei t = 0 | ψI � = | I � ; der Zustand | I � hat dieselbe physikalische Konfiguration wie der stationäre Zustand mit der Energie E0 + A. Entsprechend ergibt sich für den zweiten stationären Zustand | ψII � = | II � e−(i/)(E0 −A)t . Der Zustand | II � ist gerade der stationäre Zustand mit der Energie E0 − A bei t = 0. Damit haben unsere beiden neuen Basiszustände | I � und | II � physikalisch die Form von Zuständen
160
9 Der Ammoniak-Maser
mit bestimmter Energie, wobei der exponentielle Zeitfaktor herausgenommen ist, sodass sie zeitunabhängige Basiszustände sein können. (Im Folgenden werden wir es bequem finden, nicht immer zwischen den stationären Zuständen | ψI � und | ψII � und ihren Basiszuständen | I � und | II � zu unterscheiden, da sie sich nur um die offensichtlichen Zeitfaktoren unterscheiden.) Kurz zusammengefasst: Die Zustandsvektoren | I � und | II � bilden ein Paar von Basisvektoren, die zur Beschreibung der Zustände mit bestimmter Energie des Ammoniakmoleküls geeignet sind. Sie sind mit unseren ursprünglichen Basisvektoren verknüpft durch 1 |I� = √ |1�−|2� 2
und
1 | II � = √ | 1 � + | 2 � . 2
(9.12)
Die Amplituden, in | I � und | II � zu sein, sind mit C1 und C2 verknüpft durch 1 C I = √ C1 − C2 2
1 und C II = √ C1 + C2 . 2
(9.13)
Jeder Zustand kann durch eine Linearkombination von | 1 � und | 2 � – mit den Koeffizienten C1 und C2 – oder durch eine Linearkombination der Basiszustände mit bestimmter Energie | I � und | II � – mit den Koeffizienten C I und C II – dargestellt werden. Damit ist | Φ � = | 1 � C1 + | 2 � C2 oder | Φ � = | I � C I + | II � C II . Die zweite Form gibt uns die Amplituden, den Zustand | Φ � in einem Zustand mit der Energie E I = E0 + A bzw. in einem Zustand mit der Energie E II = E0 − A zu finden.
9.2
Das Molekül in einem elektrostatischen Feld
Wenn das Ammoniakmolekül in einem der beiden Zustände mit bestimmter Energie ist und wir es mit einer Frequenz ω stören, für die ω = E I − E II = 2A gilt, kann das System von einem Zustand in den anderen übergehen. Oder wenn es im höheren Energiezustand ist, kann es spontan in den niedrigeren Zustand überwechseln und dabei ein Photon emittieren. Um aber solche Übergänge anzuregen, ist eine physikalische Verbindung zu den Zuständen erforderlich – eine Möglichkeit, das System zu stören. Es muss eine äußere Vorrichtung geben, um die Zustände zu beeinflussen, wie magnetische oder elektrische Felder. In diesem speziellen Fall sind diese Zustände empfindlich gegenüber einem elektrischen Feld. Wir wollen daher als Nächstes das Problem des Verhaltens des Ammoniakmoleküls in einem äußeren elektrischen Feld betrachten. Um das Verhalten in einem elektrischen Feld zu diskutieren, wollen wir lieber auf das ursprüngliche Basissystem | 1 � und | 2 � zurückgreifen, anstatt | I � und | II � zu verwenden. Nehmen wir an, dass ein elektrisches Feld senkrecht zur Ebene der Wasserstoffatome angelegt ist. Lassen wir zunächst die Möglichkeit außer Acht, dass der Stickstoff seine Position wechselt. Ist dann die Energie dieses Moleküls für die beiden Positionen des Stickstoffatoms gleich? Im Allgemeinen nicht. Die Elektronen sind bestrebt, näher am Stickstoff als an den Wasserstoffkernen zu sitzen,
9.2 Das Molekül in einem elektrostatischen Feld
161
sodass die Wasserstoffatome leicht positiv sind. Der genaue Betrag hängt von den Einzelheiten der Elektronenverteilung ab. Es ist ein kompliziertes Problem, diese Verteilung genau zu berechnen, aber das Endergebnis ist in jedem Fall, dass das Ammoniakmolekül ein elektrisches Dipolmoment hat, wie in Abbildung 9.1 skizziert. Wir können unsere Untersuchung fortsetzen, ohne im Einzelnen die Richtung oder den Betrag der Ladungsverschiebung zu kennen. Im Einklang mit der üblichen Schreibweise bezeichnen wir das elektrische Dipolmoment mit μ und nehmen an, dass seine Richtung vom Stickstoffatom wegzeigt und senkrecht zur Ebene der Wasserstoffatome steht. Wenn nun der Stickstoff von einer Seite zur anderen wechselt, wird sich zwar der Schwerpunkt nicht bewegen, aber das elektrische Dipolmoment wird umklappen. Dieses Moment ist die Ursache dafür, dass die Energie in einem elektrischen Feld E von der molekularen Orientierung abhängt.2 Mit der oben getroffenen Annahme wird die potentielle Energie höher sein, wenn das Stickstoffatom in Feldrichtung zeigt, und niedriger, wenn es in die entgegengesetzte Richtung zeigt; der Abstand dieser beiden Energien ist 2μE. In der bisherigen Diskussion haben wir Werte von E0 und A angenommen, ohne zu wissen, wie sie zu berechnen sind. Nach der korrekten physikalischen Theorie sollte es möglich sein, diese Konstanten aus den Orten und Bewegungen von allen Kernen und Elektronen zu berechnen. Aber niemand hat das je getan. Dieses System umfasst zehn Elektronen und vier Kerne, und das ist nun mal ein zu kompliziertes Problem. Übrigens gibt es niemanden, der viel mehr über dieses Molekül weiß als wir. Alles, was man sagen kann, ist, dass bei Vorhandensein eines elektrischen Feldes die Energie der beiden Zustände verschieden ist, wobei der Unterschied proportional zum elektrischen Feld ist. Wir haben den Proportionalitätsfaktors 2μ genannt, aber sein Wert muss experimentell bestimmt werden. Wir können auch sagen, dass das Molekül die Amplitude A hat, auf die andere Seite zu wechseln, aber auch diesen Wert wird man experimentell bestimmen müssen. Niemand kann die genauen theoretischen Werte von μ und A angeben, weil die Berechnungen zu schwierig sind, um sie exakt durchzuführen. Für das Ammoniakmolekül in einem elektrischen Feld muss unsere Beschreibung geändert werden. Wenn wir die Amplitude außer Acht lassen, dass das Molekül von einer Konfiguration in die andere wechselt, erwarten wir, dass die Energien der beiden Zustände | 1 � und | 2 � gleich (E0 ± μE) sind. Dem Verfahren des letzten Kapitels folgend, setzen wir H11 = E0 + μE ,
H22 = E0 − μE .
(9.14)
Wir wollen außerdem annehmen, dass bei den interessierenden elektrischen Feldern das Feld die Geometrie des Moleküls nicht merklich beeinflusst und daher auch nicht die Amplitude, dass der Stickstoff von der einen Position in die andere springt. Wir können dann annehmen, dass sich H12 und H21 nicht ändern, sodass H12 = H21 = −A .
(9.15)
Wir müssen nun die hamiltonschen Gleichungen (8.43) mit diesen neuen Werten von Hi j lösen. Wir könnten sie genau so lösen wie vorher, aber da wir des öfteren die Lösungen für Zweizustandssysteme haben möchten, wollen wir die Gleichungen ein für allemal für den allgemeinen 2
Wir müssen leider eine neue Notation einführen. Da wir p und E für Impuls und Energie verwendet haben, wollen wir sie nicht noch einmal für das Dipolmoment und das elektrische Feld benutzen. Merken Sie sich, dass in diesem Abschnitt μ das elektrische Dipolmoment ist.
162
9 Der Ammoniak-Maser
Fall beliebiger Hi j lösen – wir nehmen nur an, dass sie sich nicht zeitlich ändern. Wir suchen also die allgemeine Lösung für das Paar der hamiltonschen Gleichungen i
dC1 = H11C1 + H12 C2 , dt
(9.16)
i
dC2 = H21C1 + H22 C2 . dt
(9.17)
Da dies lineare Differentialgleichungen mit konstanten Koeffizienten sind, können wir immer Lösungen finden, die Exponentialfunktionen der abhängigen Variablen t sind. Wir wollen zuerst eine Lösung suchen, in der C1 und C2 beide dieselbe Zeitabhängigkeit haben. Wir können folgende Ansatzfunktionen benutzen C1 = a1 e−iωt ,
C2 = a2 e−iωt .
Da eine solche Lösung einem Zustand mit der Energie E = ω entspricht, können wir ebenso gut sofort schreiben C1 = a1 e−(i/)Et ,
(9.18)
C2 = a2 e−(i/)Et ,
(9.19)
wobei E noch unbekannt und so zu bestimmen ist, dass die Differentialgleichungen (9.16) und (9.17) erfüllt sind. Wenn wir C1 und C2 aus (9.18) und (9.19) in die Differentialgleichungen (9.16) und (9.17) einsetzen, ergeben die Ableitungen −iE/ mal C1 bzw. C2 , sodass die linken Seiten EC1 und EC2 werden. Wenn wir die gemeinsamen Exponentialfaktoren herauskürzen, erhalten wir Ea1 = H11 a1 + H12 a2 ,
Ea2 = H21 a1 + H22 a2 .
Oder wir erhalten durch Umordnung der Terme (E − H11 )a1 − H12 a2 = 0 ,
−H21 a1 + (E − H22 )a2 = 0 .
(9.20) (9.21)
Bei einem solchen System von homogenen algebraischen Gleichungen gibt es nur dann nichtverschwindende Lösungen für a1 und a2 , wenn die Determinante der Koeffizientenmatrix von a1 und a2 null ist, das heißt, wenn ⎞ ⎛ ⎜⎜⎜E − H11 − H12 ⎟⎟⎟ ⎟⎠ = 0 . ⎜ det ⎝ (9.22) − H21 E − H22 Wenn es jedoch nur zwei Gleichungen und zwei Unbekannte gibt, brauchen wir eine so raffinierte Idee nicht. Die beiden Gleichungen (9.20) und (9.21) liefern jede ein Verhältnis der beiden Koeffizienten a1 und a2 , und diese beiden Verhältnisse müssen gleich sein. Aus (9.20) ergibt sich a1 H12 = a2 E − H11
(9.23)
9.2 Das Molekül in einem elektrostatischen Feld
163
und aus (9.21) E − H22 a1 = . a2 H21
(9.24)
Wenn wir diese beiden Verhältnisse gleichsetzen, sehen wir, dass E die Gleichung (E − H11 )(E − H22 ) − H12 H21 = 0 erfüllen muss. Das ist dasselbe Ergebnis, das wir durch Lösen von Gleichung (9.22) erhalten würden. Auf jede Art erhalten wir eine quadratische Gleichung für E, die zwei Lösungen hat: H11 + H22 (H11 − H22 )2 E= ± + H12 H21 . (9.25) 2 4 Es gibt zwei mögliche Werte für die Energie E. Beachten Sie, dass beide Lösungen reelle ∗ Zahlen für die Energie ergeben, weil H11 und H22 reell sind und H12 H21 gleich H12 H12 = |H12 |2 ist, was reell und positiv ist. Wir benutzen dieselbe Konvention wie vorher und bezeichnen die höhere Energie mit E I und die niedrigere Energie mit E II . Wir erhalten H11 + H22 + EI = 2 E II =
H11 + H22 − 2
(H11 − H22 )2 + H12 H21 , 4
(9.26)
(H11 − H22 )2 + H12 H21 . 4
(9.27)
Wenn wir jede dieser beiden Energien getrennt in (9.18) und (9.19) einsetzen, erhalten wir die Amplituden für die beiden stationären Zustände (die Zustände mit bestimmter Energie). Wenn keine äußeren Störungen vorliegen, wird ein System, das ursprünglich in einem dieser Zustände ist, darin für immer bleiben – nur seine Phase ändert sich. Wir können unsere Ergebnisse an zwei Spezialfällen überprüfen. Wenn H12 = H21 = 0 ist, folgt E I = H11 und E II = H22 . Dies ist sicherlich richtig, weil dann die beiden Gleichungen (9.16) und (9.17) nicht gekoppelt sind und jede einen Zustand der Energie H11 bzw. H22 darstellt. Wenn wir als Nächstes H11 = H22 = E0 und H21 = H12 = −A setzen, erhalten wir die Lösung, die wir vorher gefunden hatten: E I = E0 + A
und
E II = E0 − A .
Im allgemeinen Fall beziehen sich die beiden Lösungen E I und E II auf zwei verschiedene Zustände. Wir bezeichnen diese wieder mit | ψI � = | I � e−(i/)EI t
und
| ψII � = | II � e−(i/)EII t .
Für diese Zustände sind C1 und C2 durch (9.18) und (9.19) gegeben, wobei die Koeffizienten a1 und a2 noch bestimmt werden müssen. Ihr Verhältnis wird entweder durch (9.23) oder durch (9.24) bestimmt. Außerdem müssen sie einer weiteren Bedingung genügen. Wenn von dem System bekannt ist, dass es in einem der stationären Zustände ist, dann muss die Summe der
164
9 Der Ammoniak-Maser
Wahrscheinlichkeiten, dass es in | 1 � oder | 2 � gefunden wird, gleich eins sein. Es muss dann gelten |C1 |2 + |C2 |2 = 1
(9.28)
|a1 |2 + |a2 |2 = 1 .
(9.29)
oder, was das Gleiche bedeutet,
Durch diese Bedingung sind a1 und a2 noch nicht eindeutig bestimmt, denn sie haben noch eine frei wählbare Phase, d. h. einen Faktor wie eiδ . Obwohl für die a’s allgemeine Lösungen hingeschrieben werden können3, ist es gewöhnlich bequemer, sie für jeden einzelnen Fall herzuleiten. Kommen wir jetzt auf unser spezielles Beispiel zurück, das Ammoniakmolekül im elektrischen Feld. Unter Benutzung der in (9.14) und (9.15) angegebenen Werte für H11 , H22 und H12 erhalten wir für die Energien der beiden stationären Zustände E I = E0 + A2 + μ2 E2 , E II = E0 − A2 + μ2 E2 . (9.30) Diese beiden Energien sind in Abbildung 9.2 als Funktionen der elektrischen Feldstärke E skizziert. Wenn das elektrische Feld null ist, sind sie natürlich E0 ±A. Wenn ein elektrisches Feld E
E0 +
E0 + A
A2 + μ2 E2
E0 + μE
I
E0 E0 − A
1
2
3
4 μE/A
II
E0 −
A2 + μ2 E2
E0 − μE
Abb. 9.2: Energieniveaus des Ammoniakmoleküls in einem elektrischen Feld.
angelegt wird, wächst die Aufspaltung zwischen den beiden Niveaus. Die Aufspaltung wächst zuerst langsam mit E, wird aber schließlich proportional zu E. (Die Kurve ist eine Hyperbel.) Bei sehr starken Feldern sind die Energien einfach 3
E I = E0 + μ E = H11 ,
E II = E0 − μ E = H22 .
Zum Beispiel ist Folgendes eine annehmbare Lösung, wie Sie leicht verifizieren können H12 E−H11 , a2 = . a1 = [(E−H11 )2 +H12 H21 ]1/2 [(E−H11 )2 +H12 H21 ]1/2
(9.31)
9.2 Das Molekül in einem elektrostatischen Feld
165
Die Tatsache, dass es für den Stickstoff eine Amplitude gibt, die Position zu wechseln, hat wenig Wirkung, wenn die beiden Positionen sehr unterschiedliche Energien haben. Dies ist ein interessanter Punkt, auf den wir später zurückkommen werden. Wir sind nun in der Lage, die Funktionsweise des Ammoniak-Masers zu verstehen. Sie beruht auf folgendem Prinzip. Zuerst brauchen wir eine Methode, um die Moleküle im Zustand | I � von denen im Zustand | II � zu trennen.4 Dann lassen wir die Moleküle, die im höheren Energiezustand | I � sind, durch einen Hohlraum gehen, der eine Resonanzfrequenz von 24 000 Megahertz hat. Die Moleküle können Energie an den Hohlraum abgeben – auf eine Art, die wir später besprechen werden – und den Hohlraum im Zustand | II � verlassen. Jedes Molekül, das einen solchen Übergang ausführt, gibt die Energie E = E I − E II an den Hohlraum ab. Die Energie der Moleküle erscheint als elektrische Energie im Hohlraum. Wie können wir die beiden molekularen Zustände trennen? Eine denkbare Methode besteht darin, das Ammoniakgas aus einer kleinen Düse ausströmen und durch ein Spaltpaar gehen zu lassen, um einen engen Strahl zu erzeugen (siehe Abbildung 9.3). II NH3
Spalte
I wachsendes E2
Abb. 9.3: Der Ammoniakstrahl kann durch ein elektrisches Feld, in dem E2 einen Gradienten senkrecht zum Strahl hat, aufgespalten werden.
Der Strahl wird dann durch ein Gebiet geschickt, in dem ein starkes transversales elektrisches Feld herrscht. Die felderzeugenden Elektroden sind so geformt, dass sich das Feld quer zum Strahl schnell ändert. Dann wird das Quadrat des elektrischen Feldes E · E einen starken Gradienten senkrecht zum Strahl haben. Nun hat ein Molekül im Zustand | I � eine Energie, die mit E2 anwächst, und daher wird dieser Teil des Strahls zum Gebiet mit niedrigerem E2 abgelenkt. Ein Molekül im Zustand | II � wird dagegen zum Gebiet mit höherem E2 abgelenkt, da seine Energie abnimmt, wenn E2 wächst.
Übrigens ist bei den elektrischen Feldern, die im Labor erzeugt werden können, die Energie μE immer viel kleiner als A. In solchen Fällen kann die Quadratwurzel in (9.30) angenähert werden durch 1 μ2 E2 A· 1+ . (9.32) 2 A2
Daher sind die Energieniveaus für alle praktischen Zwecke μ2 E2 2A μ2 E2 , E II = E0 − A − 2A E I = E0 + A +
4
(9.33) (9.34)
Von nun an wollen wir | I � und | II � anstatt | ψI � und | ψII � schreiben. Sie müssen sich merken, dass die eigentlichen Zustände | ψI � und | ψII � die Energiebasiszustände multipliziert mit dem entsprechenden Exponentialfaktor sind.
166
9 Der Ammoniak-Maser
und die Energie ändert sich näherungsweise linear mit E2 . Die Kraft auf die Moleküle ist dann F=±
μ2 ∇E2 . 2A
(9.35)
Viele Moleküle haben in einem elektrischen Feld eine Energie, die proportional zu E2 ist. Der Koeffizient ist die Polarisierbarkeit des Moleküls. Ammoniak hat wegen des kleinen Wertes von A im Nenner eine ungewöhnlich hohe Polarisierbarkeit. Deshalb sind Ammoniakmoleküle gegenüber einem elektrischen Feld außerordentlich empfindlich. (Wie groß würden Sie die Dielektrizitätskonstante von NH3 -Gas schätzen?)
9.3
Übergänge in einem zeitabhängigen Feld
Im Ammoniak-Maser wird der Strahl mit Molekülen im Zustand | I � und der Energie E I durch einen Hohlraumresonator geschickt (siehe Abbildung 9.4). Der andere Strahl wird beiseite gelassen. In dem Hohlraum ist ein zeitlich veränderliches elektrisches Feld. Daher müssen wir als nächstes Problem das Verhalten eines Ammoniakmoleküls in einem zeitlich veränderlichen elektrischen Feld diskutieren. Wir haben jetzt ein völlig andersartiges Problem – eins mit einer zeitabhängigen Hamilton-Matrix. Da Hi j von E abhängt, ändern sich die Hi j mit der Zeit, und wir müssen das Verhalten des Systems unter dieser Bedingung bestimmen. II
Frequenz ω0 im Resonanzraum alle II
I 2
∇E v
elektrisches Feld E vT
Abb. 9.4: Schematisches Diagramm des Ammoniak-Masers.
Wir beginnen, indem wir die zu lösenden Gleichungen aufschreiben: dC1 = (E0 + μE)C1 − AC2 , dt dC2 = −AC1 + (E0 − μE)C2 . i dt i
(9.36)
Um konkret zu sein, wollen wir annehmen, dass sich das elektrische Feld sinusförmig ändert. Dann können wir schreiben E = 2E0 cos ωt = E0 (eiωt + e−iωt ) .
(9.37)
In der Praxis wird die Frequenz ω fast genau gleich der Resonanzfrequenz des molekularen Übergangs ω0 = 2A/ sein, aber vorläufig wollen wir die Diskussion allgemein halten und
9.3 Übergänge in einem zeitabhängigen Feld
167
annehmen, dass sie jeden beliebigen Wert annehmen kann. Die beste Methode, unsere Gleichungen zu lösen, besteht darin, aus C1 und C2 Linearkombinationen zu bilden, wie√wir es vorher gemacht haben. Wir addieren daher die beiden Gleichungen, dividieren durch 2 und benutzen die durch (9.13) gegebene Definition von C I und C II . Wir erhalten i
dC II = (E0 − A) C II + μEC I . dt
(9.38)
Sie werden bemerken, dass dies dasselbe ist wie (9.9) mit einem zusätzlichen Term infolge des elektrischen Feldes. In analoger Weise erhalten wir, wenn wir die beiden Gleichungen (9.36) substrahieren, i
dC I = (E0 + A)C I + μEC II . dt
(9.39)
Es stellt sich nun die Frage, wie diese Gleichungen zu lösen sind. Sie sind komplizierter als unser früheres System, weil E von t abhängt; und tatsächlich kann die Lösung für ein allgemeines E(t) nicht in elementaren Funktionen ausgedrückt werden. Wir können jedoch eine gute Näherung bekommen, solange das elektrische Feld schwach ist. Zunächst wollen wir schreiben C I = γI e−i(E0 +A)t/ = γI e−i(EI )t/ , C II = γII e−i(E0 −A)t/ = γII e−i(EII )t/ .
(9.40)
Ohne elektrisches Feld wäre diese Lösung richtig, wobei γI und γII einfach als zwei komplexe Konstanten zu wählen sind. Da die Wahrscheinlichkeit, im Zustand | I � zu sein, das Absolutquadrat von C I ist, und die Wahrscheinlichkeit, im Zustand | II � zu sein, das Absolutquadrat von C II , wird die Wahrscheinlichkeit, im Zustand | I � oder im Zustand | II � zu sein, tatsächlich gerade |γI |2 bzw. |γII |2 . Wenn das System zum Beispiel im Zustand | II � startet, sodass γI null und |γII |2 eins ist, wird dieser Zustand für immer bestehen bleiben. Es gibt keine Wahrscheinlichkeit, dass das Molekül, wenn es ursprünglich im Zustand | II � ist, jemals in den Zustand | I � gelangt. Der Grund, warum wir unsere Gleichungen in der Form (9.40) geschrieben haben, besteht darin, dass für Werte von μE, die klein sind im Vergleich zu A, die Lösungen noch auf diese Art geschrieben werden können. Allerdings werden dann γI und γII zu langsam variierenden Funktionen der Zeit – wobei wir mit „langsam variierend“ meinen, dass es langsam im Vergleich zu den Exponentialfunktionen ist. Das ist der Trick. Wir benutzen die Tatsache, dass γI und γII langsam variieren, um eine Näherungslösung zu erhalten. Wir setzen nun den in (9.40) gegebenen Ausdruck für C I in die Differentialgleichung (9.39) ein, müssen aber beachten, dass γI ebenfalls eine Funktion von t ist. Wir erhalten für die linke Seite der Gleichung i
dC I dγI −iEI t/ . = E I γI e−iEI t/ + i e dt dt
Die Differentialgleichung wird zu dγI −(i/)EI t E I γI + i e = E I γI e−(i/)EI t + μEγII e−(i/)EII t . dt
(9.41)
168
9 Der Ammoniak-Maser
Entsprechend wird die Gleichung (9.38) zu dγII −(i/)EII t E II γII + i e = E II γII e−(i/)EII t + μEγI e−(i/)EI t . dt
(9.42)
Wie Sie sehen, haben wir nun auf beiden Seiten von jeder Gleichung identische Ausdrücke. Wir streichen diese Ausdrücke und multiplizieren außerdem die erste Gleichung mit e+iEI t/ und die zweite mit e+iEII t/ . Wenn wir uns erinnern, dass (E I − E II ) = 2A = ω0 ist, erhalten wir schließlich dγI = μE(t)eiω0 t γII , dt dγII = μE(t)e−iω0 t γI . i dt i
(9.43)
Jetzt haben wir ein offensichtlich einfaches Paar von Gleichungen – und sie sind natürlich noch exakt. Die Ableitung der einen Variablen ist eine Funktion der Zeit, μE(t)eiω0 t , multipliziert mit der zweiten Variablen; die Ableitung der zweiten ist eine ähnliche Funktion der Zeit multipliziert mit der ersten Variablen. Diese einfachen Gleichungen können zwar nicht allgemein gelöst werden, doch wir wollen sie für einige Spezialfälle lösen. Uns interessiert, zumindest im Moment, nur der Fall eines oszillierenden elektrischen Feldes. Wenn wir für E(t) den durch (9.37) gegebenen Ausdruck einsetzen, dann wird aus den Gleichungen für γI und γII dγI = μE0 [ei(ω+ω0 )t + e−i(ω−ω0 )t ] γII , dt dγII = μE0 [ei(ω−ω0 )t + e−i(ω+ω0 )t ] γI . i dt i
(9.44)
Wenn nun E hinreichend klein ist, dann sind auch die Änderungsgeschwindigkeiten von γI und γII klein. Die beiden γ’s werden sich mit t nicht sehr stark ändern, jedenfalls nicht im Vergleich zu den schnellen Änderungen infolge der Exponentialausdrücke. Diese Exponentialausdrücke haben reelle und imaginäre Anteile, die mit der Frequenz ω + ω0 bzw. ω − ω0 oszillieren. Die Terme mit ω + ω0 oszillieren sehr schnell um einen Mittelwert von null und tragen daher im Mittel nicht sehr viel zur Änderungsgeschwindigkeit von γ bei. Es ist daher eine akzeptable Näherung, wenn wir diese Ausdrücke durch ihren Mittelwert, nämlich durch null, ersetzen. Wir lassen sie also einfach weg und nehmen als Näherung: dγI = μE0 e−i(ω−ω0 )t γII , dt dγII = μE0 ei(ω−ω0 )t γI . i dt i
(9.45)
Auch die verbleibenden Ausdrücke, deren Exponenten proportional zu (ω − ω0 ) sind, werden sich schnell ändern, wenn nicht ω dicht bei ω0 ist. Nur dann wird die rechte Seite langsam genug variieren, damit sich irgendein nennenswerter Betrag ansammelt, wenn wir die Gleichungen über t integrieren. Oder anders formuliert: Bei schwachem elektrischen Feld sind nur diejenigen Frequenzen von Bedeutung, die nahe bei ω0 liegen.
9.4 Übergänge bei Resonanz
169
Mit der Näherung, die uns zu (9.45) gebracht hat, können die Gleichungen exakt gelöst werden, aber diese Arbeit ist etwas umständlich. Wir wollen sie also für später aufheben, wenn wir ein anderes Problem vom selben Typ aufgreifen. Jetzt wollen wir sie nur näherungsweise lösen, genauer gesagt: Wir suchen nach einer exakten Lösung für den Fall der vollkommenen Resonanz, ω = ω0 , die in der Nähe der Resonanz eine gute Näherungslösung ist.
9.4
Übergänge bei Resonanz
Nehmen wir als Erstes den Fall der vollkommenen Resonanz. Wenn wir ω = ω0 annehmen, werden die Exponentialfunktionen in beiden Gleichungen von (9.45) gleich eins und wir erhalten dγI iμE0 =− γII , dt
iμE0 dγII =− γI dt
(9.46)
Wenn wir zuerst γI und dann γII aus diesen Gleichungen eliminieren, sehen wir, dass beide die Differentialgleichung einer einfachen harmonischen Bewegung befriedigen: μE 2 d2 γI,II 0 = − γI,II . dt2
(9.47)
Die allgemeinen Lösungen dieser Gleichungen können aus dem Sinus und Kosinus gebildet werden. Wie Sie leicht verifizieren können, sind die folgenden Gleichungen eine Lösung: μE0 μE0 γI = a cos t + b sin t, (9.48) μE0 μE0 γII = ib cos t − ia sin t, wobei a und b Konstanten sind, die an die konkrete physikalische Situation angepasst werden müssen. Nehmen wir zum Beispiel an, dass bei t = 0 unser Molekülsystem im höheren Energiezustand | I � war, was – nach (9.40) – bedeutet, dass γI = 1 und γII = 0 bei t = 0 ist. Für diese Situation muss a = 1 und b = 0 gelten. Die Wahrscheinlichkeit, dass das Molekül zu einem späteren Zeitpunkt t noch immer im Zustand | I � ist, ist das Absolutquadrat von γI oder μE0 t. (9.49) PI = |γI |2 = cos2 Analog dazu ist die Wahrscheinlichkeit, dass das Molekül zum Zeitpunkt t im Zustand | II � sein wird, gegeben durch das Absolutquadrat von γII , 2 2 μE0 t. (9.50) PII = |γII | = sin Solange E klein ist und der Resonanzfall vorliegt, sind die Wahrscheinlichkeiten durch einfache oszillierende Funktionen gegeben. Die Wahrscheinlichkeit, im Zustand | I � zu sein, fällt
170 P 1
9 Der Ammoniak-Maser
PI
PII
1
2
t in Einheiten von π/2μE0
t
Abb. 9.5: Wahrscheinlichkeiten für die zwei Zustände des Ammoniakmoleküls in einem sinusförmigen Feld.
von eins auf null und steigt dann wieder auf eins, während die Wahrscheinlichkeit, im Zustand | II � zu sein, von null auf eins steigt und dann wieder auf null fällt. Die zeitliche Änderung der beiden Wahrscheinlichkeiten ist in Abbildung 9.5 gezeigt. Die Summe der beiden Wahrscheinlichkeiten ist natürlich immer gleich eins – in irgendeinem Zustand ist das Molekül immer! Nehmen wir an, dass das Molekül die Zeit T braucht, um durch den Hohlraum zu gehen. Wenn wir den Hohlraum so lang machen, dass μE0 T/ = π/2 ist, dann wird ein Molekül, das im Zustand | I � hineingeht, ihn sicherlich im Zustand | II � verlassen. Wenn es in den Hohlraum im höheren Zustand hineingeht, wird es ihn im niedrigeren Zustand verlassen. Mit anderen Worten, seine Energie hat abgenommen und der Energieverlust kann sonst nirgendwo hingehen als in die Vorrichtung, die das Feld erzeugt. Die Details, wie die Energie des Moleküls den Schwingungen des Hohlraums zugeführt wird, sind nicht einfach; wir müssen diese Details jedoch nicht untersuchen, weil wir das Prinzip der Energieerhaltung benutzen können. (Wir könnten sie untersuchen, wenn wir müssten, aber dann müssten wir uns zusätzlich zur Quantenmechanik des Atoms mit der Quantenmechanik des Feldes im Hohlraum befassen.) Zusammengefasst: Das Molekül geht in den Hohlraum hinein, das Hohlraumfeld, das genau mit der richtigen Frequenz schwingt, induziert Übergänge vom höheren in den niedrigeren Zustand und die freigesetzte Energie wird dem oszillierenden Feld zugeführt. In einem arbeitenden Maser liefern die Moleküle genug Energie, um die Hohlraumschwingungen aufrecht zu erhalten – dabei liefern sie nicht nur genug Energie, um die Hohlraumverluste auszugleichen, sondern sie liefern sogar kleine Beträge von überschüssiger Energie, die dem Hohlraum entnommen werden kann. Damit wird die molekulare Energie in die Energie eines äußeren elektromagnetischen Feldes umgewandelt. Bedenken Sie, dass der Strahl, bevor er in den Hohlraum hineingeht, ein Filter passiert, das den Strahl aufteilt, sodass nur der höhere Zustand in den Hohlraum hineingeht. Man kann leicht zeigen, dass der Prozess in umgekehrter Richtung abläuft und Energie aus dem Hohlraum entnimmt, wenn wir mit Molekülen im niedrigeren Zustand beginnen. Wenn der Strahl ungefiltert in den Hohlraum hineingeht, werden genauso viele Moleküle Energie entnehmen wie Energie zuführen, sodass nicht viel geschehen wird. In der Praxis ist es natürlich nicht nötig, μE0 T/ genau gleich π/2 zu machen. Für jeden anderen Wert (außer einem genau ganzzahligen Vielfachen von π) gibt es eine Wahrscheinlichkeit für Übergänge vom Zustand | I � in den Zustand | II �. Für andere Werte arbeitet die Vorrichtung jedoch nicht 100-prozentig effizient; viele der Moleküle, die den Hohlraum verlassen, hätten an den Hohlraum Energie abgeben können, haben es aber nicht getan.
9.5 Übergänge in der Nähe der Resonanz
171
Im realen Betrieb haben nicht alle Moleküle die gleiche Geschwindigkeit; ihre Geschwindigkeiten gehorchen einer Art Maxwell-Verteilung. Dies bedeutet, dass die idealen Zeitabschnitte für verschiedene Moleküle unterschiedlich sind und es unmöglich ist, 100-prozentige Effizienz für alle Moleküle zu erreichen. Zusätzlich gibt es noch eine andere Komplikation, die man leicht berücksichtigen kann, aber wir möchten uns in diesem Stadium nicht damit befassen. Sie erinnern sich, dass sich das elektrische Feld in einem Hohlraum gewöhnlich von Ort zu Ort quer durch den Hohlraum ändert. Während sich das Molekül durch den Hohlraum bewegt, ändert sich folglich das elektrische Feld am Ort des Moleküls auf eine Art, die komplizierter ist als die einfache zeitliche Sinusschwingung, die wir angenommen haben. Man müsste offenbar eine kompliziertere Integration ausführen, um das Problem exakt zu behandeln, aber der allgemeine Grundgedanke wäre noch der gleiche. Es gibt andere Methoden, Maser herzustellen. Statt die Atome im Zustand | I � von denen im Zustand | II � durch einen Stern-Gerlach-Apparat zu trennen, können die Atome auch schon im Hohlraum (als Gas oder fester Körper) sein, und man kann die Atome auf irgendeine Weise vom Zustand | II � in den Zustand | I � bringen. Eine solche Methode benutzt man beim so genannten Dreizustands-Maser. Dort benutzt man atomare Systeme, die drei Energieniveaus haben (siehe Abbildung 9.6), mit folgenden besonderen Eigenschaften. Das System absorbiert Strahlung (beispielsweise Licht) der Frequenz ω1 und geht vom niedrigsten Energieniveau E II zu einem höheren Energieniveau E � und sendet dann schnell Photonen der Frequenz ω2 aus und geht in den Zustand | I � mit der Energie E I . Der Zustand | I � hat eine lange Lebensdauer, sodass seine Besetzung verstärkt werden kann. Die Bedingungen sind geeignet für den Maser-Betrieb zwischen den Zuständen | I � und | II �. Obwohl eine solche Vorrichtung „Dreizustands-Maser“ heißt, funktioniert der Maser-Betrieb in Wirklichkeit wie beim Zweizustandssystem, das wir beschrieben haben. E
E� ω1
ω2 EI ω0 EII
Abb. 9.6: Die Energieniveaus eines „Dreizustands-Masers“.
Ein Laser (Light Amplification by Stimulated Emission of Radiation = Lichtverstärkung durch induzierte Strahlungsemission) ist einfach ein Maser, der im optischen Frequenzbereich arbeitet. Der „Hohlraum“ für einen Laser besteht gewöhnlich aus zwei ebenen Spiegeln, zwischen denen stehende Wellen erzeugt werden.
9.5
Übergänge in der Nähe der Resonanz
Zum Schluss möchten wir herausfinden, wie sich die Zustände ändern, wenn die Hohlraumfrequenz fast, aber nicht genau gleich ω0 ist. Dieses Problem könnten wir exakt lösen, aber anstatt dies zu versuchen, wollen wir den wichtigen Fall betrachten, dass das elektrische Feld schwach
172
9 Der Ammoniak-Maser
ist und dass auch die Zeitperiode T klein ist, sodass μE0 T/ viel kleiner als eins ist. Dann ist sogar im Fall der vollkommenen Resonanz, den wir gerade behandelt haben, die Wahrscheinlichkeit für einen Übergang gering. Nehmen wir an, dass wir wieder mit γI = 1 und γII = 0 beginnen. Während der Zeit T würden wir erwarten, dass γI fast gleich eins bleibt und γII im Vergleich zu eins sehr klein ist. Dann ist das Problem sehr einfach. Wir können γII aus der zweiten Gleichung in (9.45) berechnen, indem wir γI gleich eins setzen und von t = 0 bis t = T integrieren. Wir erhalten γII =
μE0 1 − ei(ω−ω0 )T . ω − ω0
(9.51)
Dieses γII gibt zusammen mit (9.40) die Amplitude für einen Übergang aus dem Zustand | I � in den Zustand | II � innerhalb des Zeitintervalls T an. Die Wahrscheinlichkeit P(I → II) für den Übergang ist |γII |2 oder P(I → II) = |γII |2 =
μE T 2 sin2 [(ω − ω )T/2] 0 0 . [(ω − ω0 )T/2]2
(9.52)
Es ist interessant, diese Wahrscheinlichkeit für eine bestimmte Zeitdauer als Funktion der Frequenz des Hohlraums aufzutragen, um zu sehen, wie empfindlich sie gegenüber Frequenzen nahe der Resonanzfrequenz ω0 ist. Wir zeigen eine solche Darstellung von P(I → II) in Abbildung 9.7. (Die vertikale Skala ist durch Division durch den Wert der Wahrscheinlichkeit für ω = ω0 so eingerichtet, dass sich für den Scheitelpunkt der Wert 1 ergibt.) Eine ähnliche Kurve haben wir schon in der Beugungstheorie gesehen, Sie sollten also bereits mit ihr vertraut sein. Die Kurve fällt ziemlich steil bis auf null für (ω − ω0 ) = 2π/T ab und erreicht für große Frequenzabweichungen keine bedeutenden Höhen mehr. Der größte Teil der Fläche unter der Kurve liegt tatsächlich innerhalb des Bereiches ±π/T . Man kann zeigen5 , dass die Fläche unter der Kurve gerade 2π/T ist, was der Fläche des schraffierten Rechtecks entspricht, das in die Abbildung eingezeichnet ist.
PI→II (ω)/PI→II (ω0 )
1
1/2 π/T 2π/T 0
5
Unter Benutzung der Formel
ω0 ∞
−∞
(sin2 x/x2 ) dx = π.
ω
Abb. 9.7: Übergangswahrscheinlichkeit für das Ammoniakmolekül als Funktion der Frequenz.
9.6 Die Lichtabsorption
173
Schauen wir nun, was unsere Ergebnisse für einen realen Maser bedeuten. Wir nehmen an, dass das Ammoniakmolekül für eine angemessene Zeitdauer im Hohlraum ist, sagen wir für eine Millisekunde. Dann können wir für f0 = 24 000 MHz ausrechnen, dass die Wahrscheinlichkeit für einen Übergang bei einer Frequenzabweichung von ( f − f0 )/ f0 = 1/ f0 T auf null fällt, was einer Abweichung von 5 · 10−8 entspricht. Offenbar muss die Frequenz sehr nahe bei ω0 liegen, um eine signifikante Übergangswahrscheinlichkeit zu erreichen. Dieser Effekt ist die Grundlage für die hohe Genauigkeit von „Atomuhren“, die nach dem Maser-Prinzip arbeiten.
9.6
Die Lichtabsorption
Das oben beschriebene Verfahren lässt sich auf eine allgemeinere Situation als den AmmoniakMaser anwenden. Wir haben das Verhalten eines Moleküls unter dem Einfluss eines elektrischen Feldes behandelt, unabhängig davon, ob das Feld auf einen Hohlraum beschränkt ist oder nicht. Wir könnten ebenso einen „Lichtstrahl“ – im Frequenzbereich der Mikrowellen – auf das Molekül richten und nach der Wahrscheinlichkeit für Emission oder Absorption fragen. Unsere Gleichungen lassen sich auf diesen Fall genauso gut anwenden, aber schreiben wir sie noch einmal auf, ausgedrückt durch die Intensität der Strahlung anstatt durch die Stärke des elektrischen Feldes. Wenn wir die Intensität I als mittleren Energiefluss pro Flächeneinheit und Sekunde definieren, dann können wir nach Kapitel 27 von Band III schreiben I = �0 c2 | E × B|mittel =
1 �0 c2 | E × B|max = 2�0 cE20 . 2
(Der maximale Wert von E ist 2E0 .) Die Übergangswahrscheinlichkeit wird nun 2 μ2 2 sin [(ω − ω0 )T/2] I T . P(I → II) = 2π 4π�0 2 c [(ω − ω0 )T/2]2
(9.53)
Gewöhnlich ist das Licht, das ein solches System bestrahlt, nicht perfekt monochromatisch. Es ist daher interessant, ein weiteres Problem zu lösen – nämlich die Übergangswahrscheinlichkeit zu berechnen, wenn das Licht die Intensität I (ω) pro Frequenzintervalleinheit hat und einen breiten Bereich, der ω0 einschließt, überdeckt. Dann wird die Wahrscheinlichkeit für den Übergang von | I � nach | II � zu einem Integral: ∞ μ2 sin2 [(ω − ω0 )T/2] 2 T P(I → II) = 2π I (ω) dω . (9.54) 4π�0 2 c [(ω − ω0 )T/2]2 0 Im Allgemeinen wird I (ω) viel langsamer mit ω variieren als die scharfe Spitze für die Resonanz. Die beiden Funktionen könnten wie in Abbildung 9.8 gezeigt aussehen. In solchen Fällen können wir die Intensität I (ω) durch ihren Wert I (ω0 ) in der Mitte der scharfen Resonanzkurve ersetzen und sie aus dem Integral herausziehen. Was übrigbleibt, ist einfach das Integral unter der Kurve von Abbildung 9.7, das, wie wir gesehen haben, genau 2π/T ist. Wir erhalten P(I → II) = 4π2
μ2 I (ω0 )T . 4π�0 2 c
(9.55)
174
9 Der Ammoniak-Maser
I(ω) I(ω0 ) I(ω)
ω0
ω
Abb. 9.8: Die spektrale Intensität I (ω) kann durch ihren Wert bei ω0 angenähert werden.
Dies ist ein wichtiges Ergebnis, denn es ist die allgemeine Theorie der Lichtabsorption für beliebige molekulare oder atomare Systeme. Obwohl wir von einem Fall ausgegangen sind, in dem der Zustand | I � eine höhere Energie hat als der Zustand | II �, war keines unserer Argumente von dieser Tatsache abhängig. Gleichung (9.55) gilt auch, wenn der Zustand | I � eine niedrigere Energie als der Zustand | II � hat; dann stellt P(I → II) die Wahrscheinlichkeit für einen Übergang mit Energieabsorption aus der einfallenden elektromagnetischen Welle dar. Bei Lichtabsorption durch ein atomares System spielt immer die Amplitude eine Rolle, die den Übergang in einem oszillierenden elektrischen Feld zwischen zwei durch eine Energie E = ω0 getrennten Zuständen beschreibt. In jedem speziellen Fall wird sie genauso ausgerechnet, wie wir es hier getan haben, und ergibt einen Ausdruck wie (9.55). Wir betonen daher die folgenden Eigenschaften dieses Ergebnisses. Erstens ist die Wahrscheinlichkeit proportional zu T . Mit anderen Worten, es gibt eine konstante Wahrscheinlichkeit pro Zeiteinheit, dass ein Übergang stattfinden wird. Zweitens ist diese Wahrscheinlichkeit proportional zur Intensität des Lichtes, das auf das System einfällt. Schließlich ist die Übergangswahrscheinlichkeit proportional zu μ2 , wobei, wie Sie sich erinnern werden, μE die durch das elektrische Feld E bewirkte Energieverschiebung ist. Aus diesem Grund trat μE auch in den Gleichungen (9.38) und (9.39) als Kopplungsterm auf, der für den Übergang zwischen den sonst stationären Zuständen | I � und | II � verantwortlich ist. Mit anderen Worten, für das kleine E, das wir betrachtet haben, ist μE der so genannte „Störterm“ in dem hamiltonschen Matrixelement, der die Zustände | I � und | II � verbindet. Im allgemeinen Fall würde sich ergeben, dass μE durch das Matrixelement � II | H | I � ersetzt wird (siehe Abschnitt 5.6). In Band II, Abschnitt 17.5, hatten wir die Beziehungen zwischen Lichtabsorption, induzierter Emission und spontaner Emission unter Benutzung der Einstein-Koeffizienten A und B behandelt. Hier haben wir endlich das quantenmechanische Verfahren, um diese Koeffizienten auszurechnen. Was wir bei unserem Zweizustands-Ammoniakmolekül mit P(I → II) bezeichnet haben, entspricht genau dem Absorptionskoeffizienten Bnm der einsteinschen Strahlungstheorie. Bei dem komplizierten Ammoniakmolekül – das für jeden zu schwierig zu berechnen ist – haben wir das Matrixelement � II | H | I � als μE angenommen und gesagt, dass man μ expe-
9.6 Die Lichtabsorption
175
rimentell bestimmen muss. Bei einfacheren atomaren Systemen kann das μmn , das zu jedem einzelnen Übergang gehört, aus der Definition μmn E = � m | H | n � = Hmn
(9.56)
berechnet werden, wobei Hmn das Matrixelement der Hamilton-Matrix ist, das die Wirkungen eines schwachen elektrischen Feldes enthält. Das auf diese Weise berechnete μmn heißt das Matrixelement des elektrischen Dipols. Die quantenmechanische Theorie der Absorption und Emission von Licht wird daher auf eine Berechnung dieser Matrixelemente für spezielle atomare Systeme reduziert. Unsere Untersuchung eines einfachen Zweizustandssystems hat uns damit zu einem Verständnis des allgemeinen Problems der Absorption und Emission von Licht geführt.
10
Andere Zweizustandssysteme
10.1
Das Ion des Wasserstoffmoleküls
Im vorangegangenen Kapitel haben wir einige Aspekte des Ammoniakmoleküls besprochen, wobei wir angenommen haben, dass wir es näherungsweise als Zweizustandssystem betrachten können. Es ist natürlich nicht wirklich ein Zweizustandssystem – es gibt viele Zustände der Rotation, Vibration, Translation usw. –, aber jeder dieser Bewegungszustände muss wegen des Umklappens des Stickstoffatoms zur genauen Untersuchung in die beiden inneren Zustände zerlegt werden. Nun werden wir andere Beispiele von Systemen betrachten, die in der einen oder anderen Näherung als Zweizustandssysteme angesehen werden können. Vieles wird nur näherungsweise gültig sein, weil es immer viele andere Zustände gibt, die man in einer genaueren Untersuchung berücksichtigen müsste. Aber in jedem unserer Beispiele werden wir vieles verstehen können, wenn wir nur zwei Zustände betrachten. Da wir uns nur mit Zweizustandssystemen befassen, wird unsere Hamilton-Matrix genauso aussehen wie die, die wir im vorangegangenen Kapitel benutzt haben. Wenn die HamiltonMatrix zeitunabhängig ist, dann wissen wir, dass es zwei stationäre Zustände mit bestimmten – und gewöhnlich verschiedenen – Energien gibt. Im Allgemeinen beginnen wir jedoch unsere Untersuchung mit einem Satz von Basiszuständen, die nicht diese stationären Zustände sind, sondern Zustände, die vielleicht irgendeine andere einfache physikalische Bedeutung haben. Dann werden die stationären Zustände dieses Systems durch eine Linearkombination dieser Basiszustände dargestellt. Fassen wir noch einmal die wichtigsten Gleichungen aus Kapitel 9 zusammen. Die ursprünglich gewählten Basiszustände seien | 1 � und | 2 �. Dann kann ein beliebiger Zustand | ψ � durch die Linearkombination | ψ � = | 1 � � 1 | ψ � + | 2 � � 2 | ψ � = | 1 � C 1 + | 2 � C2
(10.1)
dargestellt werden. Die Amplituden Ci (womit wir entweder C1 oder C2 meinen), erfüllen die beiden linearen Differentialgleichungen i
dCi = Hi j C j , dt j
(10.2)
wobei i und j die Werte 1 und 2 annehmen können. Wenn die Elemente der Hamilton-Matrix Hi j nicht von t abhängen, haben die beiden Zustände mit bestimmter Energie (die stationären Zustände), die wir mit | ψI � = | I � e−(i/)EI t
und
| ψII � = | II � e−(i/)EII t
178
10 Andere Zweizustandssysteme
bezeichnen, die Energien H11 + H22 + | E I �= 2 | E II �=
H11 + H22 − 2
H − H 2 11 22 + H12 H21 , 2 H − H 2 11 22 + H12 H21 . 2
(10.3)
Die beiden C’s für jeden dieser Zustände haben dieselbe Zeitabhängigkeit. Die Zustandsvektoren | I � und | II �, die zu den stationären Zuständen gehören, sind mit unseren ursprünglichen Basiszuständen | 1 � und | 2 � verknüpft durch | I � = | 1 � a1 + | 2 � a2
(10.4)
| II �= | 1 � a�1 + | 2 � a�2 . Die a’s sind komplexe Konstanten und erfüllen die folgenden Gleichungen: |a1 |2 + |a2 |2 = 1 , a1 H12 = , a2 E I − H11 � 2 � 2 a1 + a2 = 1 , a�1 H12 = . � a2 E II − H11
(10.5)
(10.6)
Wenn H11 und H22 gleich sind – wir bezeichnen diesen Wert mit E0 – und H12 = H21 = −A, dann ist E I = E0 + A, E II = E0 − A und die Zustände | I � und | II � sind besonders einfach: 1 |I� = √ |1�−|2� , 2
1 | II � = √ | 1 � + | 2 � . 2
(10.7)
Nun wollen wir diese Ergebnisse benutzen, um eine Reihe interessanter Beispiele aus der Chemie und Physik zu diskutieren. Das erste Beispiel ist das Ion des Wasserstoffmoleküls. Ein positiv ionisiertes Wasserstoffmolekül besteht aus zwei Protonen, um die sich ein Elektron herumschlängelt. Wenn die beiden Protonen sehr weit auseinander liegen, welche Zustände würden wir dann für dieses System erwarten? Die Antwort ist ganz klar: Das Elektron wird nahe an einem Proton bleiben und ein Wasserstoffatom im niedrigsten Zustand bilden, und das andere Proton wird allein als positives Ion verbleiben. Wenn daher die beiden Protonen weit voneinander entfernt sind, können wir uns einen physikalischen Zustand vorstellen, in dem das Elektron an eines der Protonen „angebunden“ ist. Es gibt offenbar einen anderen Zustand, der zu diesem symmetrisch ist und in dem das Elektron nahe bei dem anderen Proton ist, während das erste Proton ein Ion ist. Diese beiden wollen wir als unsere Basiszustände annehmen, und wir wollen sie | 1 � und | 2 � nennen. Sie sind in Abbildung 10.1 skizziert. Natürlich gibt es in Wirklichkeit viele Zustände für ein Elektron in der Nähe eines Protons, weil die Kombination als irgendeiner der angeregten Zustände des Wasserstoffatoms vorliegen kann. Jetzt sind wir an dieser Vielzahl der Zustände jedoch nicht interessiert. Wir wollen nur die Situation betrachten,
10.1 Das Ion des Wasserstoffmoleküls
179
Elektron Protonen |1�
+
+
|2�
+
+
Abb. 10.1: Ein Satz von Basiszuständen für zwei Protonen und ein Elektron.
bei der das Wasserstoffatom im niedrigsten Zustand – in seinem Grundzustand – ist, und wir wollen im Moment den Spin des Elektrons außer Acht lassen. Wir können einfach annehmen, dass der Spin des Elektrons bei allen unseren Zuständen längs der z-Achse „up“ ist1 . Es bedarf nun einer Energie von 13,6 Elektronenvolt, um das Elektron von einem Wasserstoffatom zu entfernen. Solange die beiden Protonen des Ions des Wasserstoffmoleküls weit voneinander entfernt sind, braucht man ungefähr ebenso viel Energie – was für unsere gegenwärtigen Betrachtungen ein großer Energiebetrag ist –, um das Elektron in die Nähe der Mitte zwischen den Protonen zu bringen. Klassisch ist es daher für das Elektron unmöglich, von einem Proton zum anderen zu springen. In der Quantenmechanik ist es jedoch möglich – wenn auch nicht sehr wahrscheinlich. Es gibt für das Elektron eine kleine Amplitude, sich von einem Proton zum anderen zu bewegen. Als erste Näherung wird dann jeder unserer Basiszustände | 1 � und | 2 � die Energie E0 haben, die genau gleich der Energie eines Wasserstoffatoms plus eines Protons ist. Wir können die hamiltonschen Matrixelemente H11 und H22 beide näherungsweise gleich E0 setzen. Die beiden anderen Matrixelemente H12 und H21 , die die Amplituden für den Wechsel des Elektrons sind, werden wir wieder als −A schreiben. Sie sehen, dass dies dasselbe Spiel ist, das wir in den vorigen beiden Kapiteln gespielt haben. Wenn wir die Tatsache außer Acht lassen, dass das Elektron hin und her springen kann, haben wir zwei Zustände mit genau der gleichen Energie. Diese Energie wird jedoch durch die Möglichkeit, dass das Elektron hin und her springen kann, in zwei Energieniveaus aufgespalten – je größer die Wahrscheinlichkeit für den Übergang ist, desto größer ist die Aufspaltung. Die beiden Energieniveaus des Systems sind daher E0 + A und E0 − A, und die Zustände, die diese bestimmten Energien haben, sind durch (10.7) gegeben.
Aus unserer Lösung wird ersichtlich, dass, wenn ein Proton und ein Wasserstoffatom nahe zusammengebracht werden, das Elektron nicht bei einem der Protonen bleiben, sondern zwischen den beiden Protonen hin und her springen wird. Wenn es bei einem der Protonen beginnt, wird es zwischen den Zuständen | 1 � und | 2 � hin und her oszillieren – und dabei eine zeitlich variierende Lösung ergeben. Um die Lösung mit der niedrigsten Energie zu erhalten (die sich nicht mit√der Zeit ändert), nehmen wir an, dass das Elektron mit der gleichen Amplitude, nämlich 1/ 2, bei Proton 1 bzw. Proton 2 startet. Beachten Sie, dass es nicht zwei Elektronen gibt – wir sagen nicht, dass es bei jedem Proton ein Elektron gibt. 1
Dies ist ausreichend, solange es keine signifikanten Magnetfelder gibt. Wir werden die Wirkungen magnetischer Felder auf Elektronen später in diesem Kapitel besprechen und in Kapitel 12 die sehr kleinen Auswirkungen des Spins im Wasserstoffatom diskutieren.
180
10 Andere Zweizustandssysteme
Nun hängt die Amplitude A, dass ein Elektron, welches nahe bei dem einen Proton ist, zu dem anderen geht, von dem Abstand zwischen den Protonen ab. Je näher die Protonen zusammen sind, desto größer ist diese Amplitude. In Kapitel 7 hatten wir festgestellt, dass ein Elektron eine gewisse Amplitude haben kann, eine „Potentialbarriere zu durchdringen“, was klassisch nicht möglich ist. Hier haben wir dieselben Verhältnisse. Die Amplitude, dass ein Elektron hindurchkommt, nimmt ungefähr exponentiell mit der Entfernung ab – bei großen Entfernungen. Da die Übergangswahrscheinlichkeit und damit A größer werden, wenn die Protonen enger zusammen sind, wird der Abstand der Energieniveaus auch größer werden. Wenn das System im Zustand | I � ist, wächst die Energie E0 +A mit kleiner werdendem Abstand. Diese quantenmechanischen Effekte bewirken daher eine abstoßende Kraft, die bestrebt ist, die Protonen auseinanderzuhalten. Wenn das System dagegen im Zustand | II � ist, nimmt die Gesamtenergie ab, wenn die Protonen näher zusammengebracht werden; es gibt dann eine anziehende Kraft zwischen den Protonen. Die Änderung der beiden Energien mit dem Abstand zwischen den beiden Protonen sollte etwa wie in Abbildung 10.2 aussehen. Wir haben damit eine quantenmechanische Erklärung für die Bindungskraft, die das H+2 -Ion zusammenhält. E
E I = E0 + A
E0
EII = E0 − A
D Abstand zwischen den Protonen
Abb. 10.2: Die Energien der zwei stationären Zustände des H+2 -lons als Funktion des Abstandes zwischen den zwei Protonen.
Wir haben jedoch eine Sache vergessen. Zusätzlich zu der eben beschriebenen Kraft gibt es auch eine elektrostatische Abstoßung zwischen den beiden Protonen. Wenn die beiden Protonen weit voneinander entfernt sind – wie in Abbildung 10.1 –, sieht das „nackte“ Proton nur eine vernachlässigbare elektrostatische Kraft. Bei sehr kleinen Abständen jedoch beginnt das „nackte“ Proton ins „Innere“ der Elektronenverteilung zu gelangen – das heißt, es ist im Durchschnitt näher am Proton als am Elektron. Es tritt dort also eine zusätzliche elektrostatische Energie auf, die natürlich positiv ist. Diese Energie – die sich auch mit dem Abstand verändert – muss in E0 einbezogen werden. Für E0 müssen wir daher etwas wie die gestrichelte Kurve in Abbildung 10.2 annehmen, die für Abstände, die kleiner als der Radius eines Wasserstoffatoms sind, rasch ansteigt. Die Umklappenergie A müssen wir zu diesem E0 addieren bzw. subtrahieren. Wenn wir dies tun, werden sich die Energien E I und E II mit dem Abstand D zwischen den Protonen ändern (siehe Abbildung 10.3). In dieser Abbildung haben wir die Ergebnisse einer ausführlicheren Berechnung aufgetragen. Der Abstand zwischen den Protonen ist in Einheiten von Å (10−8 cm) angegeben und die Energie, die über ein Proton plus ein Wasserstoffatom hinausgeht, ist in Einheiten der Bindungsenergie des Wasserstoffatoms angegeben – der
10.1 Das Ion des Wasserstoffmoleküls
181
ΔE EH 0,3
EI
0,2 0,1 0 −0,1
EII
−0,2 1
2 D(Å)
3
4
Abb. 10.3: Die Energieniveaus des H+2 -Ions als Funktion des Protonenabstandes D. (EH = 13,6 eV.)
so genannten „Rydberg“-Energie, 13,6 eV. Wir sehen, dass der Zustand | II � einen Punkt mit minimaler Energie hat. Dies ist die Gleichgewichtslage – der Zustand niedrigster Energie – für das H+2 -Ion. Die Energie in diesem Punkt ist niedriger als die Energie eines Systems, das aus einem separaten Proton und einem separaten Wasserstoffatom besteht. Das System ist daher gebunden. Ein einzelnes Elektron bewirkt den Zusammenhalt der beiden Protonen. Ein Chemiker würde es eine „Einelektronenbindung“ nennen. Diese Art von chemischer Bindung wird oft auch „quantenmechanische Resonanz“ genannt (in Analogie zu den beiden gekoppelten Pendeln, die wir vorher beschrieben haben). Dies hört sich jedoch mysteriöser an als es ist, es ist nur dann eine „Resonanz“, wenn Sie mit ungünstig gewählten Basiszuständen anfangen – wie wir es auch getan haben! Wenn Sie den Zustand | II � genommen hätten, hätten Sie den Zustand niedrigster Energie – das ist alles. Wir können auch anhand einer anderen Überlegung einsehen, warum solch ein Zustand eine niedrigere Energie als ein Proton und ein Wasserstoffatom haben sollte. Stellen wir uns ein Elektron vor, das sich in der Nähe von zwei Protonen befindet, zu denen es einen festen, aber nicht zu großen Abstand hat. Sie erinnern sich, dass bei einem einzelnen Proton das Elektron aufgrund des Unbestimmtheitsprinzips „verbreitert“ ist. Es sucht sich einen Mittelweg. Einerseits strebt es ein niedriges Coulomb-Potential an und andererseits möchte es nicht auf einen zu kleinen Raum beschränkt werden, da dies eine zu hohe kinetische Energie ergeben würde (wegen der Unbestimmtheitsrelation Δp Δx ≈ ). Wenn nun zwei Protonen da sind, ist mehr Raum vorhanden, in dem das Elektron eine niedrige potentielle Energie haben kann. Es kann sich verbreitern – und dadurch seine kinetische Energie verringern –, ohne seine potentielle Energie zu erhöhen. Das Endergebnis ist eine niedrigere Energie als für das System aus einem separaten Proton und einem separaten Wasserstoffatom. Warum hat dann der andere Zustand | I � eine höhere Energie? Beachten Sie, dass dieser Zustand die Differenz der Zustände | 1 � und | 2 � ist. Wegen der Symmetrie von | 1 � und | 2 � muss die Differenz eine verschwindende Amplitude haben, das Elektron auf halbem Wege zwischen den beiden Protonen zu finden. Dies bedeutet, dass das Elektron räumlich etwas mehr eingeschränkt ist, was zu einer höheren Energie führt.
182
10 Andere Zweizustandssysteme
Wir müssen zugeben, dass unsere angenäherte Behandlung des H+2 -Ions als Zweizustandssystem zusammenbricht, sobald die Protonen so nahe zusammenkommen, wie es im Minimum der Kurve von Abbildung 10.3 der Fall ist. Sie wird daher keinen guten Wert für die wirkliche Bindungsenergie liefern. Bei kleinen Abständen sind die Energien der beiden „Zustände“, die wir in Abbildung 10.1 angenommen haben, nicht wirklich gleich E0 ; es bedarf hier einer eingehenderen quantenmechanischen Behandlung. Fragen wir uns nun, was geschehen würde, wenn wir statt der beiden Protonen zwei verschiedene Objekte hätten – zum Beispiel ein Proton und ein positives Lithiumion (immer noch haben beide Teilchen eine einzige positive Ladung). In diesem Fall wären die beiden Elemente H11 und H22 der Hamilton-Matrix nicht mehr gleich; sie wären sogar sehr verschieden. Wenn die Differenz (H11 − H22 ) dem Betrag nach viel größer als A = −H12 ist, dann ist die Anziehungskraft sehr schwach, wie wir auf folgende Art sehen können. Wenn wir H12 H21 = A2 in die (10.3) einsetzen, erhalten wir H11 + H22 H11 − H22 4A2 ± E= 1+ . 2 2 (H11 − H22 )2 Wenn H11 − H22 viel größer als A2 ist, ist die Quadratwurzel fast genau gleich 1+
2A2 . (H11 − H22 )2
Die beiden Energien sind dann E I = H11 +
A2 (H11 − H22 )
A2 E II = H22 − . (H11 − H22 )
(10.8)
Sie liegen damit sehr nahe bei den Energien H11 und H22 der einzelnen Atome, die nur leicht durch die Umklappamplitude A auseinandergestoßen sind. Die Energiedifferenz E I − E II ist (H11 − H22 ) +
2A2 . H11 − H22
Der zusätzliche Abstand durch das Umklappen des Elektrons ist nicht mehr gleich 2A; er ist um den Faktor A/(H11 − H22 ) kleiner, den wir jetzt als sehr klein gegen eins annehmen. Auch ist die Abhängigkeit von E I − E II vom Abstand der beiden Kerne viel schwächer als beim H+2 -Ion – sie ist ebenfalls um den Faktor A/(H11 − H22 ) verringert. Wir verstehen jetzt, warum die Bindung von unsymmetrischen zweiatomigen Molekülen im Allgemeinen sehr schwach ist. In unserer Theorie des H+2 -Ions haben wir eine Erklärung für den Mechanismus entdeckt, durch den ein Elektron, das zwei Protonen zugeordnet ist, tatsächlich eine Anziehungskraft zwischen den beiden Protonen bewirkt, die auch dann vorhanden sein kann, wenn die Protonen weit voneinander entfernt sind. Die Anziehungskraft resultiert aus der verringerten Energie des Systems, die daraus folgt, dass das Elektron die Möglichkeit hat, von einem Proton zum anderen zu
10.1 Das Ion des Wasserstoffmoleküls
183
springen. Bei solch einem Sprung wechselt das System von der Anordnung Wasserstoffatom – Proton zu der Anordnung Proton – Wasserstoffatom oder umgekehrt. Wir können den Prozess symbolisch schreiben als (H, p) (p, H) . Die Energieverschiebung infolge dieses Prozesses ist proportional zur Amplitude A, dass ein Elektron mit der Energie −WH (seine Bindungsenergie im Wasserstoffatom) von einem Proton zum anderen übergehen kann. Bei großen Entfernungen R zwischen den beiden Protonen ist das elektrostatische Potential des Elektrons im größten Teil des Raumes, den es bei seinem Wechsel passieren muss, beinahe null. In diesem Raum bewegt sich das Elektron also beinahe wie ein freies Teilchen im leeren Raum – aber mit negativer Energie! Gemäß (3.7) ist für ein Teilchen mit bestimmter Energie die Amplitude, von einem Ort zu einem um den Abstand r entfernten anderen Ort zu gehen, proportional zu e(i/)pr , r wobei p der Impuls ist, welcher der bestimmten Energie entspricht. Im vorliegenden Fall (bei Verwendung der nichtrelativistischen Formel) ist p gegeben durch p2 = −WH . 2m
(10.9)
Dies bedeutet, dass p eine imaginäre Zahl ist, p = i 2mWH .
(Das andere Wurzelvorzeichen ergibt hier keinen Sinn). Wir erwarten also, dass sich bei großen Abständen R zwischen den beiden Protonen die Amplitude A für das H+2 wie A∝
e−(
√
2mWH /)R
R
(10.10)
verändert. Die Energieverschiebung infolge der Elektronenbindung ist proportional zu A. Es gibt daher eine Kraft, die die beiden Protonen zusammenzieht, und diese ist für große R proportional zur Ableitung von (10.10) nach R. Der Vollständigkeit halber merken wir an, dass es in dem System mit zwei Protonen und einem Elektron noch einen anderen Effekt gibt, aus dem sich eine Abhängigkeit der Energie von R ergibt. Wir haben ihn bis jetzt vernachlässigt, weil er in den meisten Fällen nicht relevant ist. Die einzige Ausnahme ist der Fall sehr großer Abstände, wenn die Energie des Austauschterms A exponentiell auf sehr kleine Werte abgesunken ist. Der neue Effekt, den wir meinen, ist die elektrostatische Anziehung zwischen dem Proton und dem Wasserstoffatom, die sich auf die gleiche Weise ergibt wie die Anziehung zwischen einem geladenen und einem neutralen Objekt. Das nackte Proton erzeugt am Ort des neutralen Wasserstoffatoms ein elektrisches Feld E (das
184
10 Andere Zweizustandssysteme
wie 1/R2 variiert). Das Atom wird polarisiert und nimmt dabei ein induziertes Dipolmoment μ an, das proportional zu E ist. Die Energie des Dipols ist μE, was proportional zu E2 – oder zu 1/R4 – ist. Es gibt daher in der Energie des Systems einen Term, der mit der vierten Potenz des Abstands abnimmt. (Es ist eine Korrektur zu E0 .) Diese Energie fällt mit dem Abstand langsamer ab als die durch (10.10) gegebene Verschiebung A; bei großem Abstand R wird sie zu dem einzigen noch verbleibenden signifikanten Term, der eine Energieänderung mit R ergibt – und daher die einzige verbleibende Kraft. Beachten Sie, dass der elektrostatische Term für beide Basiszustände und daher auch für beide stationäre Zustände dasselbe Vorzeichen hat (die Kraft ist anziehend, daher ist die Energie negativ), während der Elektronenaustauschterm A für die beiden stationären Zustände entgegengesetzte Vorzeichen hat.
10.2
Kernkräfte
Wir haben gesehen, dass das System aus einem Wasserstoffatom und einem Proton aufgrund des Austauschs des einzelnen Elektrons eine Wechselwirkungsenergie hat, die sich für große Abstände R wie e−αR R
(10.11)
√ mit α = 2mWH / ändert. (Man spricht gewöhnlich von einem Austausch eines „virtuellen“ Elektrons, wenn das Elektron – wie hier – über ein Gebiet springen muss, in dem es negative Energie hätte. Präziser ausgedrückt, bedeutet ein „virtueller Austausch“, dass das Phänomen auf einer quantenmechanischen Interferenz zwischen einem ausgetauschten und einem nicht ausgetauschten Zustand beruht.) Nun können wir uns fragen, ob es möglich ist, dass Kräfte zwischen anderen Teilchen einen analogen Ursprung haben? Wie ist es zum Beispiel mit den Kernkräften zwischen einem Neutron und einem Proton oder zwischen zwei Protonen? Um die Natur der Kernkräfte zu erklären, schlug Yukawa vor, dass die Kräfte zwischen zwei Nukleonen von einem ähnlichen Austauscheffekt herrühren – nur sind sie in diesem Fall nicht eine Folge des virtuellen Austausches eines Elektrons, sondern eines neuen Teilchens, das er „Meson“ nannte. Heute würden wir Yukawas Meson mit dem π-Meson (oder „Pion“) identifizieren, das bei Zusammenstößen mit hoher Energie von Protonen oder anderen Teilchen entsteht. Wir wollen uns als Beispiel ansehen, was für eine Art von Kraft wir beim Austausch eines positiven Pions (π+ ) der Masse mπ zwischen einem Proton und einem Neutron zu erwarten haben. Ebenso wie ein Wasserstoffatom H0 in ein Proton p+ übergehen kann, indem es ein Elektron e− abgibt, H0 → p + + e − ,
(10.12)
kann ein Proton p+ in ein Neutron n0 übergehen, indem es ein π+ -Meson abgibt: p+ → n0 + π+ .
(10.13)
Wenn sich also ein Proton bei a und ein Neutron bei b befindet, die den Abstand R voneinander haben, kann das Proton zu einem Neutron werden, indem es ein π+ emittiert, das dann
10.2 Kernkräfte
185
vom Neutron bei b absorbiert wird und es in ein Proton umwandelt. Es gibt eine Wechselwirkungsenergie des Zwei-Nukleonen-(plus Pion-)Systems, die von der Amplitude A für den Pionaustausch abhängt – also das, was wir für den Elektronenaustausch im H+2 -Ion gefunden hatten. Im Prozess (10.12) ist die Energie des H0 -Atoms um WH kleiner als die des Protons (wenn man nichtrelativistisch rechnet und die Ruheenergie mc2 des Elektrons weglässt). Das Elektron hat daher eine negative kinetische Energie – oder einen imaginären Impuls, wie in (10.9). Bei dem Kernprozess (10.13) haben Proton und Neutron fast die gleiche Masse, daher wird das π+ die Gesamtenergie null haben. Die Beziehung zwischen der Gesamtenergie E und dem Impuls p für ein Pion der Masse mπ ist E 2 = p2 c2 + m2π c4 . Da E null ist (oder zumindest vernachlässigbar im Vergleich zu mπ ), ist der Impuls wieder imaginär: p = imπ c . Wenn wir dieselben Argumente wie für die Amplitude benutzen, nämlich dass ein gebundenes Elektron die Barriere im Raum zwischen zwei Protonen durchdringt, erhalten wir im Fall der Kerne eine Austauschamplitude A, die sich – für große R – verhalten sollte wie e−(mπ c/)R . R
(10.14)
Die Wechselwirkungsenergie ist proportional zu A und variiert daher auf die gleiche Art. Wir erhalten eine Energievariation in der Form des so genannten Yukawa-Potentials zwischen zwei Nukleonen. Übrigens hatten wir diese Formel bereits direkt aus der Differentialgleichung für die Bewegung eines Pions im freien Raum erhalten [siehe Band III, Gleichung (28.18)]. Derselben Argumentation folgend, können wir die Wechselwirkung zwischen zwei Protonen (oder zwischen zwei Neutronen) diskutieren, die sich aus dem Austausch eines neutralen Pions (π0 ) ergibt. Der grundlegende Prozess ist in diesem Fall p+ → p+ + π0 .
(10.15)
Ein Proton kann ein virtuelles π0 emittieren, es bleibt dann aber immer noch ein Proton. Wenn wir zwei Protonen betrachten, kann Proton No. 1 ein virtuelles π0 emittieren, das von Proton No. 2 absorbiert wird. Am Ende haben wir immer noch zwei Protonen. Das ist etwas anders als beim H+2 -Ion. Dort ging das H0 nach Emission des Elektrons in eine andere Beschaffenheit – das Proton – über. Nun nehmen wir an, dass ein Proton ein π0 emittieren kann, ohne seine Natur zu ändern. Solche Prozesse wurden tatsächlich bei hochenergetischen Stößen beobachtet. Der Prozess verläuft wie bei einem Elektron, das ein Photon emittiert und doch ein Elektron bleibt e → e + Photon
(10.16)
Wir „sehen“ die Photonen im Elektron nicht, bevor sie emittiert werden oder nachdem sie absorbiert worden sind, und ihre Emission ändert nicht die Natur des Elektrons.
186
10 Andere Zweizustandssysteme
Wenden wir uns wieder dem Fall der beiden Protonen zu. Hier gibt es eine Wechselwirkungsenergie, die von der Amplitude A herrührt, dass ein Proton ein neutrales Pion emittiert, welches sich (mit imaginärem Impuls) zu dem anderen Proton bewegt und dort absorbiert wird. Diese Amplitude ist wieder proportional zu (10.14), wobei mπ die Masse des neutralen Pions ist. Genau dieselben Argumente ergeben eine gleiche Wechselwirkungsenergie für zwei Neutronen. Da die Kernkräfte (abgesehen von elektrischen Effekten) zwischen Neutron und Proton, zwischen Proton und Proton und zwischen Neutron und Neutron gleich sind, folgern wir, dass die Massen der geladenen und neutralen Pionen gleich sein müssen. Experimentell sind die Massen tatsächlich nahezu gleich, und der kleine Unterschied beträgt etwa so viel wie man nach den elektrischen Selbstenergie-Korrekturen erwarten würde (siehe Band III, Kapitel 28). Es gibt noch andere Arten von Teilchen – beispielsweise die K-Mesonen –, die zwischen zwei Nukleonen ausgetauscht werden können. Es ist auch möglich, dass zwei Pionen gleichzeitig ausgetauscht werden. Aber all diese anderen ausgetauschten „Objekte“ haben eine Ruhemasse m x , die größer als die Pionenmasse mπ ist, und führen in der Austauschamplitude zu Termen, die sich ändern wie e−(mx c/)R . R Diese Terme klingen mit wachsendem R schneller ab als der Ein-Meson-Term. Niemand weiß heute, wie diese Terme mit höherer Masse zu berechnen sind. Aber für hinreichend große Werte von R bleibt nur der Ein-Pion-Term übrig. Und tatsächlich zeigen jene Experimente, die die Kernwechselwirkungen nur bei großen Abständen untersuchen, dass die Wechselwirkungsenergie so ist, wie sie die Theorie des Ein-Pion-Austausches vorhersagt. In der klassischen Theorie der Elektrizität und des Magnetismus sind die elektrostatische Coulomb-Wechselwirkung und die Lichtausstrahlung einer beschleunigten Ladung eng miteinander verknüpft – beide folgen aus den Maxwell-Gleichungen. Die Quantentheorie zeigt, dass Licht in Form von Quantenanregungen der harmonischen Schwingungen des klassischen elektromagnetischen Feldes in einem Kasten dargestellt werden kann. Andererseits kann die Quantentheorie aufgebaut werden, indem man das Licht durch Teilchen-Photonen beschreibt, die der Bose-Statistik genügen. Wir haben in Abschnitt 4.5 betont, dass die beiden alternativen Standpunkte immer identische Vorhersagen ergeben. Kann der zweite Standpunkt vollständig so durchgeführt werden, dass er alle elektromagnetischen Effekte erfasst? Wenn wir insbesondere das elektromagnetische Feld vollständig durch Bose-Teilchen – das heißt durch Photonen – beschreiben wollen, woraus resultiert dann die Coulomb-Kraft? Im Teilchenbild wird die Coulomb-Wechselwirkung dadurch erklärt, dass zwei Elektronen ein virtuelles Photon austauschen. Das eine Elektron emittiert ein Photon – wie in der Reaktion (10.16) –, das zu dem zweiten Elektron übergeht, wo es in Umkehrung derselben Reaktion absorbiert wird. Die Wechselwirkungsenergie ist wieder durch eine Formel wie (10.14) gegeben, wobei jetzt aber mπ durch die Ruhemasse des Photons ersetzt wird – die null ist. Daher ergibt der virtuelle Austausch eines Photons zwischen zwei Elektronen eine Wechselwirkungsenergie, die sich einfach umgekehrt proportional zu R, dem Abstand zwischen den beiden Elektronen, ändert – das ist die normale Coulomb-Energie! In der „Teilchentheorie“ des Elektromagnetismus bewirkt der Austausch eines virtuellen Photons alle Phänomene der Elektrostatik.
10.3 Das Wasserstoffmolekül
10.3
187
Das Wasserstoffmolekül
Als nächstes Zweizustandssystem betrachten wir das neutrale Wasserstoffmolekül H2 . Es ist natürlich schwieriger zu verstehen, weil es zwei Elektronen hat. Zu Beginn überlegen wir uns wieder, was geschieht, wenn die beiden Protonen gut separiert sind. Nur müssen wir jetzt zwei Elektronen hinzufügen. Um sie verfolgen zu können, werden wir das eine von ihnen „Elektron a“ und das andere „Elektron b“ nennen. Wir können uns wieder zwei mögliche Zustände vorstellen. Die eine Möglichkeit besteht darin, dass „Elektron a“ beim ersten Proton und „Elektron b“ beim zweiten ist, wie in der oberen Hälfte von Abbildung 10.4 skizziert. Wir haben einfach zwei Wasserstoffatome. Wir wollen diesen Zustand | 1 � nennen. Die andere Möglichkeit ist, dass „Elektron b“ beim ersten Proton ist und „Elektron a“ beim zweiten. Wir nennen diesen Zustand | 2 �. Aus Symmetriegründen sollten die beiden Möglichkeiten energetisch gleichwertig sein; wie wir aber sehen werden, ist die Energie des Systems nicht einfach die Energie der beiden Wasserstoffatome. Wir sollten erwähnen, dass es noch viele andere Möglichkeiten gibt. Zum Beispiel könnte „Elektron a“ in der Nähe des ersten Protons sein und „Elektron b“ könnte in einem anderen Zustand im Bereich desselben Protons sein. Wir lassen solche Fälle unberücksichtigt, da sie sicher höhere Energie haben (wegen der starken Coulomb-Abstoßung zwischen den beiden Elektronen). Wenn wir größere Genauigkeit anstreben würden, müssten wir jedoch solche Zustände mit berücksichtigen. Das Wesentliche der molekularen Bindung können wir aber erkennen, wenn wir nur die beiden Zustände von Abbildung 10.4 betrachten. In dieser Näherung können wir jeden Zustand durch Angabe der Amplitude � 1 | φ �, im Zustand | 1 � zu sein, und der Amplitude � 2 | φ �, im Zustand | 2 � zu sein, beschreiben. Der Zustandsvektor | φ � kann also geschrieben werden als die Linearkombination |φ� = |i��i|φ� . i
Weiterhin nehmen wir an, dass sich die Elektronen mit einer Amplitude A durch den dazwischen liegenden Raum bewegen und ihre Plätze tauschen können. Diese Austauschmöglichkeit bedeutet, dass die Energie des Systems aufgespalten ist, wie wir es schon bei den anderen Zweizustandssystemen gesehen haben. Wie für das Ion des Wasserstoffmoleküls ist die Aufspaltung sehr klein, wenn der Abstand zwischen den Protonen groß ist. Wenn sich die Protonen einander nähern, wächst für die Elektronen die Amplitude, hin und her zu gehen, sodass die
a
Elektronen
b
|1�
+
b
a
|2�
+
+
+ Protonen
Abb. 10.4: Ein Satz von Basiszuständen für das H2 -Molekül.
188
10 Andere Zweizustandssysteme
Aufspaltung größer wird. Die Abnahme des niedrigeren Energiezustandes bedeutet, dass es eine Anziehungskraft gibt, die die Atome zusammenzieht. Die Energieniveaus steigen wegen der Coulomb-Abstoßung wieder an, wenn die Protonen sehr nahe zusammen kommen. Das Endergebnis ist, dass sich die Energie der beiden stationären Zustände wie in Abbildung 10.5 skizziert mit dem Abstand ändern. Bei einem Abstand von etwa 0,74 Å erreicht das niedrigere Energieniveau ein Minimum. Dies ist der Proton-Proton-Abstand des realen Wasserstoffmoleküls. 0,4 ΔE EH 0,2
0
−0,2 −0,4
0
1
2 D (Å)
3
Abb. 10.5: Die Energieniveaus des H2 -Moleküls für verschiedene Protonenabstände D. (EH = 13,6 eV.)
Gegen diese Argumentation gibt es einen naheliegenden Einwand. Was ist mit der Tatsache, dass die beiden Elektronen identische Teilchen sind? Wir haben sie „Elektron a“ und „Elektron b“ genannt, aber in Wirklichkeit ist es nicht möglich sie zu unterscheiden. Und wir haben in Kapitel 4 gesagt, dass bei Elektronen – die Fermi-Teilchen sind – die beiden Amplituden mit negativem Vorzeichen interferieren, wenn etwas durch Vertauschung der Elektronen auf zwei verschiedene Arten geschehen kann. Das heißt, dass sich das Vorzeichen der Amplitude umkehrt, wenn wir die beiden Elektronen umbenennen. Wir haben jedoch eben gefolgert, dass der gebundene Zustand des Wasserstoffmoleküls (bei t = 0) 1 | II � = √ (| 1 � + | 2 �) . 2 sein muss. Nach unseren Gesetzen aus Kapitel 4 ist dieser Zustand jedoch nicht erlaubt. Wenn wir die Elektronen umbenennen, erhalten wir nämlich den Zustand 1 √ (| 2 � + | 1 �) , 2 und wir bekommen dasselbe Vorzeichen anstelle des umgekehrten. Diese Argumente sind richtig, wenn beide Elektronen denselben Spin haben. Wenn beide Elektronen den Spin up haben (oder beide den Spin down), ist der einzige erlaubte Zustand 1 | I � = √ (| 1 � − | 2 �) . 2
10.3 Das Wasserstoffmolekül
189
Bei diesem Zustand ergibt eine Vertauschung der beiden Elektronen 1 √ (| 2 � − | 1 �) , 2 was, wie verlangt, − | I � ist. Wenn wir daher die beiden Wasserstoffatome nahe aneinander bringen und die Spins ihrer Elektronen in dieselbe Richtung zeigen, können sie nur in den Zustand | I � und nicht in den Zustand | II � gehen. Beachten Sie aber, dass Zustand | I � der höhere Energiezustand ist. Seine Energie hat als Funktion des Abstands kein Minimum. Die beiden Wasserstoffatome werden sich immer abstoßen und kein Molekül bilden. Wir folgern daher, dass das Wasserstoffmolekül mit parallelen Elektronenspins nicht bestehen kann. Und so ist es auch. Andererseits ist unser Zustand | II � für die beiden Elektronen vollkommen symmetrisch. Tatsächlich bekommen wir, wenn wir Elektron a und b vertauschen, genau denselben Zustand zurück. In Abschnitt 4.7 haben wir gesehen, dass zwei Fermi-Teilchen, wenn sie in demselben räumlichen Zustand sind, entgegengesetzte Spins haben müssen. Daher muss das gebundene Wasserstoffmolekül ein Elektron mit Spin up und eins mit Spin down haben. Die Beschreibung des Wasserstoffmoleküls wird noch etwas komplizierter, wenn wir die Protonenspins mit berücksichtigen. Es ist dann nicht mehr richtig, sich das Molekül als Zweizustandssystem vorzustellen. Es muss vielmehr als Achtzustandssystem betrachtet werden – es gibt für jeden der beiden Zustände | 1 � und | 2 � vier mögliche Spinanordnungen der Protonen – wir haben die Sache also etwas verkürzt dargestellt, indem wir die Spins der Protonen vernachlässigt haben. Unsere Endergebnisse sind jedoch richtig. Wir sehen, dass der niedrigste Energiezustand – der einzige gebundene Zustand – des H2 Moleküls zwei Elektronen mit entgegengesetzten Spins hat. Der Gesamtspin der Elektronen ist null. Andererseits müssen zwei benachbarte Wasserstoffatome mit parallelen Spins – und daher mit einem Gesamtdrehimpuls in einem höheren (ungebundenen) Energiezustand sein. Die Atome stoßen einander ab. Es besteht eine interessante Korrelation zwischen den Spins und den Energien. Damit wird noch einmal etwas veranschaulicht, was wir schon früher erwähnt hatten, nämlich dass es eine „Wechselwirkungsenergie“ zwischen den beiden Spins zu geben scheint, weil im Fall paralleler Spins eine höhere Energie vorliegt als im umgekehrten Fall. In gewissem Sinne könnten Sie sagen, dass die Spins eine antiparallele Einstellung zu erreichen versuchen, und wenn sie dies tun, haben sie die Möglichkeit, Energie freizusetzen, nicht weil eine große magnetische Kraft vorhanden ist, sondern aufgrund des Ausschließungsprinzips. In Abschnitt 10.1 haben wir gesehen, dass eine Bindung von zwei verschiedenen Ionen durch ein einzelnes Elektron recht schwach ist. Dies gilt nicht für die Bindung durch zwei Elektronen. Angenommen, die zwei Protonen in Abbildung 10.4 wurden durch zwei beliebige Ionen (mit abgeschlossenen inneren Elektronenschalen und einer einzigen Ionenladung) ersetzt, und die Bindungsenergien eines Elektrons an die beiden Ionen sind verschieden. Die Energien der Zustände | 1 � und | 2 � wären immer noch gleich, weil wir in jedem dieser Zustände an jedes Ion ein Elektron gebunden haben. Daher ist die Aufspaltung immer proportional zu A. Die ZweiElektronen-Bindung ist überall zu finden – sie ist die häufigste Valenzbindung. Für chemische Bindungen spielt gewöhnlich dieses Wechselspiel der beiden Elektronen eine Rolle. Obwohl zwei Atome durch nur ein Elektron gebunden werden können, ist dies verhältnismäßig selten, weil es genau die richtigen Bedingungen erfordert.
190
10 Andere Zweizustandssysteme
Schließlich möchten wir erwähnen, dass das, was wir früher über die Vernachlässigung anderer möglicher Zustände gesagt haben, nicht mehr richtig ist, wenn die Energie der Anziehung eines Elektrons zu dem einen Kern viel größer ist als zu dem anderen. Angenommen, Kern a (es kann auch ein positives Ion sein) übt eine viel stärkere Anziehung auf ein Elektron aus als Kern b. Es kann dann der Fall eintreten, dass die Gesamtenergie auch dann noch ziemlich niedrig ist, wenn beide Elektronen bei Kern a sind und bei Kern b kein Elektron ist. Die starke Anziehung durch den Kern a kann die gegenseitige Abstoßung der beiden Elektronen überkompensieren. Wenn dies zutrifft, kann der niedrigste Energiezustand eine große Amplitude haben, beide Elektronen bei a zu finden (wodurch ein negatives Ion gebildet wird), und eine kleine Amplitude, ein Elektron bei b zu finden. Der Zustand sieht wie ein negatives Ion mit einem positiven Ion aus. So etwas ereignet sich tatsächlich in einem „ionogenen“ Molekül wie NaCl. Sie können sehen, dass alle Abstufungen zwischen kovalenter Bindung und ionogener Bindung möglich sind. Dieses Beispiel illustriert, warum man vieles in der Chemie am besten mithilfe einer quantenmechanische Beschreibung verstehen kann.
10.4
Das Benzolmolekül
Die Chemiker haben sich hübsche Diagramme ausgedacht, um komplizierte organische Moleküle darzustellen. Wir werden jetzt eins der interessantesten diskutieren – das in Abbildung 10.6 gezeigte Benzolmolekül. Es enthält sechs Kohlenstoff- und sechs Wasserstoffatome in symmetrischer Anordnung. Jeder Strich im Diagramm stellt ein Elektronenpaar mit entgegengesetzten Spins dar, die ihren kovalenten Bindungstanz ausführen. Jedes Wasserstoffatom liefert ein Elektron und jedes Kohlenstoffatom liefert vier Elektronen, um die Gesamtzahl der 30 dann enthaltenen Elektronen zu bilden. (Es gibt noch zwei weitere Elektronen nahe beim Kern des Kohlenstoffs, die die erste oder K-Schale bilden. Diese werden nicht dargestellt, da sie so fest an den Kern gebunden sind, dass sie nicht spürbar an der kovalenten Bindung beteiligt sind.) Jeder Strich in der Abbildung stellt daher eine Bindung oder ein Elektronenpaar dar, und die Doppelstriche stehen für Doppelbindungen, also zwei Elektronenpaare. H C
H
H
H
C
C
C
C C H
H Abb. 10.6: Das Benzolmolekül C6 H6 .
Etwas ist rätselhaft an diesem Benzolmolekül. Wir können berechnen, welche Energie erforderlich ist, um diese chemische Verbindung aufzubauen, denn die Chemiker haben die Energien der verschiedenen Verbindungen gemessen, die in Teilen des Ringes realisiert sind – sie kennen zum Beispiel die Energie einer Doppelbindung aus der Untersuchung des Äthylens usw. Wir können daher die Gesamtenergie, die wir für das Benzolmolekül erwarten würden, aus-
10.4 Das Benzolmolekül
191
rechnen. Die tatsächliche Energie des Benzolringes ist jedoch viel niedriger, als sich aus dieser Rechnung ergibt; er ist fester gebunden, als wir es aus einem so genannten „ungesättigten Doppelbindungssystem“ schließen würden. Ein Doppelbindungssystem, das nicht als Ring vorliegt, wird gewöhnlich chemisch leicht angegriffen, weil es eine relativ hohe Energie hat – die Doppelbindungen können leicht durch Hinzufügen anderer Wasserstoffatome aufgebrochen werden. Aber im Benzol ist der Ring recht dauerhaft und schwer aufzubrechen. Mit anderen Worten, das Benzol hat eine viel niedrigere Energie, als man aus dem Bindungsbild errechnen würde. H
H
C
H
Br C
C (a)
(b) C H
C C H
Br
C
H
H
Br
C
C
C
C C
Br
H
Abb. 10.7: Zwei Möglichkeiten für Ortho-Dibrombenzol. Die beiden Bromatome können durch eine Einfachbindung oder durch eine Doppelbindung separiert sein.
Es gibt noch eine andere rätselhafte Sache. Angenommen, wir ersetzen zwei nebeneinander liegende Wasserstoffatome durch Bromatome, um Ortho-Dibrombenzol herzustellen. Wie aus Abbildung 10.7 ersichtlich ist, kann man dies auf zwei Arten tun. Die Bromatome können sich an den beiden Enden einer Doppelbindung befinden, wie in Teil (a) der Abbildung gezeigt, oder sie können an den beiden Enden einer Einfachbindung sein, wie in Teil (b). Man könnte denken, dass Ortho-Dibrombenzol zwei verschiedene Formen haben sollte, aber das hat es nicht. Es gibt nur eine solche Chemikalie.2 Wir wollen diese Rätsel jetzt auflösen – und vielleicht ahnen Sie schon wie: natürlich indem wir bemerken, dass der „Grundzustand“ des Benzolringes in Wirklichkeit ein Zweizustandssystem ist. Wir könnten uns vorstellen dass die Bindungen im Benzol in jeder der beiden in Abbildung 10.8 gezeigten Anordnungen sein könnten. Sie könnten einwenden: „Sie sind doch aber wirklich gleich, sie sollten also dieselbe Energie haben.“ Das sollten sie tatsächlich. Und aus diesem Grund müssen sie als ein Zweizustandssystem untersucht werden. Jeder Zustand stellt eine andere Anordnung des gesamten Elektronensystems dar, und es gibt eine Amplitude A, dass das Ganze von der einen Anordnung zur anderen wechseln kann. Wie wir gesehen haben, entsteht aus der Möglichkeit des Umklappens ein gemischter Zustand, dessen Energie niedriger ist als der Wert, den man erhält, wenn man jedes der beiden Bilder in Abbildung 10.8 getrennt betrachtet. Stattdessen gibt es zwei stationäre Zustände – einen mit einer Energie über und einen mit einer Energie unter dem erwarteten Wert. Daher entspricht 2
Wir vereinfachen etwas zu stark. Ursprünglich glaubten die Chemiker, dass es vier Formen des Dibrombenzols geben müsse. Zwei Formen mit Bromatomen an benachbarten Kohlenstoffatomen (Ortho-Dibrombenzol), eine dritte Form mit dem zweiten Bromatom am übernächsten Kohlenstoff (Meta-Dibrombenzol) und eine vierte Form, bei der die Bromatome einander gegenüberliegen (Para-Dibrombenzol). Sie fanden jedoch nur drei Formen – es gibt nur eine Form des Ortho-Moleküls.
192
10 Andere Zweizustandssysteme H C
H
C
H
H
C
C
C
C
|2�
C H
H C
C |1�
H
C C
H
H
H
C
H
H
Abb. 10.8: Ein Satz von Basiszuständen für das Benzolmolekül.
der wirkliche normale Zustand (niedrigster Energie) des Benzols keiner √ der in Abbildung 10.8 gezeigten Möglichkeiten, sondern er hat jeweils die Amplitude 1/ 2, in einem der beiden Zustände zu sein. Es ist der einzige Zustand, den die Chemie des Benzols bei normalen Temperaturen zulässt. Übrigens existiert auch der obere Zustand. Wir wissen, dass es ihn gibt, weil Benzol eine starke Absorption für ultraviolettes Licht bei der Frequenz ω = (E I − E II )/ hat. Sie werden sich erinnern, dass beim Ammoniak, wo die hin und her wechselnden Objekte drei Protonen waren, der Energieabstand im Mikrowellenbereich lag. Beim Benzol sind die wechselnden Objekte Elektronen, und da sie viel leichter sind, ist es für sie einfacher hin und her zu springen, wodurch der Koeffizient A viel größer wird. Das Resultat ist, dass die Energiedifferenz viel größer ist – etwa 1,5 eV, was die Energie eines ultravioletten Photons ist.3 Was geschieht, wenn wir Brom substituieren? Wieder stellen die beiden „Möglichkeiten“ (a) und (b) in Abbildung 10.7 die beiden verschiedenen Elektronenkonfigurationen dar. Der einzige Unterschied ist, dass die beiden Basiszustände, von denen wir ausgehen, etwas verschiedene Energien haben. Der stationäre Zustand niedrigster Energie wird immer noch eine Linearkombination der beiden Zustände notwendig machen, aber mit √ ungleichen Amplituden. Die Amplitude√ für Zustand | 1 � könnte beispielsweise den Wert 2/3 haben und für Zustand | 2 � den Wert 1/3. Ohne weitere Informationen können wir es nicht sicher sagen, aber sobald die beiden Energien H11 und H22 nicht mehr gleich sind, haben auch die Amplituden C1 und C2 nicht mehr den gleichen Betrag. Das bedeutet natürlich, dass eine der beiden Möglichkeiten in der Abbildung wahrscheinlicher ist als die andere, die Elektronen sind aber ausreichend beweglich, √ sodass es √ für beide eine Amplitude gibt. Der andere Zustand hat andere Amplituden (etwa 1/3 und − 2/3), liegt aber bei höherer Energie. Es gibt nur einen niedrigsten Zustand und nicht zwei, wie die naive Theorie der festen chemischen Bindungen nahelegen würde. 3
Was wir gesagt haben, ist etwas irreführend. Die Absorption von ultraviolettem Licht wäre in dem Zweizustandssystem, das wir für Benzol angenommen haben, sehr schwach, weil das Matrixelement des Dipolmoments zwischen den beiden Zuständen null ist. (Die beiden Zustände sind elektrostatisch symmetrisch, und daher ist in (9.55), unserer Formel für die Übergangswahrscheinlichkeit, das Dipolmoment μ null und kein Licht wird absorbiert.) Wenn dies die beiden einzigen Zustände wären, müsste die Existenz des höheren Zustandes auf andere Art gezeigt werden. Eine vollständigere Theorie des Benzols, die von mehr Basiszuständen ausgeht (wie von jenen, die benachbarte Doppelbindungen haben), zeigt jedoch, dass die wirklichen stationären Zustände des Benzols etwas anders sind als die, die wir gefunden haben. Die resultierenden Dipolmomente erlauben, dass der erwähnte Übergang durch die Absorption von ultraviolettem Licht auftritt.
10.5 Farbstoffe
10.5
193
Farbstoffe
Betrachten wir ein weiteres chemisches Beispiel für das Zweizustandsphänomen – diesmal in einem größeren molekularen Maßstab. Es hat mit der Theorie der Farbstoffe zu tun. Viele Farbstoffe – tatsächlich die meisten künstlichen Farbstoffe – haben eine interessante Eigenschaft: sie haben eine Art Symmetrie. H2 N
C
|1� + H2 N
|2�
+ NH2
|1� C
NH2
|2�
Abb. 10.9: Zwei Basiszustände für das Molekül des Farbstoffs Magenta.
Abbildung 10.9 zeigt ein Ion eines speziellen Farbstoffes, genannt Magenta, der eine purpurrote Farbe hat. Das Molekül hat drei Ringstrukturen – von denen zwei Benzolringe sind. Der dritte ist nicht genau dasselbe wie ein Benzolring, weil er nur zwei Doppelbindungen innerhalb des Ringes hat. Die Abbildung zeigt zwei denkbare Anordnungen, und wir würden vermuten, dass sie gleiche Energien haben sollten. Es gibt aber eine gewisse Amplitude, dass alle Elektronen von einer Anordnung in die andere umklappen können und dabei die Position der „unbesetzten“ Stelle an das gegenüberliegende Ende verschieben. Wenn so viele Elektronen involviert sind, ist die Umklappamplitude etwas niedriger als im Falle des Benzols und die Energiedifferenz zwischen den beiden stationären Zuständen ist kleiner. Trotzdem gibt es die üblichen beiden stationären Zustände | I � und | II �, die die Summen- bzw. Differenzkombination der in der Abbildung gezeigten Basiszustände sind. Es ergibt sich, dass der Energieabstand zwischen | I � und | II � gleich der Energie eines Photons im optischen Bereich ist. Wenn man Licht auf das Molekül fallen lässt, gibt es bei einer Frequenz eine sehr starke Absorption und es scheint leuchtend gefärbt zu sein. Aus diesem Grund ist es ein Farbstoff! Ein anderes interessantes Merkmal eines solchen Farbstoffmoleküls ist, dass in den beiden gezeigten Basiszuständen der Mittelpunkt der elektrischen Ladung an verschiedenen Orten liegt. Demzufolge sollte das Molekül durch ein äußeres elektrisches Feld stark beeinflusst werden. Wir hatten einen ähnlichen Effekt beim Ammoniakmolekül. Wir können es offensichtlich unter Verwendung genau derselben Mathematik untersuchen, vorausgesetzt wir kennen die Zahlen E0 und A. Im Allgemeinen erhält man diese durch Sammeln experimenteller Daten. Wenn man mit vielen Farben Messungen durchführt, kann man oft erraten, was bei einem verwandten Farbmolekül geschehen wird. Wegen der großen Ortsverschiebung des Mittelpunktes der elektrischen Ladung ist der Wert von μ in der Formel (9.55) groß, und die Substanz hat eine hohe Wahrscheinlichkeit, Licht der charakteristischen Frequenz 2A/ zu absorbieren. Sie ist daher nicht nur leicht, sondern sehr kräftig gefärbt – eine geringe Substanzmenge absorbiert viel Licht. Die Umklappgeschwindigkeit – und damit A – hängt sehr empfindlich von der vollständigen Struktur des Moleküls ab. Durch Änderung von A kann die Energieaufspaltung und damit die
194
10 Andere Zweizustandssysteme
Farbe des Farbstoffes geändert werden. Auch müssen die Moleküle nicht vollkommen symmetrisch sein. Wir haben gesehen, dass dasselbe Grundphänomen mit geringen Abweichungen auch dann vorliegt, wenn es eine schwache Asymmetrie gibt. So kann man die Farben etwas modifizieren, wenn man kleine Asymmetrien in die Moleküle hineinbringt. Zum Beispiel ist ein anderer wichtiger Farbstoff, Malachitgrün, dem Magenta sehr ähnlich, nur sind zwei der Wasserstoffe durch CH3 ersetzt. Es ist eine andere Farbe, weil das A verschoben und die Umklappgeschwindigkeit verändert ist.
10.6
Die Hamilton-Matrix für ein Spin-1/2-Teilchen im Magnetfeld
Wir betrachten nun ein Zweizustandssystem, an dem ein Objekt mit dem Spin 12 beteiligt ist. Einiges von dem, was wir sagen werden, wurde schon in früheren Kapiteln behandelt, aber eine Wiederholung kann dazu beitragen, einige der kniffligen Punkte etwas klarer zu machen. Wir können uns ein ruhendes Elektron als Zweizustandssystem vorstellen. Obwohl wir in diesem Abschnitt über „ein Elektron“ sprechen, wird das, was wir herausfinden werden, für jedes Spin1 2 -Teilchen gelten. Als Basiszustände | 1 � und | 2 � wählen wir die Zustände, in denen die zKomponente des Spins des Elektrons +/2 bzw. −/2 ist. Diese Zustände sind natürlich diejenigen, die wir in früheren Kapiteln (+) und (−) genannt haben. Um die Schreibweise dieses Kapitels jedoch einheitlich zu halten, nennen wir den „Plus“Spinzustand | 1 � und den „Minus“-Spinzustand | 2 � – wobei sich „plus“ und „minus“ auf den Drehimpuls in z-Richtung beziehen. Ein möglicher Zustand ψ für das Elektron kann wie in (10.1) beschrieben werden durch Angabe der Amplitude C1 , dass das Elektron im Zustand | 1 � ist, und der Amplitude C2 , dass es im Zustand | 2 � ist. Um dieses Problem zu behandeln, benötigen wir die Hamilton-Matrix für dieses Zweizustandssystem – das heißt, für ein Elektron in einem magnetischen Feld. Wir beginnen mit dem Spezialfall eines magnetischen Feldes in z-Richtung. Angenommen, der Vektor B hätte nur eine z-Komponente Bz. Aus der Definition der beiden Basiszustände (Spins parallel bzw. antiparallel zu B) wissen wir, dass sie schon stationäre Zustände mit einer bestimmten Energie in dem magnetischen Feld sind. Der Zustand | 1 � entspricht einer Energie4 −μBz und der Zustand | 2 � einer Energie +μBz. Die Hamilton-Matrix ist in diesem Fall sehr einfach, da die Amplitude C1 , im Zustand | 1 � zu sein, nicht durch C2 beeinflusst wird und umgekehrt: dC1 = E1C1 = −μBzC1 , dt dC2 = E2C2 = +μBzC2 . i dt i
4
(10.17)
Wir nehmen die Ruheenergie m0 c2 als unseren „Energienullpunkt“ und behandeln das magnetische Moment μ des Elektrons als negative Zahl, da es in eine dem Spin entgegengesetzte Richtung zeigt.
10.6 Die Hamilton-Matrix für ein Spin-1/2-Teilchen im Magnetfeld
195
In diesem Spezialfall ist die Hamilton-Matrix H11 = −μBz ,
H21 = 0 ,
H12 = 0 , H22 = +μBz .
(10.18)
Wir wissen also, wie die Hamilton-Matrix für ein magnetisches Feld in z-Richtung aussieht, und wir kennen die Energien der stationären Zustände. Nun nehmen wir an, dass das Feld nicht in z-Richtung verläuft. Wie sieht dann die HamiltonMatrix aus? Wie ändern sich die Matrixelemente, wenn das Feld nicht in z-Richtung weist? Wir nehmen an, dass es eine Art von Superpositionsprinzip für die Terme der Hamilton-Matrix gibt: Bei einer Überlagerung von zwei magnetischen Feldern sollen sich die Terme in der HamiltonMatrix einfach addieren – wenn wir das Hi j für ein reines Bz und das Hi j für ein reines B x kennen, dann ist das Hi j für Bz und B x zusammen einfach die Summe. Dies gilt mit Sicherheit, wenn wir nur Felder in z-Richtung betrachten – wenn wir Bz verdoppeln, dann werden alle Hi j verdoppelt. Nehmen wir also an, dass H linear vom Feld B abhängt. Das ist alles, was wir brauchen, um Hi j für jedes magnetische Feld ermitteln zu können. Betrachten wir ein konstantes Feld B. Wir hätten unsere z-Achse in seine Richtung legen können und wir hätten zwei stationäre Zustände mit den Energien ∓μB gefunden. Dass wir unsere Achsen in eine andere Richtung legen, ändert nichts an der Physik. Unsere Beschreibung der stationären Zustände wird zwar anders sein, aber ihre Energien werden immer noch ∓μB sein. Es gilt daher E I = −μ B2x + B2y + B2z (10.19) und E II = +μ
B2x + B2y + B2z .
Der Rest ist einfach. Wir haben hier die Formeln für die Energien. Wir suchen eine HamiltonMatrix, die linear in B x , By und Bz ist und die diese Energien ergibt, wenn sie in unserer allgemeinen Formel (10.3) angewandt wird. Das Problem besteht also darin, die Hamilton-Matrix zu finden. Dazu nutzen wir aus, dass die Energieaufspaltung symmetrisch um einen Mittelwert null ist. Wenn wir uns (10.3) ansehen, können wir direkt einsehen, dass dies erfordert H22 = −H11 .
(Beachten Sie, dass dies mit dem übereinstimmt, was wir schon wissen, wenn B x und By beide null sind; in diesem Fall ist H11 = −μBz und H22 = μBz .) Wenn wir nun die Energien von (10.3) mit dem, was wir aus (10.19) wissen, gleichsetzen, erhalten wir H − H 2 11 22 + |H12 |2 = μ2 (B2x + B2y + B2z ) . 2
(10.20)
∗ (Wir haben auch die Tatsache benutzt, dass H21 = H12 ist, sodass H12 H21 auch als |H12 |2 geschrieben werden kann.) Für den Spezialfall eines Feldes in z-Richtung ergibt dies wieder
μ2 B2z + |H12 |2 = μ2 B2z .
196
10 Andere Zweizustandssysteme
Offensichtlich muss |H12 | in diesem Spezialfall null sein, was bedeutet, dass H12 keinen Term mit Bz enthalten kann. (Bedenken Sie, dass wir gesagt haben, dass alle Terme in B x , By und Bz linear sein müssen.) Bis jetzt haben wir also herausbekommen, dass H11 und H22 Terme mit Bz haben, während H12 und H21 dies nicht haben. Wir können einen einfachen Ansatz machen, der (10.20) befriedigt, nämlich H11 = −μBz H22 = μBz 2
2
|H12 | = μ
(B2x
(10.21) +
B2y ) .
Und es stellt sich heraus, dass dies die einzige mögliche Lösung ist! „Halt“ – sagen Sie – „H12 ist nicht linear in B; (10.21) ergibt H12 = μ dingt. Es gibt eine andere Möglichkeit, die linear ist, nämlich
B2x + B2y .“ Nicht unbe-
H12 = μ(B x + iBy ) . Es gibt tatsächlich mehrere solche Möglichkeiten – ganz allgemein können wir schreiben H12 = μ(B x ± iBy )eiδ , wobei δ eine beliebig gewählte Phase ist. Welches Vorzeichen und welche Phase sollten wir benutzen? Es stellt sich heraus, dass Sie jedes Vorzeichen und jede Phase, die Sie wollen, wählen können – die physikalischen Ergebnisse werden immer die gleichen sein. Daher ist die Wahl eine Frage der Konvention. Die Physiker vor uns haben beschlossen, das Minuszeichen zu verwenden und eiδ = −1 zu setzen. Wir können das auch so machen und schreiben H12 = −μ(B x − iBy ) ,
H21 = −μ(B x + iBy ) .
(Übrigens hängen diese Konventionen mit einigen der Festlegungen zusammen, die wir in Kapitel 6 getroffen haben, und sind mit ihnen verträglich.) Die vollständige Hamilton-Matrix für ein Elektron in einem beliebigen magnetischen Feld ist damit H11 = −μBz ,
H21 = −μ(B x + iBy ) ,
H12 = −μ(B x − iBy ) , H22 = +μBz .
(10.22)
Und die Gleichungen für die Amplituden C1 und C2 sind dC1 = −μ BzC1 + (B x − iBy)C2 , dt dC2 = −μ (B x + iBy)C1 − BzC2 . i dt
i
(10.23)
Wir haben damit die „Bewegungsgleichungen für die Spinzustände“ eines Elektrons in einem magnetischen Feld ermittelt. Wir haben den Ansatz mit Hilfe einiger physikalischer Argumente erraten, aber der wirkliche Test der Hamilton-Matrix besteht darin, dass sie zu Vorhersagen
10.7 Das rotierende Elektron im Magnetfeld
197
führt, die in Übereinstimmung mit dem Experiment stehen. Nach allen Tests, die durchgeführt wurden, sind diese Gleichungen richtig. Zwar sind wir bei unserer Argumentation von konstanten Feldern ausgegangen, doch gilt die Hamilton-Matrix, die wir aufgeschrieben haben, tatsächlich auch für zeitlich veränderliche Magnetfelder. Daher können wir die Gleichungen (10.23) für alle möglichen interessanten Problemen benutzen.
10.7
Das rotierende Elektron im Magnetfeld
Beispiel Nummer eins: Wir beginnen mit einem konstanten Feld in z-Richtung. Es gibt nur die beiden stationären Zustände mit den Energien ∓μBz . Dann fügen wir ein schwaches Feld in x-Richtung hinzu. Die zugehörigen Gleichungen sehen wie unser altes Zweizustandsproblem aus. Wieder bekommen wir dieses Umklappen, und die Energieniveaus werden etwas stärker aufgespalten. Nun wollen wir die x-Komponente des Feldes zeitlich variieren lassen – zum Beispiel wie cos ωt. Die Gleichungen sind dann wie in Kapitel 9, wo wir ein oszillierendes elektrisches Feld an das Ammoniakmolekül angelegt haben. Sie können die Einzelheiten auf dieselbe Art herleiten. Sie werden das Ergebnis erhalten, dass das oszillierende Feld Übergänge aus dem +z-Zustand in den −z-Zustand und umgekehrt verursacht, wenn das horizontale Feld fast mit der Resonanzfrequenz ω0 = 2μBz / oszilliert. Dies ergibt die quantenmechanische Theorie der magnetischen Resonanzphänomene, die wir in Kapitel 6 von Band IV beschrieben haben. Es ist auch möglich, einen Maser zu bauen, der ein Spin- 21 -System verwendet. Man benutzt einen Stern-Gerlach-Apparat, um beispielsweise einen Strahl von in +z-Richtung polarisierten Teilchen herzustellen, die in einen Hohlraum mit einem konstanten magnetischen Feld geschickt werden. Die zusätzlichen oszillierenden Felder im Hohlraum können an die magnetischen Momente koppeln und Übergänge induzieren, die Energie an den Hohlraum abgeben. Betrachten wir nun ein magnetisches Feld B, dessen Richtung durch den Polarwinkel θ und den Azimutwinkel φ gegeben ist, wie in Abbildung 10.10. Nehmen wir außerdem an, dass ein Elektron vorhanden ist, dessen Spin in diese Feldrichtung zeigt. Was sind die Amplituden C1 und C2 für dieses Elektron? Wir wollen also den Zustand | ψ � des Elektrons in der Form z
B
θ
y x
φ
Abb. 10.10: Die Richtung von B ist durch den Polarwinkel θ und den Azimutwinkel φ gegeben.
198
10 Andere Zweizustandssysteme
schreiben | ψ � = | 1 � C1 + | 2 � C2 .
Dabei sind C1 und C2 gegeben durch C1 = � 1 | ψ � ,
C2 = � 2 | ψ � .
wobei wir mit | 1 � und | 2 � dasselbe meinen, was wir gewöhnlich mit | + � bzw. | − � bezeichnet haben (bezüglich unserer gewählten z-Achse). Die Antwort auf diese Frage steckt auch in unseren allgemeinen Gleichungen für Zweizustandssysteme. Zunächst wissen wir, dass sich das Elektron, da sein Spin parallel zu B ist, in einem stationären Zustand mit der Energie E I = −μB befindet. Daher müssen C1 und C2 wie in (9.18) gemäß e−iEI t/ variieren, und ihre Koeffizienten a1 und a2 sind durch (10.5) gegeben, nämlich a1 H12 = . a2 E I − H11
(10.24)
Eine zusätzliche Bedingung ist, dass a1 und a2 so normiert sein sollen, dass |a1 |2 + |a2 |2 = 1 gilt. Wir können H11 und H12 aus (10.22) entnehmen unter Benutzung von Bz = B cos θ ,
B x = B sin θ cos φ ,
By = B sin θ sin φ .
Damit ergibt sich H11 = −μB cos θ ,
H12 = −μB sin θ (cos φ − i sin φ) .
(10.25)
Der Klammerausdruck in der zweiten Gleichung ist übrigens e−iφ , sodass wir einfacher schreiben können H12 = −μB sin θ e−iφ .
(10.26)
a1 sin θ e−iφ . = a2 1 − cos θ
(10.27)
θ −iφ a1 cos 2 e = . θ a2 sin 2
(10.28)
Wenn wir diese Matrixelemente in (10.24) einsetzen und −μB aus Zähler und Nenner herauskürzen, finden wir
Mit diesem Verhältnis und der Normierungsbedingung können wir a1 und a2 bestimmen. Das ist zwar nicht schwer, aber mit einem kleinen Trick können wir es ganz kurz machen. Beachten Sie, dass 1 − cos θ = 2 sin2 (θ/2) und sin θ = 2 sin(θ/2) cos(θ/2) ist. Damit wird (10.27) zu
Daher ist eine mögliche Lösung a1 = cos
θ −iφ e , 2
θ a2 = sin , 2
(10.29)
10.7 Das rotierende Elektron im Magnetfeld
199
denn sie erfüllt (10.28) sowie |a1 |2 + |a2 |2 = 1 .
Wie Sie wissen, ändert die Multiplikation von a1 und a2 mit einem beliebigen Phasenfaktor nichts. Man zieht es im Allgemeinen vor, die Gleichungen (10.29) zu symmetrisieren, indem man beide mit eiφ/2 multipliziert. Daher ist die gewöhnlich benutzte Form θ −iφ/2 θ e , a2 = sin e+iφ/2 , (10.30) 2 2 und das ist auch die Antwort auf unsere Frage. Die Zahlen a1 und a2 sind die Amplituden, ein Elektron mit Spin up bzw. down längs der z-Achse zu finden, wenn wir wissen, dass das Elektron bezüglich der durch θ und φ bestimmten Achse den Spin up hat. (Die Amplituden C1 und C2 sind einfach a1 und a2 mal e−iEI t/ .) a1 = cos
Nun bemerken wir etwas Interessantes. Die Stärke B des magnetischen Feldes tritt in (10.30) überhaupt nicht auf. Das Ergebnis ist offenbar dasselbe im Grenzfall, dass B gegen null geht. Dies bedeutet, dass wir die Frage, wie man ein Teilchen darzustellen hat, dessen Spin in eine beliebige Richtung zeigt, ganz allgemein beantwortet haben. Die Amplituden von (10.30) sind die Projektionsamplituden für Spin- 21 -Teilchen entsprechend den Projektionsamplituden, die wir in Kapitel 5 für Spin-eins-Teilchen angegeben haben (vgl. (5.38)). Wir können nun für gefilterte Strahlen von Spin- 21 -Teilchen die Amplituden bestimmen, dass sie durch ein spezielles Stern-Gerlach-Filter gehen. Sei | +z � die Darstellung eines Zustandes mit Spin up längs der z-Achse und | −z � die Darstellung des Zustandes mit Spin down. Wenn | +z� � einen Zustand mit Spin up längs einer z� -Achse darstellt, die die Polarwinkel θ und φ mit der z-Achse bildet, dann erhalten wir in der Schreibweise von Kapitel 5 � +z | +z� � = cos
θ −iφ/2 e , 2
� −z | +z� � = sin
θ +iφ/2 e . 2
(10.31)
Diese Ergebnisse entsprechen dem, was wir in Kapitel 6 durch rein geometrische Überlegungen gefunden haben (vgl. (6.36)). Falls Sie Kapitel 6 übersprungen haben, kennen Sie nun zumindest die wesentlichen Ergebnisse. Als letztes Beispiel betrachten wir noch einmal ein schon mehrfach erwähntes Problem. Wir beginnen mit einem Elektron, dessen Spin in eine gegebene Richtung zeigt, und legen für 25 Minuten ein Magnetfeld in z-Richtung an. Was ist der Endzustand? Wir wollen den Zustand wieder durch die Linearkombination | ψ � = | 1 � C1 + | 2 � C2 darstellen. Bei diesem Problem sind jedoch die Zustände mit bestimmter Energie auch unsere Basiszustände | 1 � und | 2 �. Daher ändern sich C1 und C2 nur in der Phase. Wie wir wissen, gilt C1 (t) = C1 (0) e−iEI t/ = C1 (0) e+iμBt/ und C2 (t) = C2 (0) e−iEII t/ = C2 (0) e−iμBt/ . Wir sagten nun anfangs, dass der Elektronenspin eine gegebene Richtung hat. Das bedeutet, dass anfangs C1 und C2 zwei durch (10.30) gegebene Zahlen sind. Nachdem wir eine Zeitspanne T gewartet haben, sind die neuen C1 und C2 dieselben zwei Zahlen, multipliziert mit eiμBz T/
200
10 Andere Zweizustandssysteme
bzw. e−iμBz T/ . Was für ein Zustand ist das? Das ist einfach. Es ist genau derselbe, wie wenn der Azimutwinkel φ durch Subtraktion von 2μBzT/ geändert worden wäre und der Winkel θ unverändert geblieben wäre. Das bedeutet, dass nach Ablauf der Zeit T der Zustand | ψ � ein Elektron darstellt, das in eine Richtung orientiert ist, die sich von der ursprünglichen Richtung nur durch eine Drehung um die z-Achse um den Winkel Δφ = 2μBz T/ unterscheidet. Da dieser Winkel proportional zu T ist, können wir sagen, dass die Spinrichtung mit der Winkelgeschwindigkeit 2μBz / um die z-Achse präzediert. Dieses Ergebnis haben wir vorher schon einige Male in einer weniger vollständigen und ausführlichen Art besprochen. Jetzt haben wir eine vollständige und genaue quantenmechanische Beschreibung der Präzession atomarer Magnete erhalten. Es ist interessant, dass die mathematischen Ideen, die wir gerade für das rotierende Elektron in einem magnetischen Feld untersucht haben, auf jedes andere Zweizustandssystem angewandt werden können. Das bedeutet, dass durch mathematische Analogie zum Elektron mit Spin jedes Problem hinsichtlich von Zweizustandssystemen rein geometrisch gelöst werden kann. Das geht folgendermaßen. Zuerst verschieben Sie den Energienullpunkt so, dass (H11 + H22 ) gleich null ist, sodass also H11 = −H22 ist. Dann ist jedes Zweizustandsproblem formal dasselbe wie das Problem des Elektrons in einem magnetischen Feld. Sie brauchen nur −μBz mit H11 und −μ(B x − iBy ) mit H12 zu identifizieren. Ganz gleich, welche Physik ursprünglich vorliegt – ein Ammoniakmolekül oder was auch immer – Sie können es in ein entsprechendes Elektronenproblem übersetzen. Wenn wir daher das Elektronenproblem allgemein lösen können, haben wir alle Zweizustandsprobleme gelöst. Und wir kennen die allgemeine Lösung für das Elektron! Angenommen, Sie betrachten einen Zustand, in dem der Spin anfangs in irgendeine Richtung „up“ ist, und Sie haben ein magnetisches Feld B, das in eine andere Richtung zeigt. Sie drehen einfach die Spinrichtung um die Achse von B mit der vektoriellen Winkelgeschwindigkeit ω(t), die gleich einer Konstanten mal dem Vektor B ist (nämlich ω = 2μB/). Da sich B zeitlich verändert, bewegen Sie laufend die Drehachse, um sie parallel zu B zu halten, und Sie ändern fortwährend den Betrag der Winkelgeschwindigkeit, sodass er immer proportional zur Stärke von B ist (siehe Abbildung 10.11). Wenn Sie dies ständig tun, werden Sie mit einer gewissen Endorientierung der Spinachse aufhören und die Amplituden C1 und C2 sind einfach durch die Projektionen – unter Verwendung von (10.30) – in Ihr Koordinatensystem gegeben. Sie sehen, es ist nur ein geometrisches Problem, und es kommt vor allem darauf an, im Auge zu behalten, wo Sie nach all den Drehungen ankommen. Obwohl leicht zu sehen ist, worum es geht, ist dieses geometrische Problem (das Endergebnis einer Drehung mit veränderlicher vektorieller Winkelgeschwindigkeit zu finden) im allgemeinen Fall nicht ohne Weiteres explizit zu lösen. Immerhin sehen wir im Prinzip die allgemeine Lösung für jedes Zweizustandsproblem. Im nächsten Kapitel werden wir uns die mathematische Behandlung des wichtigen Falles eines Spin- 21 -Teilchens – und damit die Behandlung von Zweizustandssystemen im Allgemeinen – näher ansehen.
B(t)
rotiert mit ω(t) Spin
Abb. 10.11: Die Spinrichtung eines Elektrons in einem veränderlichen Magnetfeld B(t) präzediert mit der Frequenz ω(t) um eine zu B parallele Achse.
11
Weitere Zweizustandssysteme
Siehe auch: Band II, Kapitel 8, Polarisation
11.1
Die Pauli-Matrizen
Wir setzen unsere Diskussion von Zweizustandssystemen fort. Am Ende des vorangegangenen Kapitels sprachen wir über ein Spin- 21 -Teilchen in einem magnetischen Feld. Wir beschreiben den Spinzustand durch Angabe der Amplitude C1 , dass die z-Komponente des Spins +/2 ist, und der Amplitude C2 , dass sie −/2 ist. In früheren Kapiteln haben wir diese Basiszustände | + � und | − � genannt. Wir werden nun auf diese Schreibweise zurückkommen, gelegentlich aber auch | + � oder | 1 � sowie | − � oder | 2 � benutzen.
Wie wir im vorangegangenen Kapitel festgestellt haben, sind die Amplituden C+ (= C1 ) und C− (= C2 ) für ein Spin- 21 -Teilchen mit dem magnetischen Moment μ, das sich in einem Magnetfeld B = (B x, By , Bz) befindet, durch folgende Differentialgleichungen miteinander verknüpft: dC+ = −μ BzC+ + (B x − iBy )C− , dt dC− = −μ[(B x + iBy )C+ − BzC− ] . i dt
i
(11.1)
Die Hamilton-Matrix Hi j ist also H11 = −μBz ,
H21 = −μ (B x + iBy ) ,
H12 = −μ (B x − iBy ) , H22 = +μBz .
(11.2)
Die Gleichungen (11.1) können natürlich auch in der Form i
dCi = Hi j C j dt j
geschrieben werden, wobei i und j die Werte + und − (oder 1 und 2) annehmen.
(11.3)
Das Zweizustandssystem des Elektronenspins ist so wichtig, dass es sehr nützlich ist, eine günstigere Notation zu haben. Wir wollen nun eine kleine mathematische Abschweifung machen, um zu zeigen, wie man gewöhnlich die Gleichungen für ein Zweizustandsproblem schreibt. Dabei geht man wie folgt vor: Da jeder Term in der Hamilton-Matrix proportional zu μ und einer Komponente von B ist, können wir – rein formal – schreiben Hi j = −μ σixj B x + σyi j By + σizj Bz . (11.4)
202
11 Weitere Zweizustandssysteme
Es liegt hier keine neue Physik vor; diese Gleichung bedeutet nur, dass die Koeffizienten σixj , σyi j und σzij – es gibt 4 × 3 = 12 von ihnen – so bestimmt werden können, dass (11.4) identisch mit (11.2) ist. Schauen wir, wie sie aussehen müssen. Wir beginnen mit Bz. Da Bz nur in H11 und H22 auftritt, wird alles in Ordnung sein, wenn σz11 = 1 σz21 = 0
σz12 = 0 , σz22 = −1 .
Wir schreiben die Matrix Hi j oft in der Form ⎛ ⎞ ⎜⎜⎜H11 H12 ⎟⎟⎟ ⎜ ⎟⎟⎠ . Hi j = ⎜⎝ H21 H22
Für die Hamilton-Matrix eines Spin- 21 -Teilchens im magnetischen Feld Bz ist dies dasselbe wie ⎛ ⎞ ⎜⎜⎜ −μ(B x − iBy )⎟⎟⎟ −μBz ⎟⎟⎠ . ⎜ Hi j = ⎜⎝ −μ(B x + iBy) +μBz
Ebenso können wir die Koeffizienten σzij als Matrix schreiben: σzij
⎛ ⎜⎜1 = ⎜⎜⎜⎝ 0
⎞ 0 ⎟⎟⎟ ⎟⎟⎠ . −1
(11.5)
Wenn wir die Koeffizienten von B x behandeln, ergibt sich x =0 σ11
x σ12 = 1,
x σ21 =1
x σ22 = 0,
oder abgekürzt σixj
⎛ ⎞ ⎜⎜⎜0 1⎟⎟⎟ ⎜ ⎟⎟⎠ . = ⎜⎝ 1 0
(11.6)
Wenn wir schließlich By betrachten, erhalten wir σy11 = 0 σy21 = i
σy12 = −i , σy22 = 0
oder σyi j
⎛ ⎞ ⎜⎜⎜0 −i⎟⎟⎟ ⎟⎟⎠ . = ⎜⎜⎝ i 0
(11.7)
Mit diesen drei Sigma-Matrizen sind die Gleichungen (11.2) und (11.4) identisch. Da der Platz für die Indizes i und j bereits vergeben ist, kennzeichnen wir durch einen oberen Index x, y
11.1 Die Pauli-Matrizen
203
oder z, welches σ zu welcher Komponente von B gehört. Gewöhnlich werden jedoch die i und j weggelassen – es ist leicht, sich vorzustellen, dass sie da sind – und die x, y, z werden dann als untere Indizes geschrieben. Damit wird (11.4) zu H = −μ[σ x B x + σy By + σz Bz] .
(11.8)
Weil die Sigma-Matrizen so wichtig sind und von den Physikern andauernd benutzt werden, haben wir sie in Tabelle 11.1 zusammengestellt. (Jeder, der wirklich in der Quantenphysik arbeiten will, muss sie im Kopf haben.) Sie werden nach dem Physiker, der sie eingeführt hat, auch Pauli-Matrizen genannt. Tabelle 11.1: Die Pauli-Matrizen
1 0 σz = 0 −1 0 1 σx = 1 0 0 −i σy = i 0 1 0 1= 0 1 In die Tabelle haben wir eine weitere 2 × 2-Matrix aufgenommen, die wir benötigen, um ein System mit zwei Spinzuständen derselben Energie zu behandeln, oder wenn wir eine andere Nullpunktsenergie wählen wollen. Für solche Situationen müssen wir E0C+ zu der ersten Gleichung in (11.1) und E0C− zu der zweiten Gleichung addieren. Wir können dies in die neue Schreibweise einbeziehen, wenn wir die Einheitsmatrix „1“ als δi j definieren, 1 0 1 = δi j = , (11.9) 0 1 und (11.8) in der ergänzten Form H = E0 δi j − μ σ x B x + σy By + σz Bz
(11.10)
schreiben. Gewöhnlich wird stillschweigend angenommen, dass Konstanten wie E0 mit der Einheitsmatrix zu multiplizieren sind; dann schreibt man einfach H = E0 − μ σ x B x + σy By + σz Bz . (11.11)
Ein Grund, warum die Spinmatrizen nützlich sind, besteht darin, dass jede 2 × 2-Matrix durch sie ausgedrückt werden kann. Jede Matrix, die Sie schreiben können, enthält vier Zahlen, sagen wir a b M= . c d
204
11 Weitere Zweizustandssysteme
Sie kann immer als Linearkombination von vier Matrizen geschrieben werden, zum Beispiel 1 0 0 1 0 0 0 0 M=a +b +c +d . 0 0 0 0 1 0 0 1 Es gibt dafür viele Möglichkeiten, aber eine spezielle Methode besteht darin zu sagen, dass M aus einem gewissen Anteil von σ x plus einem gewissen Anteil von σy und so weiter besteht, etwa so: M = α1 + βσ x + γσy + δσz , wobei die „Anteile“ α, β, γ und δ im Allgemeinen komplexe Zahlen sein können. Da jede 2×2-Matrix durch die Einheitsmatrix und die Sigma-Matrizen dargestellt werden kann, haben wir alles, was wir für beliebige Zweizustandssysteme benötigen. Ganz gleich, was für ein Zweizustandssystem vorliegt – das Ammoniakmolekül, der Magenta-Farbstoff oder was auch immer – die hamiltonsche Gleichung kann durch die Sigmas ausgedrückt werden. Obwohl die Sigmas in der physikalischen Situation eines Elektrons in einem magnetischen Feld eine geometrische Bedeutung zu haben scheinen, kann man sie auch einfach als nützliche Matrizen ansehen, die für jedes Zweizustandsproblem benutzt werden können. Bei einer bestimmten Betrachtungsweise können zum Beispiel Proton und Neutron als dasselbe Teilchen in zwei verschiedenen Zuständen angesehen werden. Wir sagen, das Nukleon (Proton oder Neutron) ist ein Zweizustandssystem – in diesem Falle zwei Zustände bezüglich seiner Ladung. Wenn wir es so betrachten, kann der | 1 �-Zustand das Proton und der | 2 �-Zustand das Neutron darstellen. Man sagt, dass das Nukleon zwei „Isospin“-Zustände hat. Da wir die Sigma-Matrizen als „Arithmetik“ der Quantenmechanik von Zweizustandssystemen verwenden wollen, möchten wir kurz die Regeln der Matrizenalgebra wiederholen. Unter der „Summe“ zweier oder mehrerer Matrizen verstehen wir einfach das, was in Gleichung (11.4) offensichtlich war. Wenn wir ganz allgemein zwei Matrizen A und B „addieren“, dann bedeutet die „Summe“ C, dass jeder Term Ci j gegeben ist durch C i j = Ai j + Bi j . Jeder Term von C ist die Summe der Ausdrücke, die bei A und B an derselben Stelle stehen. In Abschnitt 5.6 sind wir schon dem Begriff des „Produktes“ einer Matrix begegnet. Dieser Begriff wird auch bei der Behandlung der Sigma-Matrizen nützlich sein. Im Allgemeinen ist das „Produkt“ von zwei Matrizen A und B (in dieser Reihenfolge) als Matrix C mit folgenden Elementen definiert: Ci j = Aik Bk j . (11.12) k
Sie besteht aus der Summe der Produkte von Termen, die paarweise aus der i-ten Zeile von A und der j-ten Spalte von B genommen werden. Wenn man die Matrizen in Tabellenform wie in Abbildung 11.1 ausschreibt, dann gibt es ein gutes „System“, die Terme der Produktmatrix zu erhalten. Angenommen, Sie berechnen C23 . Sie lassen Ihren linken Zeigefinger die zweite Zeile von A entlanglaufen und Ihren rechten Zeigefinger die dritte Spalte von B herablaufen, wobei
11.1 Die Pauli-Matrizen ⎛ ⎜⎜⎜A11 ⎜⎜⎜A ⎜⎜⎜ 21 ⎜⎜⎜A31 ⎜⎝ A41
A12 A22 A32 A42
A13 A23 A33 A43
205
⎞ ⎛ A14 ⎟⎟ ⎜⎜ B11 ⎟ ⎜ A24 ⎟⎟⎟⎟⎟ ⎜⎜⎜⎜⎜ B21 ⎟·⎜ A34 ⎟⎟⎟⎟ ⎜⎜⎜⎜ B31 ⎠ ⎝ A44 B41
⎞ ⎛ B12 B13 B14 ⎟⎟ ⎜⎜C11 ⎟ ⎜ B22 B23 B24 ⎟⎟⎟⎟⎟ ⎜⎜⎜⎜⎜C21 ⎟=⎜ B32 B33 B34 ⎟⎟⎟⎟ ⎜⎜⎜⎜C31 ⎠ ⎝ B42 B43 B44 C41 � Aik Bk j Ci j = k
C12 C22 C32 C42
C13 C23 C33 C43
Beispiel: C23 = A21 B13 + A22 B23 + A23 B33 + A24 B43
⎞ C14 ⎟⎟ ⎟ C24 ⎟⎟⎟⎟⎟ ⎟ C34 ⎟⎟⎟⎟ ⎠ C44 Abb. 11.1: Multiplikation zweier Matrizen.
Sie jedes Paar multiplizieren und zum vorhergehenden addieren. In Abbildung 11.1 haben wir versucht darzustellen, wie es gemacht wird. Besonders einfach ist es natürlich für 2 × 2-Matrizen. Wenn wir zum Beispiel σ x mit σ x multiplizieren, erhalten wir � � � � � � 0 1 0 1 1 0 σ2x = σ x · σ x = · = , 1 0 1 0 0 1
was gerade die Einheitsmatrix ist. Oder berechnen wir als weiteres Beispiel σ x · σy : � � � � � � 0 1 0 −i i 0 · = . σ x · σy = 1 0 i 0 0 −i
Wenn Sie Tabelle 11.1 berücksichtigen, sehen Sie, dass das Produkt gerade i mal die Matrix σz ist. (Beachten Sie, dass die Multiplikation einer Zahl mit einer Matrix bedeutet, dass einfach jedes Matrixelement zu multiplizieren ist.) Da die Produkte der Sigmas, wenn man jedes Mal zwei zusammennimmt, wichtig sind – und auch recht amüsant –, haben wir sie in Tabelle 11.2 zusammengestellt. Sie können sie ebenso berechnen, wie wir es für σ2x und σ x · σy gemacht haben. Tabelle 11.2: Produkte der Spinmatrizen
σ2x = 1 σ2y = 1 σ2z = 1 σ x σy = −σy σ x = iσz σy σz = −σz σy = iσ x
σz σ x = −σ x σz = iσy Es gibt bei diesen σ-Matrizen einen weiteren sehr wichtigen und interessanten Punkt. Wir können uns vorstellen, dass die drei Matrizen σ x , σy und σz analog zu den drei Komponenten eines Vektors sind – er wird manchmal „Sigma-Vektor“ genannt und σ geschrieben. Tatsächlich ist er ein „Matrixvektor“ oder eine „Vektormatrix“. Das bedeutet drei verschiedene Matrizen – wobei zu jeder Achse x, y und z eine Matrix gehört. Damit können wir die Hamilton-Matrix des Systems in einer kompakten Form schreiben, die in jedem Koordinatensystem gültig ist: H = −μ σ · B .
(11.13)
206
11 Weitere Zweizustandssysteme
Obwohl wir unsere drei Matrizen in einer Darstellung geschrieben haben, in der „oben“ und „unten“ in z-Richtung gemeint sind – sodass σz besonders einfach ist –, könnten wir berechnen, wie die Matrizen in einer anderen Darstellung aussehen würden. Es erfordert zwar eine längere Rechnung, doch Sie können zeigen, dass sie sich untereinander wie die Komponenten eines Vektors ändern. (Wir sparen uns hier diese Rechnung. Sie können es nachprüfen, wenn Sie wollen.) Sie können σ in verschiedenen Koordinatensystemen verwenden, so als wäre es ein Vektor. Sie erinnern sich, dass das H in der Quantenmechanik mit der Energie verknüpft ist. Tatsächlich ist es unter einfachen Verhältnissen, bei denen es nur einen Zustand gibt, gerade gleich der Energie. Sogar für die Zweizustandssysteme des Elektronenspins, wenn wir die Hamilton-Matrix wie in (11.13) schreiben, ähnelt sie sehr stark der klassischen Formel für die Energie eines kleinen Magneten mit dem magnetischen Moment μ in einem magnetischen Feld B. Klassisch würden wir schreiben U = −μ · B,
(11.14)
wobei μ die Eigenschaft des Objektes und B ein äußeres Feld ist. Wir können uns vorstellen, dass (11.14) in (11.13) umgewandelt werden kann, wenn wir die klassische Energie durch die Hamilton-Matrix und das klassische μ durch die Matrix μσ ersetzen. Nach dieser rein formalen Substitution interpretieren wir dann das Ergebnis als Matrixgleichung. Man sagt manchmal, dass jeder Größe der klassischen Physik in der Quantenmechanik eine Matrix entspricht. Genauer wäre es zu sagen, dass die Hamilton-Matrix der Energie entspricht und dass jede Größe, die über die Energie definiert werden kann, eine entsprechende Matrix hat. Zum Beispiel kann das magnetische Moment über die Energie definiert werden, indem man sagt, dass die Energie in einem äußeren Feld B gleich −μ · B ist. Damit ist der Vektor μ des magnetischen Moments definiert. Dann betrachten wir die Formel für die Hamilton-Matrix für ein reales (Quanten-)Objekt in einem magnetischen Feld und versuchen zu bestimmen, welches die Matrizen sind, die den Größen in der klassischen Formel entsprechen. Das ist der Trick, durch den manchmal klassische Größen ihr Gegenstück in der Quantenwelt erhalten. Wenn Sie wollen, können Sie überlegen, inwieweit ein klassischer Vektor μ gleich einer Matrix μσ ist, und vielleicht werden Sie etwas herausfinden – aber zerbrechen Sie sich darüber nicht den Kopf. Darum geht es nicht – sie sind nicht gleich. Die Quantenmechanik ist eine andersartige Theorie zur Darstellung der Welt. Es ist nur so, dass es gewisse Korrespondenzen gibt, die kaum mehr als Merkhilfen sind. Das heißt, Sie behalten Gleichung (11.14) im Gedächtnis, wenn Sie die klassische Physik erlernen; wenn Sie dann die Korrespondenz μ → μσ beachten, haben Sie einen Anhaltspunkt, sich Gleichung (11.13) zu merken. Natürlich „folgt“ die Natur der Quantenmechanik und die klassische Physik ist nur eine Näherung; es verbirgt sich daher kein Geheimnis hinter der Tatsache, dass es in der klassischen Mechanik einige Schatten der quantenmechanischen Gesetze gibt, die in Wahrheit die grundlegenden Gesetze sind. Die Rekonstruktion des ursprünglichen Objektes aus dem Schatten ist auf direkte Art nicht möglich, aber der Schatten hilft Ihnen, sich daran zu erinnern, wie das Objekt aussieht. Die Gleichung (11.13) ist die Wahrheit und Gleichung (11.14) ist der Schatten. Da wir die klassische Mechanik zuerst lernen, würden wir gerne aus ihr die Quantenformel ableiten können. Aber es gibt kein todsicheres Schema dafür. Wir müssen immer auf die wirkliche Welt zurückgreifen und die richtigen quantenmechanischen Gleichungen ermitteln. Wenn es sich ergibt, dass sie eine gewisse Ähnlichkeit mit der klassischen Physik haben, haben wir Glück.
11.2 Die Spinmatrizen als Operatoren
207
Wenn die obigen Warnungen Ihnen wie Wiederholungen erscheinen und Sie finden, dass sie abgedroschene, selbstverständliche Wahrheiten über die Beziehung zwischen klassischer Physik und Quantenphysik sind, entschuldigen Sie bitte die bedingten Reflexe eines Professors, der gewöhnlich Studenten in Quantenmechanik unterrichtet hat, die, bevor sie in höheren Semestern waren, nichts über paulische Spinmatrizen gehört haben. Sie scheinen da immer zu hoffen, dass die Quantenmechanik irgendwie so betrachtet werden könnte, dass sie als logische Konsequenz aus der klassischen Physik folgt, die sie Jahre zuvor gründlich gelernt haben. (Vielleicht wollen sie vermeiden, etwas Neues lernen zu müssen.) Sie dagegen haben die klassische Gleichung (11.14) erst vor einigen Monaten gelernt – noch dazu mit dem Hinweis, dass sie unzureichend ist. Daher werden Sie vielleicht nicht so abgeneigt sein, die Quantengleichung (11.13) als grundlegende Wahrheit zu akzeptieren.
11.2
Die Spinmatrizen als Operatoren
Da wir gerade beim Thema der mathematischen Notation sind, möchten wir eine andere Methode der Darstellung erläutern – eine Methode, die oft benutzt wird, weil sie so kompakt ist. Sie folgt direkt aus der in Kapitel 8 eingeführten Notation. Wenn wir ein System in einem zeitlich veränderlichen Zustand | ψ(t) � analysieren, können wir – wie wir es in (8.34) getan haben – die Amplitude, dass das System zur Zeit t + Δt im Zustand | i � ist, schreiben als � i | ψ(t + Δt) � = � i | U(t + Δt, t) | j � � j | ψ(t) � . j
Das Matrixelement � i | U(t + Δt, t) | j � ist die Amplitude, dass der Basiszustand | j � im Zeitintervall Δt in den Basiszustand | i � umgewandelt wird. Dann haben wir Hi j definiert als
i Hi j (t) Δt , und wir haben gezeigt, dass die Amplituden Ci (t) = � i | ψ(t) � miteinander verknüpft sind durch die Differentialgleichung dCi = i Hi j C j . (11.15) dt j � i | U(t + Δt, t) | j � = δi j −
Wenn wir die Amplituden Ci explizit ausschreiben, wird diese Gleichung zu d Hi j � j | ψ � . i � i | ψ � = dt j
(11.16)
Nun sind die Matrixelemente Hi j auch Amplituden, die wir als � i | H | j � schreiben können. Unsere Differentialgleichung sieht dann so aus: d i � i | ψ � = �i|H| j�� j|ψ� . (11.17) dt j
Wir sehen, dass −i/ � i | H | j � dt die Amplitude ist, dass – unter den durch H beschriebenen physikalischen Verhältnissen – ein Zustand | j � während der Zeit dt den Zustand | i � „erzeugen“ wird. (All das wurde in der Diskussion in Abschnitt 8.4 erläutert.)
208
11 Weitere Zweizustandssysteme
Dem Gedankengang von Abschnitt 8.2 folgend, können wir jetzt den gemeinsamen Ausdruck � i | in der Gleichung (11.17) weglassen – da sie für jeden Zustand | i � gilt – und diese Gleichung einfach schreiben als d i | ψ � = H| j�� j|ψ� . (11.18) dt j Wir können noch einen Schritt weiter gehen, auch das j entfernen und schreiben i
d |ψ� = H |ψ� . dt
(11.19)
In Kapitel 8 haben wir darauf hingewiesen, dass bei dieser Schreibweise das H in Ausdrücken wie H | j � oder H | ψ � Operator genannt wird. Von jetzt an wollen wir den kleinen Hut ( ˆ ) über einen Operator setzen, um zu kennzeichnen, dass es ein Operator ist und nicht nur eine Zahl. Wir schreiben also Hˆ | ψ �. Obwohl die beiden Gleichungen (11.18) und (11.19) genau dasselbe bedeuten wie (11.17) und (11.15), können wir sie auf verschiedene Art betrachten. Zum Beispiel würden wir (11.18) auf folgende Art beschreiben: „Die zeitliche Ableitung des Zustandsvektors | ψ � (mal i) ist gleich dem, was Sie erhalten, wenn Sie den Hamilton-Operator Hˆ auf jeden Basiszustand anwenden und dabei mit der Amplitude � j | ψ �, dass ψ im Zustand j ist, multiplizieren und über alle j summieren.“ Oder man beschreibt (11.19) auf folgende Art: „Die zeitliche Ableitung (mal i) eines Zustandes | ψ � ist gleich dem, was Sie erhalten, wenn Sie den Hamilton-Operator Hˆ auf den Zustandsvektor | ψ � anwenden.“ Es ist nur eine abkürzende Art, das zu sagen, was in (11.17) steckt, aber das kann, wie Sie sehen werden, eine große Erleichterung sein. Wenn wir wollen, können wir die Idee der „Abstraktion“ noch einen Schritt weiter führen. Gleichung (11.19) gilt für jeden Zustand | ψ �. Auch die linke Seite, id/dt, ist ein Operator – es ist die Operation „differenziere nach t und multipliziere mit i“. Daher kann auch (11.19) als Gleichung zwischen Operatoren angesehen werden – als die Operatorgleichung i
d = Hˆ . dt
Der Hamilton-Operator, angewendet auf einen beliebigen Zustand, ergibt dasselbe Resultat (bis auf eine Konstante) wie d/dt. Beachten Sie, dass diese Gleichung – ebenso wie (11.19) – nicht ˆ bedeutet, dass der H-Operator einfach die identische Operation zu i(d/dt) ist. Die Gleichungen formulieren das dynamische Gesetz der Natur – das Bewegungsgesetz – für ein Quantensystem. Um Sie mit diesen Begriffen besser vertraut zu machen, wollen wir eine andere Methode vorstellen, wie man zu Gleichung (11.18) gelangen kann. Sie wissen, dass wir jeden Zustand | ψ � durch seine Projektionen in ein Basissystem ausdrücken können (siehe (8.8)) |ψ� = |i��i|ψ� . (11.20) i
Wie ändert sich | ψ � mit der Zeit? Nun, dazu müssen wir einfach die Ableitung bilden: d d |ψ� = |i��i|ψ� . dt dt i
(11.21)
11.2 Die Spinmatrizen als Operatoren
209
Nun ändern sich die Basiszustände | i � nicht mit der Zeit (zumindest hatten wir das angenommen), aber die Amplituden � i | ψ � sind Zahlen, die sich verändern können. Daher wird Gleichung (11.21) zu d d |ψ� = |i� �i|ψ� . dt dt i
(11.22)
Da wir d � i | ψ � /dt aus (11.16) kennen, erhalten wir d i |ψ� = − |i� Hi j � j | ψ � dt i j i i |i��i|H | j�� j|ψ� = − H| j�� j|ψ� . =− ij j Dies ist schon wieder (11.18). Wir haben daher viele Möglichkeiten, die Hamilton-Matrix zu betrachten. Wir können das System der Koeffizienten Hi j einfach als Zahlengruppe ansehen oder wir können an die „Amplituden“ � i | H | j � oder an die „Matrix“ Hi j oder an den „Operator“ Hˆ denken. Es bedeutet alles dasselbe. Kommen wir nun zu unseren Zweizustandssystemen zurück. Wenn wir die Hamilton-Matrix durch die Sigma-Matrizen ausdrücken (mit geeigneten numerischen Koeffizienten wie B x usw.), können wir uns die σixj durchaus auch als Amplitude � i | σ x | j � vorstellen oder kurz als Operator σˆ x . Wenn wir den Operatorbegriff verwenden, können wir die Bewegungsgleichung eines Zustandes | ψ � in einem magnetischen Feld schreiben als i
d | ψ � = −μ B x σ ˆ x + Byσˆ y + Bz σ ˆz |ψ� . dt
(11.23)
Wenn wir eine solche Gleichung „benutzen“ wollen, müssen wir normalerweise | ψ � durch die Basisvektoren ausdrücken (ebenso, wie wir die Komponenten räumlicher Vektoren finden müssen, wenn wir bestimmte Zahlen ausrechnen wollen). Wir werden daher gewöhnlich die Gleichung (11.23) gern in die etwas erweiterte Form bringen wollen: i
d B xσˆ x + By σˆ y + Bz σ | ψ � = −μ ˆz |i��i|ψ� . dt i
(11.24)
Jetzt werden Sie sehen, warum das Konzept des Operators so elegant ist. Um (11.24) zu verwenden, müssen wir wissen, was geschieht, wenn die σ-Operatoren ˆ auf die Basiszustände einwirken. Versuchen wir, es herauszufinden. Angenommen wir haben σˆ z | + �; das ergibt einen Vektor | ? �, aber welchen? Nun, multiplizieren wir ihn von links mit � + | . Unter Verwendung von Tabelle 11.1 erhalten wir z �+|σ ˆ z | + � = σ11 = 1.
Daher wissen wir, dass �+|?� = 1.
(11.25)
210
11 Weitere Zweizustandssysteme
Nun wollen wir σˆ z | + � von links mit � − | multiplizieren. Wir erhalten z = 0; �−|σ ˆ z | + � = σ21
daher ist �−|?� = 0.
(11.26)
Es gibt nur einen Zustandsvektor, der sowohl (11.25) als auch (11.26) befriedigt, nämlich der Basiszustand | + �. Wir stellen daher fest, dass σˆ z | + � = | + � .
(11.27)
Durch eine derartige Argumentation können Sie leicht zeigen, dass alle Eigenschaften der Sigma-Matrizen auch durch den in Tabelle 11.3 gegebenen Satz von Regeln in der Operatorschreibweise beschrieben werden können. Produkte von Sigma-Matrizen gehen in Produkte von Operatoren über. Wenn zwei Operatoren zusammen als Produkt auftreten, führen Sie zuerst die Operation mit dem Operator durch, der am weitesten rechts steht. Unter σ ˆ xσ ˆ y | + � müssen wir zum Beispiel σ ˆ x (σ ˆ y | + �) verstehen. Aus Tabelle 11.3 erhalten wir σˆ y | + � = i | − �, daher ist σˆ x σ ˆy |+� = σ ˆ x (i | − �) .
(11.28)
Nun lässt sich jede Zahl – wie i – einfach vor den Operator ziehen (Operatoren wirken nur auf Zustandsvektoren); daher ist Gleichung (11.28) dasselbe wie ˆ y | + � = iσ ˆ x |−� = i|+� . σˆ x σ ˆ y | − � durchführen, erhalten Sie Wenn Sie dasselbe für σˆ x σ σˆ x σ ˆ y | − � = −i | − � . Aus Tabelle 11.3 können Sie ablesen, dass die Anwendung von σ ˆ x σˆ y auf | + � oder | − � genau das ergibt, was Sie erhalten, wenn Sie σ ˆ z anwenden und mit i multiplizieren. Wir können daher sagen, dass die Operation σˆ x σ ˆ y mit der Operation iσ ˆ z identisch ist, und dies als Operatorgleichung schreiben: ˆ y = iσ ˆz. σˆ x σ
(11.29)
Beachten Sie, dass diese Gleichung mit einer unserer Matrixgleichungen aus Tabelle 11.2 übereinstimmt. Wir sehen daher wieder die Kongruenz zwischen dem Matrix- und dem Operatorstandpunkt. Alle Gleichungen in Tabelle 11.2 können auch als Gleichungen zwischen den Sigma-Operatoren betrachtet werden. Sie können nachprüfen, dass sie tatsächlich aus Tabelle 11.3 folgen. Wenn Sie mit diesen Dingen arbeiten, ist es am besten, nicht darauf zu achten, ob eine Größe wie σ oder H ein Operator oder eine Matrix ist. Alle Gleichungen sind in jedem Fall gleich, daher gilt Tabelle 11.2 für Sigma-Operatoren ebenso wie für Sigma-Matrizen, ganz wie Sie wollen.
11.3 Die Lösung der Zweizustandsgleichung
211
Tabelle 11.3: Eigenschaften der σ-Operatoren ˆ
σ ˆz |+� = |+�
σ ˆz |−�= −|−�
σ ˆ x |+� = |−�
σ ˆ x |−� = |+�
σ ˆy |+� = i|−�
σ ˆ y | − �= −i | + �
11.3
Die Lösung der Zweizustandsgleichung
Wir können nun unsere Zweizustandsgleichung in verschiedenen Formen schreiben, zum Beispiel entweder als i oder
dCi = Hi j C j dt j
(11.30)
d|ψ� = Hˆ | ψ � . i dt
Sie bedeuten beide dasselbe. Für ein Spin- 21 -Teilchen in einem magnetischen Feld ist die Hamilton-Matrix H durch (11.8) oder durch (11.13) gegeben. Wenn das Feld in z-Richtung weist, dann ist die Lösung – wie wir jetzt mehrmals gesehen haben –, dass der Zustand | ψ �, was immer er sei, mit einer Winkelgeschwindigkeit, die gleich dem Doppelten des magnetischen Feldes mal μ/ ist, um die z-Achse präzediert (so, als würden Sie das physikalische Objekt nehmen und es als Ganzes um die z-Achse drehen). Dasselbe gilt natürlich für ein Magnetfeld in jeder anderen Richtung, weil die Physik unabhängig vom jeweiligen Koordinatensystem ist. Wenn eine Situation vorliegt, in der das magnetische Feld auf komplizierte Art zeitlich variiert, dann können wir die Situation folgendermaßen untersuchen: Angenommen, Sie beginnen mit dem Spin in +z-Richtung und Sie haben ein x-Magnetfeld. Der Spin beginnt sich zu drehen. Wenn dann das x-Feld abgestellt wird, hört der Spin auf sich zu drehen. Wenn jetzt ein z-Feld angestellt wird, präzediert der Spin um z usw. In Abhängigkeit davon, wie sich die Felder zeitlich verändern, können Sie daher herausfinden, was der Endzustand ist – in Richtung welcher Achse er zeigen wird. Dann können Sie diesen Zustand auf die ursprünglichen Basiszustände | + � und | − � bezüglich z beziehen unter Verwendung der Projektionsformeln, die wir in Kapitel 10 (oder Kapitel 6) hergeleitet haben. Wenn der Zustand mit dem Spin in Richtung (θ, φ) endet, wird er die up-Amplitude cos(θ/2)e−iφ/2 und die downAmplitude sin(θ/2)e+iφ/2 haben. Das löst jedes Problem. Es ist eine verbale Beschreibung der Lösung der Differentialgleichungen. Die eben beschriebene Lösung ist allgemein genug, um mit jedem Zweizustandssystem fertig zu werden. Nehmen wir unser Beispiel mit dem Ammoniakmolekül, einschließlich der Wirkung
212
11 Weitere Zweizustandssysteme
eines elektrischen Feldes. Wenn wir das System durch die Zustände | I � und | II � ausdrücken, nehmen die Gleichungen (9.38) und (9.39) folgende Form an: dC I = +AC I + μEC II , dt dC II = −AC II + μEC I . i dt i
(11.31)
Sie sagen: „Nein, ich weiß noch, da kam ein E0 vor.“ Nun, wir haben den Energieursprung verschoben, um E0 zu null zu machen. (Sie können das immer erreichen, indem Sie beide Amplituden um denselben Faktor eiE0 T/ verändern und dadurch jede konstante Energie loswerden.) Wenn nun entsprechende Gleichungen immer dieselben Lösungen haben, dann brauchen wir es wirklich nicht zweimal zu tun. Wenn wir diese Gleichungen und (11.1) betrachten, können wir folgende Identifizierung vornehmen. Nennen wir | I � den Zustand | + � und | II � den Zustand | − �. Das bedeutet nicht, dass wir das Ammoniakmolekül im Raum ausrichten oder dass | + � und | − � irgendetwas mit der z-Achse zu tun haben. Es ist völlig künstlich. Wir haben einen künstlichen Raum, den wir „Ammoniakmolekül-Darstellungsraum“ oder sonst irgendwie nennen könnten – ein dreidimensionales „Diagramm“, in dem „oben“ sein gleichbedeutend damit ist, ein Molekül im Zustand | I � zu haben, und längs dieser falschen z-Achse „unten“ sein bedeutet, dass man ein Molekül im Zustand | II � hat. Dann werden die Gleichungen folgendermaßen identifiziert. Zuerst sehen Sie, dass die Hamilton-Matrix durch die Sigma-Matrizen ausgedrückt werden kann als H = +Aσz + μEσ x .
(11.32)
Mit anderen Worten, der Term μBz in (11.4) entspricht −A in (11.32) und μB x entspricht −μE. In unserem „Modellraum“ haben wir damit ein konstantes B-Feld in z-Richtung. Wenn wir ein elektrisches Feld E haben, das sich zeitlich ändert, dann haben wir ein B-Feld in x-Richtung, das sich proportional dazu ändert. Daher ist das Verhalten eines Elektrons in einem magnetischen Feld mit konstanter z-Komponente und oszillierender x-Komponente mathematisch analog und entspricht genau dem Verhalten eines Ammoniakmoleküls in einem oszillierenden elektrischen Feld. Leider haben wir nicht die Zeit, tiefer in die Einzelheiten dieser Übereinstimmung einzudringen oder irgendwelche technischen Einzelheiten auszuarbeiten. Wir wollten nur betonen, dass alle Zweizustandssysteme mit einem Spin- 21 -Objekt gleichgesetzt werden können, welches in einem magnetischen Feld präzediert.
11.4
Die Polarisationszustände des Photons
Es gibt eine Reihe weiterer Zweizustandssysteme, deren Untersuchung interessant ist, und das erste neue, über das wir sprechen wollen, ist das Photon. Um ein Photon zu beschreiben, müssen wir zunächst seinen Impulsvektor angeben. Bei einem freien Photon ist die Frequenz durch den Impuls bestimmt, wir brauchen daher nicht auch noch zu sagen, was die Frequenz ist. Doch zusätzlich haben wir noch eine Eigenschaft, die Polarisation genannt wird. Stellen Sie sich vor, dass ein Photon auf Sie zukommt mit einer bestimmten monochromatischen Frequenz (die während der ganzen Diskussion gleich bleibt, sodass wir keine Vielfalt von Impulszuständen haben). Dann gibt es zwei Polarisationsrichtungen. In der klassischen Theorie kann das Licht beschrieben werden, als hätte es ein elektrisches Feld, das horizontal oszilliert, oder
11.4 Die Polarisationszustände des Photons
213
ein elektrisches Feld, das vertikal oszilliert (zum Beispiel); diese zwei Arten von Licht heißen x-polarisiertes und y-polarisiertes Licht. Das Licht kann auch in irgendeine andere Richtung polarisiert sein, die aus der Überlagerung eines Feldes in x-Richtung und eines in y-Richtung gebildet werden kann. Oder wenn Sie die x- und y-Komponenten mit einer Phasenverschiebung von 90◦ nehmen, erhalten Sie ein elektrisches Feld, das sich dreht – das Licht ist elliptisch polarisiert (vgl. Band II, Kapitel 8). Nun nehmen wir jedoch an, dass wir ein einzelnes Photon beobachten. Es gibt kein elektrisches Feld, das wir auf die beschriebene Art behandeln können. Alles was wir haben, ist ein Photon. Aber ein Photon muss etwas haben, was dem klassischen Phänomen der Polarisation entspricht. Es muss zumindest zwei verschiedene Arten von Photonen geben. Im ersten Moment werden Sie vielleicht denken, dass es eine unendliche Vielfalt geben müsste – schließlich kann der elektrische Vektor in alle möglichen Richtungen zeigen. Wir können jedoch die Polarisation eines Photons als Zweizustandssystem beschreiben. Ein Photon kann im Zustand | x � oder im Zustand | y � sein. Mit | x � meinen wir den Polarisationszustand von jedem Photon eines Lichtstrahls, der klassisch x-polarisiertes Licht ist. Andererseits meinen wir mit | y � den Polarisationszustand von jedem Photon in einem y-polarisierten Strahl. Und wir können | x � und | y � als unsere Basiszustände für ein Photon mit gegebenem Impuls nehmen, der auf Sie zeigt – in die, wie wir sagen wollen, z-Richtung. Es gibt daher zwei Basiszustände | x � und | y �, und sie genügen vollkommen, um beliebige Photonen zu beschreiben. Wenn wir zum Beispiel ein Stück Polaroid1 verwenden, dessen Achse so ausgerichtet ist, dass es Licht hindurchlässt, das in der x-Richtung polarisiert ist, und wir ein Photon darauf lenken, von dem wir wissen, dass es im Zustand | y � ist, dann wird es vom Polaroid absorbiert werden. Wenn wir dagegen ein Photon darauf lenken, von dem wir wissen, dass es im Zustand | x � ist, wird es direkt als | x � hindurchkommen. Wenn wir ein Stück Kalkspat nehmen, das einen Strahl polarisierten Lichtes aufnimmt und ihn in einen | x �-Strahl und einen | y �-Strahl aufspaltet, dann ist das Stück Kalkspat völlig analog zu einem Stern-Gerlach-Apparat, der einen Strahl von Silberatomen in die beiden Zustände | + � und | − � aufspaltet. Wir können daher alles, was wir zuvor mit Teilchen und Stern-Gerlach-Apparaten gemacht haben, mit Licht und Kalkspatstücken wiederholen. Und was ist mit Licht, das durch ein Stück Polaroid gefiltert wird, das in einem Winkel θ aufgestellt ist? Ist das ein anderer Zustand? Ja, in der Tat, es ist ein anderer Zustand. y�
y x� θ x
Abb. 11.2: Koordinaten im rechten Winkel zum Impulsvektor des Photons.
Nennen wir die Achse des Polaroides x� , um sie von den Achsen unserer Basiszustände zu unterscheiden (siehe Abbildung 11.2). Ein Photon, das herauskommt, wird im Zustand | x� � 1
Polaroid ist ein optisch linear polarisierendes Material, z. B. in Folienform.
214
11 Weitere Zweizustandssysteme
sein. Jeder Zustand kann jedoch als Linearkombination von Basiszuständen dargestellt werden, und die Formel für die Kombination ist hier | x� � = cos θ | x � + sin θ | y � .
(11.33)
Das heißt, wenn ein Photon durch ein Stück Polaroid kommt, das im Winkel θ steht (bezüglich x), kann es immer noch in | x �- und | y �-Strahlen aufgelöst werden – durch ein Stück Kalkspat zum Beispiel. Oder Sie können es, wenn Sie wollen, einfach in Gedanken in x- und yKomponenten zerlegen. Auf jeden Fall werden Sie die Amplitude cos θ finden, im | x �-Zustand zu sein, und die Amplitude sin θ, im | y �-Zustand zu sein. Achse des Polarisators
y
Licht
y θ
x x
Zustand | x� �
z Abb. 11.3: Zwei Polaroidscheiben mit einem Winkel θ zwischen den Polarisationsachsen.
Nun stellen wir die folgende Frage: Angenommen, ein Photon ist durch ein Stück Polaroid, das im Winkel θ steht, in x� -Richtung polarisiert und trifft im Winkel null auf ein Polaroid (siehe Abbildung 11.3). Was wird geschehen? Mit welcher Wahrscheinlichkeit wird es hindurchgehen? Die Antwort ist folgende: Nachdem es durch das erste Polaroid gegangen ist, ist es sicher im Zustand | x� �. Das zweite Polaroid wird das Photon durchlassen, wenn es im Zustand | x � ist (es aber absorbieren, wenn es im Zustand | y � ist). Die Frage ist daher, mit welcher Wahrscheinlichkeit das Photon im Zustand | x � erscheint. Diese Wahrscheinlichkeit erhalten wir aus dem Absolutquadrat der Amplitude � x | x� �, dass ein Photon im Zustand | x� � auch im Zustand | x � ist. Was ist dieses � x | x� �? Dazu multiplizieren wir einfach Gleichung (11.33) mit � x | und erhalten: � x | x� � = cos θ � x | x � + sin θ � x | y � .
Nun gilt aus Gründen der Physik � x | y � = 0 – wie es sein muss, wenn | x � und | y � Basiszustände sind – und es gilt � x | x � = 1. Wir erhalten daher � x | x� � = cos θ ,
und die Wahrscheinlichkeit ist cos2 θ. Wenn zum Beispiel das erste Polaroid bei 30◦ steht, wird das Photon in 3/4 der Fälle hindurchgehen, und in 1/4 der Fälle wird es das Polaroid aufheizen, weil es darin absorbiert wird. Nun wollen wir sehen, was in derselben Situation klassisch geschieht. Angenommen, wir haben einen Lichtstrahl mit einem elektrischen Feld, das sich auf die eine oder andere Art verändert,
11.4 Die Polarisationszustände des Photons
215
sagen wir „unpolarisiert“. Wenn er durch das erste Polaroid geht, oszilliert das elektrische Feld in x� -Richtung mit einer Stärke E; wir würden das Feld als oszillierenden Vektor mit einem Spitzenwert E0 in ein Diagramm wie Abbildung 11.4 zeichnen. Wenn nun das Licht beim zweiten Polaroid ankommt, geht nur die x-Komponente, E0 cos θ, des elektrischen Feldes hindurch. Die Intensität ist proportional zum Quadrat des Feldes, also zu E20 cos2 θ. Daher ist die hindurchkommende Energie um cos2 θ schwächer als die Energie, die in das letzte Polaroid hineinkam. y
E0
θ E0 cos θ
x
Abb. 11.4: Das klassische Bild des elektrischen Vektors E.
Das klassische und das quantenmechanische Bild ergeben äquivalente Resultate. Wenn Sie 10 Milliarden Photonen auf das zweite Polaroid lenken und die Wahrscheinlichkeit hindurchzugehen wäre für jedes beispielsweise 3/4, dann erwarten Sie, dass 3/4 von 10 Milliarden hindurchgehen. Entsprechend wäre die mitgeführte Energie 3/4 der Gesamtenergie. Die klassische Theorie sagt nichts aus über die Statistik der Sache – sie sagt einfach, dass die hindurchkommende Energie genau 3/4 der Energie sein wird, die hineingeschickt wurde. Das ist natürlich unmöglich, wenn es nur ein Photon gibt. So etwas wie ein Dreiviertel-Photon gibt es nicht. Entweder ist es ganz da, oder es ist überhaupt nicht da. Die Quantenmechanik sagt uns, dass es in 3/4 der Fälle ganz da ist. Die Beziehung der beiden Theorien ist klar. Wie verhält es sich mit den anderen Polarisationsarten? Zum Beispiel mit rechtszirkularer Polarisation? In der klassischen Theorie hat die rechtszirkulare Polarisation gleiche Komponenten in x und y, die um 90◦ phasenverschoben sind. In der Quantentheorie hat ein rechtszirkular polarisiertes (RZ) Photon gleiche Amplituden, in | x � oder | y � polarisiert zu sein, und die Amplituden sind um 90◦ phasenverschoben. Wenn wir ein RZ-Photon als Zustand | R � und ein LZ-Photon als Zustand | L � bezeichnen, können wir schreiben (siehe Band II, Abschnitt 8.1)
1 | R � = √ (| x � + i | y �) , 2 (11.34) 1 | L � = √ (| x � − i | y �) . 2 √ Der Faktor 1/ 2 ist hinzugefügt, um normierte Zustände zu erhalten. Mit diesen Zuständen können Sie alle beliebigen Filter- oder Interferenzeffekte unter Verwendung der Gesetze der Quantentheorie berechnen. Wenn Sie wollen, können Sie | R � und | L � auch als Basiszustände wählen und mit ihrer Hilfe alles darstellen. Sie brauchen zunächst nur zu zeigen, dass � R | L � = 0 ist – was Sie tun können, indem Sie die konjugierte Form der ersten der obigen Gleichungen nehmen (siehe (8.13)) und sie mit der anderen multiplizieren. Sie können Licht zerlegen in xund y-Polarisationen oder in x� - und y� -Polarisationen oder in rechts- und links-Polarisationen als Basis.
216
11 Weitere Zweizustandssysteme
Als Beispiel wollen wir versuchen, unsere Formeln umzudrehen. Können wir den Zustand | x � als Linearkombination von rechts und links darstellen? Ja, das sieht so aus: 1 | x � = √ (| R � + | L �) , 2 (11.35) i | y � = − √ (| R � − | L �) . 2 Beweis: Addieren und subtrahieren Sie die beiden Gleichungen in (11.34). Es ist leicht, von einer Basis zur anderen überzugehen. Es gibt noch eine Eigentümlichkeit, auf die wir hinweisen wollen. Wenn ein Photon rechtszirkular polarisiert ist, sollte es nichts mit den x- und y-Achsen zu tun haben. Wenn wir dieselbe Sache von einem Koordinatensystem aus betrachten, das um irgendeinen Winkel um die Flugrichtung gedreht ist, wäre das Licht immer noch rechtszirkular polarisiert – und das Entsprechende gilt für links. Das rechts- und linkszirkular polarisierte Licht ist für jede solche Drehung gleich; die Definition ist unabhängig von der Wahl der x-Richtung (außer dass die Photonenrichtung gegeben ist). Ist das nicht nett – man braucht keine Achsen, um es zu definieren. Viel besser als x und y. Ist es aber nicht andererseits fast ein Wunder, dass Sie durch Addition von rechts und links herausfinden können, welche Richtung x war? Wenn „rechts“ und „links“ in keiner Weise von x abhängig sind, wie ist es dann möglich, dass wir sie wieder zusammenfügen können und dann x erhalten? Wir können diese Frage teilweise beantworten, indem wir den Zustand | R� � ausschreiben, der ein RZ-polarisiertes Photon im x� , y� -System darstellt. In diesem System würden Sie schreiben 1 | R� � = √ (| x� � + i | y� �) . 2 Wie sieht ein solcher Zustand im x, y-System aus? Setzen Sie einfach | x� � aus (11.33) und das zugehörige | y� � ein. Letzteres ist (− sin θ) | x �+(cos θ) | y �, und damit wird 1 | R� � = √ cos θ | x � + sin θ | y � − i sin θ | x � + i cos θ | y � 2 1 = √ (cos θ − i sin θ) | x � + i (cos θ − i sin θ) | y � 2 1 = √ (| x � + i | y �)(cos θ − i sin θ) . 2
Der erste Ausdruck ist | R �, der zweite ist e−iθ ; unser Ergebnis ist | R� � = e−iθ | R � .
(11.36)
| L� � = e+iθ | L � .
(11.37)
Die Zustände | R� � und | R � sind bis auf den Phasenfaktor e−iθ gleich. Wenn Sie dasselbe für | L� � ausführen, erhalten Sie2 2
Das ähnelt dem, was wir in Kapitel 6 für ein Spin-1/2-Teilchen gefunden hatten, als wir die Koordinaten um die z-Achse gedreht haben – dort hatten wir die Phasenfaktoren e±iφ/2 erhalten. Es ist tatsächlich genau das, was wir in Abschnitt 5.7 für die | + �-und | − �-Zustände eines Spin-eins-Teilchens aufgeschrieben hatten – das ist kein Zufall. Das Photon ist ein Spin-eins-Teilchen, das jedoch keinen „Null“-Zustand hat.
11.5 Das neutrale K-Meson
217
Nun sehen Sie, was geschieht. Wenn wir | R � und | L � addieren, erhalten wir etwas anderes, als wenn wir | R� � und | L� � addieren. Zum Beispiel ist ein x-polarisiertes Photon (siehe (11.35)) die Summe von | R � und | L �; aber ein y-polarisiertes Photon ist die Summe mit Phasenverschiebung bei dem einen um 90◦ rückwärts und beim anderen um 90◦ vorwärts. Das ist genau das, was wir aus der Summe von | R� � und | L� � für den speziellen Winkel θ = 90◦ erhalten würden, und das ist richtig. Eine x-Polarisation im gestrichenen System ist dasselbe wie eine y-Polarisation im ursprünglichen System. Es ist daher nicht ganz richtig, dass ein zirkular polarisiertes Photon in jedem Koordinatensystem gleich aussieht. Seine Phase (die Phasenbeziehung der rechts- und linkszirkular polarisierten Zustände) bleibt der x-Richtung auf der Spur.
11.5
Das neutrale K-Meson
Wir wollen nun ein Zweizustandssystem aus der Welt der seltsamen Teilchen beschreiben – ein System, für das die Quantenmechanik eine höchst bemerkenswerte Vorhersage macht. Eine vollständige Beschreibung würde uns tief in die Thematik der seltsamen Teilchen verwickeln, wir werden daher leider einige Kürzungen vornehmen müssen.3 Wir werden nur grob skizzieren, wie bestimmte Entdeckungen gemacht wurden, damit Sie eine Vorstellung von der Herangehensweise bekommen. Wir beginnen mit der Einführung des Begriffs der Strangeness und eines neuen Gesetzes von der Erhaltung der Strangeness durch Gell-Mann und Nishijima. Als Gell-Mann und Pais die Konsequenzen dieser neuen Ideen untersuchten, gelangten sie zur Vorhersage eines höchst bemerkenswerten Phänomens, das wir beschreiben werden. Doch zuerst müssen wir etwas zur „Strangeness“ sagen. Wir beginnen mit dem, was man als starke Wechselwirkung bezeichnet. Das sind die Wechselwirkungen, die für die starken Kernkräfte verantwortlich sind – im Gegensatz zum Beispiel zu den relativ schwachen elektromagnetischen Wechselwirkungen. Die Wechselwirkungen sind „stark“ in dem Sinne, dass, wenn zwei Teilchen genügend nahe zusammenkommen, um überhaupt aufeinander einzuwirken, sie dann sehr stark wechselwirken und leicht andere Teilchen erzeugen. Die Kernteilchen sind auch der so genannten „schwachen Wechselwirkung“ unterworfen, durch die gewisse Prozesse ablaufen können, wie der Betazerfall, aber immer sehr langsam im nuklearen Zeitmaßstab – die schwachen Wechselwirkungen sind um viele Größenordnungen schwächer als die starken Wechselwirkungen und sogar schwächer als die elektromagnetischen Wechselwirkungen. Als man mit den großen Beschleunigern die starken Wechselwirkungen untersuchte, war man überrascht, dass gewisse Dinge, die geschehen „sollten“ – und von denen man erwartete, dass sie geschehen würden –, nicht eintraten. Zum Beispiel erschien bei manchen Wechselwirkungen ein Teilchen eines gewissen Typs nicht, als man es erwartete. Gell-Mann und Nishijima stellten fest, dass man viele dieser eigenartigen Beobachtungen gleichzeitig erklären kann, wenn man einen neuen Erhaltungssatz einführt: Die Erhaltung der Strangeness. Sie schlugen vor, dass es eine bisher unbekannte charakteristische Eigenschaft gibt, die jedem Teilchen zugeordnet 3
Heute sind wir der Ansicht, dass der Stoff dieses Abschnittes länger und schwieriger ist, als es für den hier erreichten Kenntnisstand angemessen ist. Wir empfehlen, ihn auszulassen und mit Abschnitt 11.6 fortzufahren. Wenn Sie den Ehrgeiz und die Zeit haben, werden Sie vielleicht später darauf zurückkommen wollen. Wir lassen den Abschnitt hier stehen, weil er ein schönes Beispiel – aus neueren Arbeiten in der Hochenergiephysik – dafür ist, was man mit unserer Formulierung der Quantenmechanik von Zweizustandssystemen machen kann.
218
11 Weitere Zweizustandssysteme
werden kann und die bei jeder starken Wechselwirkung erhalten bleibt. Diese Größe nannten sie „Strangeness“. Nehmen wir zum Beispiel an, dass ein hochenergetisches negatives K-Meson – sagen wir mit einer Energie von vielen GeV – mit einem Proton zusammenstößt. Aus dieser Wechselwirkung können viele andere Teilchen entstehen: π-Mesonen, K-Mesonen, Lambda-Teilchen, SigmaTeilchen – jedes Meson oder Baryon, das in Tabelle 2.2 von Band I aufgeführt ist. Man hat jedoch beobachtet, dass nur bestimmte Kombinationen auftreten und andere niemals. Nun war schon bekannt, dass man gewisse Erhaltungsgesetze anzuwenden hat. Erstens bleiben Energie und Impuls immer erhalten. Die Gesamtenergie und der Gesamtimpuls müssen nach einem Ereignis immer dieselben wie vor dem Ereignis sein. Zweitens gibt es die Erhaltung der elektrischen Ladung, die besagt, dass die Gesamtladung der herauskommenden Teilchen immer gleich der Gesamtladung der ursprünglichen Teilchen sein muss. In unserem Beispiel, wo ein K-Meson und ein Proton zusammenkommen, treten also die folgenden Reaktionen auf:
oder
K− + p → p + K− + π + + π − + π 0
(11.38)
K +p→Σ +π . −
−
+
Die Reaktion K − + p → p + K− + π +
oder K− + p → Λ0 + π+
(11.39)
würden wir wegen der Verletzung der Ladungserhaltung niemals beobachten. Es war auch bekannt, dass die Zahl der Baryonen erhalten bleibt. Die Anzahl der auslaufenden Baryonen muss gleich der Anzahl der einlaufenden Baryonen sein. Bei diesem Gesetz wird ein Antiteilchen eines Baryons als minus ein Baryon gezählt. Das bedeutet, dass wir durchaus die Reaktion K− + p → Λ0 + π0
oder K− + p → p + K− + p + p
(11.40)
sehen können, (wobei p das Antiproton ist, das eine negative Ladung trägt). Aber wir sehen niemals die Reaktion K− + p → K − + π + + π 0
oder K− + p → p + K− + n
(11.41)
(auch wenn viel Energie vorhanden ist), weil die Baryonenzahl nicht erhalten bleiben würden. Diese Gesetze können jedoch nicht erklären, weshalb die folgenden Reaktionen – die auf den ersten Blick nicht besonders verschieden von einigen der Reaktionen in (11.38) oder (11.40) erscheinen – ebenfalls nie beobachtet wurden:
oder oder
K− + p → p + K− + K0 K− + p → p + π − K− + p → Λ 0 + K 0
(11.42)
11.5 Das neutrale K-Meson
219
Die Erklärung liegt in der Verletzung der Erhaltung der Strangeness. Mit jedem Teilchen ist eine Zahl – seine Strangeness S – verbunden, und ein Gesetz besagt, dass bei jeder starken Wechselwirkung die gesamte herauskommende Strangeness gleich der gesamten hineingehenden Strangeness sein muss. Das Proton und Antiproton (p, p), das Neutron und Antineutron (n, n) und das π-Meson (π+ , π0 , π− ) haben alle die Strangeness null; die K+ - und K0 -Mesonen haben 0 die Strangeness +1; das K− und K (das Anti-K0 )4 , das Λ0 und die Σ-Teilchen (+, 0, −) haben die Strangeness −1. Es gibt auch ein Teilchen mit der Strangeness −2 – das Ξ-Teilchen (großes „Xi“) – und vielleicht andere, die noch unbekannt sind. Wir haben eine Liste der StrangenessZahlen in Tabelle 11.4 zusammengestellt. Tabelle 11.4: Die Strangeness der stark wechselwirkenden Teilchen. (Anmerkung: π− ist das Antiteilchen von π+ und umgekehrt.)
Baryonen Mesonen
S = −2 Θ0 Θ−
S = −1 Σ+ Λ0 , Σ0 Σ− 0
K K−
S =0 p n
S = +1
π+ π0 π−
K+ K0
Schauen wir uns einmal an, wie die Erhaltung der Strangeness sich bei einigen der Reaktionen, die wir aufgeschrieben haben, auswirkt. Wenn wir mit einem K− und einem Proton beginnen, haben wir eine Gesamt-Strangeness von (−1 + 0) = −1. Die Erhaltung der Strangeness besagt, dass sich die Strangeness der Produkte nach der Reaktion wiederum zu −1 addieren muss. Sie sehen, dass das bei den Reaktionen von (11.38) und (11.40) auch zutrifft. In den Reaktionen von (11.42) dagegen ist die Strangeness auf der rechten Seite jeweils null. Solche Reaktionen erhalten die Strangeness nicht und kommen deshalb nicht vor. Warum? Das weiß niemand. Niemand weiß irgendetwas mehr als wir Ihnen gerade darüber gesagt haben. Die Natur macht das eben so. Betrachten wir nun die folgende Reaktion: Ein π− trifft auf ein Proton. Sie können zum Beispiel ein Λ0 -Teilchen plus ein neutrales K-Teilchen erhalten – zwei neutrale Teilchen. Welches neutrale K erhalten Sie jetzt? Da das Λ-Teilchen die Strangeness −1 und das π und p+ die Strangeness null haben und da dies eine schnelle Erzeugungsreaktion ist, darf sich die Strangeness nicht ändern. Das K-Teilchen muss die Strangeness +1 haben – es muss daher das K0 sein. Die Reaktion ist demnach π − + p → Λ0 + K 0 mit S = 0 + 0 = −1 + 1 (erhalten). 0
Wenn wir das K anstelle des K0 hätten, wäre die Strangeness auf der rechten Seite −2. Das erlaubt die Natur nicht, da die Strangeness auf der linken Seite null ist. Andererseits kann ein 4
Zu lesen als „K-null-quer“.
220
11 Weitere Zweizustandssysteme
0
K in anderen Reaktionen erzeugt werden, wie 0
n + n → n + p + K + K+ S = 0 + 0 = 0 + 0 + −1 + +1 oder 0
K− + p → n + K S = −1 + 0 = 0 + −1 . 0
Sie werden sich vielleicht fragen, woher wir wissen können, ob es ein K oder ein K0 ist. Sie sehen doch genau gleich aus. Sie sind Antiteilchen voneinander, sie haben genau die gleiche Masse und beide tragen keine elektrische Ladung. Wie sollen wir sie unterscheiden? Nun, durch 0 die Reaktionen, an denen sie beteiligt sind. Zum Beispiel kann ein K mit Materie reagieren, um ein Λ-Teilchen zu erzeugen, so wie hier: 0
K + p → Λ0 + π + , aber ein K0 kann das nicht. Es gibt für ein K0 keine Möglichkeit, ein Λ-Teilchen zu erzeugen, wenn es mit gewöhnlicher Materie (Protonen und Neutronen) wechselwirkt.5 Daher zeigt sich 0 der Unterschied zwischen dem K0 und dem K im Experiment darin, dass eines von ihnen Λ’s erzeugt und das andere nicht. Eine der Vorhersagen der Strangeness-Theorie ist dann folgende: Wenn in einem Experiment mit hochenergetischen Pionen ein Λ-Teilchen mit einem neutralen K-Meson erzeugt wird, dann wird dieses neutrale K-Meson, wenn es in andere Materieteilchen übergeht, niemals ein Λ erzeugen. Das Experiment kann etwa so ablaufen: Sie schicken einen Strahl von π− -Mesonen in eine große Wasserstoff-Blasenkammer. Eine π− -Spur verschwindet, aber an einer anderen Stelle erscheint ein Paar von Spuren (ein Proton und ein π− ), die anzeigen, dass ein Λ-Teilchen zerfallen ist6 (siehe Abbildung 11.5). Dann wissen Sie, dass dort irgendwo ein K0 ist, das Sie nicht sehen können. Sie können jedoch ausrechnen, welchen Weg es nimmt, indem Sie die Erhaltung von Impuls und Energie benutzen. (Es könnte sich später zeigen, indem es in zwei geladene Teilchen zerfällt, wie in Abbildung 11.5 (a) dargestellt.) Wenn das K0 dahinfliegt, kann es mit einem der Wasserstoffkerne (Protonen) wechselwirken und dabei vielleicht einige andere Teilchen erzeugen. Die Vorhersage der Strangeness-Theorie ist, dass es niemals ein Λ-Teilchen in einer einfachen Reaktion wie etwa K0 + p → Λ0 + π+ 5
6
Außer natürlich, wenn es auch zwei K+ ’s erzeugt oder andere Teilchen mit einer gesamten Strangeness von +2. Es kommen hier Reaktionen in Betracht, bei denen nicht genügend Energie vorhanden ist, um diese zusätzlichen seltsamen Teilchen zu erzeugen. Das freie Λ-Teilchen zerfällt langsam über eine schwache Wechselwirkung (die Strangeness muss dabei nicht erhalten bleiben). Die Zerfallsprodukte sind entweder ein p und ein π− oder ein n und ein π0 . Die Lebensdauer beträgt 2,2 × 10−10 s.
11.5 Das neutrale K-Meson
221
p π− 0
Λ0 -Zerfall
Λ
π−
π− Kernwechselwirkung flüssiger Wasserstoff
K0 K0 -Zerfall
π+
(a)
Kernwechselwirkung K
π−
0
Λ0 p
flüssiger Wasserstoff
π+ (b)
Abb. 11.5: Hochenergetische Ereignisse, wie man sie in einer Wasserstoff-Blasenkammer sieht. (a) Ein π− Meson reagiert mit einem Wasserstoffkern (Proton), wobei es ein Λ0 -Teilchen und ein K0 -Meson erzeugt. Beide Teilchen zerfallen in der Kammer. (b) Ein K0 -Meson reagiert mit einem Proton, wobei es ein π+ -Meson und ein Λ0 Teilchen erzeugt, das dann zerfällt. (Die neutralen Teilchen hinterlassen keine Spuren. Ihre rekonstruierten Wege sind hier durch die fein gestrichelten Linien angedeutet.)
0
erzeugen wird, während ein K dies durchaus tun kann. Das heißt, in einer Blasenkammer 0 konnte ein K das in Abbildung 11.5 (b) skizzierte Ereignis bewirken – in dem das Λ0 sichtbar ist, weil es zerfällt – ein K0 kann dies jedoch nicht. Das ist der erste Teil unserer Geschichte. Das ist die Erhaltung der Strangeness. Die Erhaltung der Strangeness ist jedoch nicht vollkommen. Es gibt sehr langsame Zerfallsvorgänge beim Zerfall von seltsamen Teilchen, die eine lange7 Zeit in der Größenordnung von 10−10 Sekunden benötigen, in denen die Strangeness nicht erhalten bleibt. Diese werden die „schwachen“ Zerfälle genannt. Zum Beispiel zerfällt das K0 in ein Paar von π-Mesonen (+ und −) mit einer Lebensdauer von 10−10 Sekunden. Auf diese Art wurden die K-Teilchen tatsächlich zum ersten Mal gesehen. Beachten Sie, dass die Zerfallsreaktion K0 → π + + π − nicht die Strangeness erhält, sie kann daher nicht durch starke Wechselwirkung „schnell“ ablaufen; sie kann nur durch den schwachen Zerfallsprozess vor sich gehen. Nun zerfällt das K0 auch auf dieselbe Art – in ein π+ und ein π− – und auch mit derselben Lebensdauer 0
K → π− + π+ . Wieder haben wir einen schwachen Zerfall, weil er die Strangeness nicht erhält. Es gibt ein Prinzip, wonach es für jede Reaktion eine entsprechende Reaktion gibt, in der die „Materie“ 7
Eine typische Zeit für starke Wechselwirkungen ist eher 10−23 s.
222
11 Weitere Zweizustandssysteme 0
durch „Antimaterie“ und umgekehrt ersetzt wird. Da das K das Antiteilchen des K0 ist, sollte es in die Antiteilchen des π+ und π− zerfallen, aber das Antiteilchen von einem π+ ist das π− . (Oder, wenn Sie es vorziehen, umgekehrt. Es stellt sich heraus, dass es bei den π-Mesonen keine Rolle spielt, welches Sie „Materie“ nennen.) Daher können als Folge der schwachen Zerfälle 0 das K0 und das K in dieselben Endprodukte übergehen. Wenn man sie durch ihre Zerfälle „sichtbar“ macht – etwa in einer Blasenkammer –, sehen sie wie dasselbe Teilchen aus. Nur ihre starken Wechselwirkungen sind anders. Wir sind jetzt schließlich soweit, dass wir die Arbeit von Gell-Mann und Pais beschreiben 0 können. Sie stellten zunächst fest, dass es, da sich das K0 und das K beide in Zustände von 0 zwei π-Mesonen umwandeln können, eine Amplitude geben müsse, dass sich ein K0 in ein K 0 umwandeln kann und ebenso ein K in ein K0 . Wenn wir die Reaktionen wie in der Chemie schreiben, erhalten wir K 0 π − + π + K0 .
(11.43)
Diese Reaktionen besagen, dass es eine Amplitude pro Zeiteinheit gibt, sagen wir −i/ mal 0 � K | W | K0 �, dass sich ein K0 durch die schwache Wechselwirkung, die für den Zerfall in zwei 0 π-Mesonen verantwortlich ist, in ein K umwandelt. Und es gibt die entsprechende Amplitude 0 � K0 | W | K � für den umgekehrten Vorgang. Da sich Materie und Antimaterie genau gleich verhalten, sind diese Amplituden numerisch gleich; wir wollen sie beide A nennen: 0
0
� K | W | K0 � = � K0 | W | K � = A .
(11.44)
Gell-Mann und Pais bemerkten nun, dass wir hier eine interessante Situation haben. Was man 0 bisher als zwei verschiedene Zustände der Welt angesehen hatte – das K0 und das K – sollte in Wirklichkeit als ein Zweizustandssystem betrachtet werden, weil es eine Amplitude für den Übergang von dem einen Zustand in den anderen gibt. Bei einer vollständigen Behandlung müsste man sich natürlich mit mehr als zwei Zuständen befassen, weil es auch die Zustände 0 der 2π’s usw. gibt; aber da sie hauptsächlich an der Beziehung zwischen K0 und K interessiert waren, brauchten sie die Beschreibung nicht zu komplizieren und konnten die Näherung eines Zweizustandssystems betrachten. Die anderen Zustände wurden insoweit berücksichtigt, als ihre Auswirkungen implizit in den Amplituden von (11.44) erschienen. Folglich untersuchten Gell-Mann und Pais das neutrale Teilchen als Zweizustandssystem. Zu 0 Beginn wählten sie als ihre zwei Basiszustände die Zustände | K0 � und | K �. (Von hier an geht die Geschichte sehr ähnlich wie beim Ammoniakmolekül.) Jeder Zustand | ψ � des neutralen K-Teilchens konnte dann durch Angabe der Amplituden, dass es in einem der Basiszustände ist, beschrieben werden. Wir nennen diese Amplituden C + = � K0 | ψ � ,
0
C− = � K | ψ � .
(11.45)
Der nächste Schritt bestand darin, die hamiltonschen Gleichungen für dieses Zweizustandssys0 tem aufzuschreiben. Wenn es keine Kopplung zwischen K0 und K gäbe, würden die Gleichun-
11.5 Das neutrale K-Meson
223
gen einfach lauten dC+ = E 0C+ , dt dC− = E 0C− . i dt
i
(11.46)
0
0
Aber da es die Amplitude � K0 | W | K � für das K gibt, sich in ein K0 umzuwandeln, muss der zusätzliche Term 0
� K0 | W | K � C− = AC− zur rechten Seite der ersten Gleichung addiert werden. Und entsprechend muss der Term AC+ in die Gleichung für die Änderungsgeschwindigkeit von C− eingefügt werden.
Aber das ist noch nicht alles. Wenn der Zwei-Pion-Effekt berücksichtigt wird, gibt es eine zusätzliche Amplitude für das K0 , sich durch den Prozess K0 → π − + π + → K 0
in sich selbst umzuwandeln. Die zusätzliche Amplitude, die wir � K0 | W | K0 � schreiben, ist 0 gleich der Amplitude � K | W | K0 �, da die beiden Amplituden, in ein Paar von π-Mesonen 0 überzugehen bzw. aus ihm hervorzugehen, für das K0 und das K gleich sind. Wir geben im 8 Folgenden einen ausführlichen Beweis dafür. Zuerst schreiben Sie 0
0
� K | W | K0 � = � K | W | 2π � � 2π | W | K0 � und � K0 | W | K0 � = � K0 | W | 2π � � 2π | W | K0 � . Wegen der Symmetrie von Materie und Antimaterie gilt 0
� 2π | W | K0 � = � 2π | W | K � und ebenso 0
� K0 | W | 2π � = � K | W | 2π � . 0
0
0
0
Es folgt dann � K0 | W | K0 � = � K | W | K0 � sowie � K | W | K � = � K0 | W | K �, wie wir be0 0 reits sagten. Jedenfalls gibt es zwei zusätzliche Amplituden � K0 | W | K0 � und � K | W | K �, beide gleich A, die in die hamiltonschen Gleichungen einbezogen werden müssen. Die erste ergibt einen Term AC+ auf der rechten Seite der Gleichung für dC+ /dt, und die zweite ergibt einen neuen Term AC− in der Gleichung für dC− /dt. Durch solche Überlegungen folgerten 8
Wir vereinfachen hier. Das 2π-System kann viele Zustände haben, entsprechend den verschiedenen Impulsen der π-Mesonen, und wir müssten eigentlich die rechte Seite dieser Gleichung in eine Summe über die verschiedenen Basiszustände der π’s umändern. Die vollständige Behandlung führt jedoch zu denselben Schlussfolgerungen.
224
11 Weitere Zweizustandssysteme 0
Gell-Mann und Pais, dass die hamiltonschen Gleichungen für das K0 K -System folgende Form haben: dC+ = E0 C+ + AC− + AC+ , dt dC− = E0 C− + AC+ + AC− . i dt
i
(11.47)
Wir müssen nun etwas korrigieren, was wir in früheren Kapiteln gesagt haben, nämlich dass 0 0 zwei Amplituden wie � K0 | W | K � und � K | W | K0 �, die das Umgekehrte voneinander sind, immer komplex konjugiert sind. Das war richtig, solange wir über Teilchen sprachen, die nicht zerfallen. Wenn aber Teilchen zerfallen können – und daher „verlorengehen“ können –, brauchen die beiden Amplituden nicht notwendig komplex konjugiert zu sein. Daher bedeutet die Gleichung (11.44) nicht, dass die Amplituden reelle Zahlen sind. Sie sind tatsächlich komplexe Zahlen. Der Koeffizient A ist daher komplex; und wir können ihn nicht einfach in die Energie E0 aufnehmen. Da sie schon oft mit Elektronenspins und dergleichen herumhantiert hatten, wussten Gell-Mann und Pais, dass die hamiltonschen Gleichungen (11.47) bedeuteten, dass es ein anderes Paar von Basiszuständen geben muss, das ebenfalls zur Darstellung des K-Teilchen-Systems verwendet werden kann und das ein besonders einfaches Verhalten haben muss. Sie sagten: „Nehmen wir die Summe und Differenz dieser beiden Gleichungen. Außerdem wollen wir alle unsere Energien bezogen auf E0 messen und für Energie und Zeit Einheiten benutzen, sodass = 1 wird.“ (Das machen die heutigen theoretischen Physiker immer. Es ändert die Physik nicht, führt aber auf Gleichungen von einfacherer Form.) Ihr Resultat: i
d (C+ + C− ) = 2A (C+ + C− ) , dt
i
d (C+ − C− ) = 0 . dt
(11.48)
Es zeigt sich, dass die Kombinationen der Amplituden (C+ + C− ) und (C+ − C− ) unabhängig voneinander sind (natürlich entsprechend den stationären Zuständen, die wir früher untersucht haben). Sie folgerten daher, dass es bequemer wäre, eine andere Darstellung für das K-Teilchen zu verwenden. Sie definierten die beiden Zustände 0 1 | K1 � = √ (| K0 � + | K �) , 2
0 1 | K2 � = √ (| K0 � − | K �) . 2
(11.49)
0
Sie sagten, dass wir, anstatt an die K0 - und K -Mesonen zu denken, unsere Überlegungen genauso gut mit den zwei „Teilchen“ (das heißt „Zuständen“) K1 und K2 anstellen können. (Diese entsprechen natürlich den Zuständen, die wir gewöhnlich | I � und | II � genannt haben. Wir benutzen unsere alte Schreibweise nicht, weil wir hier der Schreibweise der Originalautoren folgen wollen – und der Schreibweise, die Sie in Physikseminaren sehen werden.) Nun taten Gell-Mann und Pais dies alles nicht nur, um andere Namen für die Teilchen zu bekommen – es steckt auch eine seltsame neue Physik darin. Nehmen wir an, dass C1 und C2 die Amplituden sind, dass ein Zustand | ψ � entweder ein K1 - oder ein K2 -Meson ist: C 1 = � K1 | ψ � ,
C 2 = � K2 | ψ � .
11.5 Das neutrale K-Meson
225
Aus (11.49) ergibt sich 1 C1 = √ (C+ + C− ) , 2
1 C2 = √ (C+ − C− ) . 2
(11.50)
Damit werden die Gleichungen (11.48) zu i
dC1 = 2AC1 , dt
i
dC2 = 0. dt
(11.51)
Die Lösungen sind C1 (t) = C1 (0) e−i2At ,
C2 (t) = C2 (0) ,
(11.52)
wobei natürlich C1 (0) und C2 (0) die Amplituden bei t = 0 sind. Diese Gleichungen besagen, dass für ein neutrales K-Teilchen im Zustand | K1 �, das bei t = 0 beginnt (dann ist C1 (0) = 1 und C2 (0) = 0), die Amplituden zur Zeit t gegeben sind durch C1 (t) = e−i2At ,
C2 (t) = 0 .
Wenn wir bedenken, dass A eine komplexe Zahl ist, ist es bequem, 2A = α − iβ zu setzen. (Da sich der Imaginärteil von 2A als negativ herausstellt, schreiben wir ihn als minus iβ.) Mit dieser Substitution lautet C1 (t) C1 (t) = C1 (0) e−βt e−iαt .
(11.53)
Die Wahrscheinlichkeit, ein K-Teilchen zum Zeitpunkt t im K1 -Zustand zu finden, ist das Absolutquadrat dieser Amplitude, also e−2βt . Und gemäß (11.52) ist die Wahrscheinlichkeit, es im K2 -Zustand zu irgendeiner Zeit zu finden, null. Das bedeutet, dass, wenn Sie ein K-Teilchen im Zustand | K1 � herstellen, die Wahrscheinlichkeit, es in demselben Zustand zu finden, exponentiell mit der Zeit abnimmt – Sie werden es aber niemals im Zustand | K2 � finden. Wohin geht es? Es zerfällt in zwei π-Mesonen mit der mittleren Lebensdauer τ = 1/2β, die experimentell als 10−10 s bestimmt wurde. Wir haben dafür Vorkehrungen getroffen, als wir sagten, dass A komplex ist. Andererseits besagt (11.52), dass ein K-Teilchen, das bei t = 0 in den K2 -Zustand versetzt wird, für immer darin bleibt. Das stimmt aber nicht wirklich. Man hat experimentell beobachtet, dass es in drei π-Mesonen zerfällt, aber um das 600-Fache langsamer als der Zwei-Pionen-Zerfall, den wir beschrieben haben. Es gibt daher einige weitere kleine Terme, die wir in unserer Näherung weggelassen haben. Solange wir aber nur den Zwei-Pionen-Zerfall betrachten, besteht das K2 „für immer“. Wir kommen jetzt zum Ende der Geschichte von Gell-Mann und Pais. Sie untersuchten als Nächstes, was geschieht, wenn ein K-Teilchen mit einem Λ0 -Teilchen bei einer starken Wechselwirkung erzeugt wird. Da dieses dann eine Strangeness von +1 haben muss, muss es im K0 -Zustand entstehen. Bei t = 0 ist es daher weder im Zustand K1 noch im Zustand K2 , sondern es ist eine Mischung; die Anfangsbedingungen sind C+ (0) = 1 ,
C− (0) = 0 .
226
11 Weitere Zweizustandssysteme
Nach (11.50) bedeutet das aber 1 C1 (0) = √ , 2
1 C2 (0) = √ , 2
sodass (11.52) bzw. (11.53) 1 C1 (t) = √ e−βt e−iαt , 2
1 C2 (t) = √ 2
(11.54)
liefern. 0
Beachten Sie nun, dass K0 und K beide Linearkombinationen von K1 und K2 sind. In (11.54) 0 sind die Amplituden so gewählt, dass sich bei t = 0 die K -Teile durch Interferenz gegenseitig 0 aufheben und nur ein K -Zustand übrig bleibt. Aber der | K1 �-Zustand ändert sich mit der Zeit und der | K2 �-Zustand nicht. Nach t = 0 wird die Interferenz von C1 und C2 endliche 0 Amplituden sowohl für K0 als auch für K ergeben. Was bedeutet dies alles? Betrachten wir noch einmal das Experiment, das wir in Abbildung 11.5 angedeutet haben. Ein π− -Meson hat ein Λ0 -Teilchen und ein K0 -Meson erzeugt, das jetzt durch den Wasserstoff in der Kammer fliegt. Auf seinem Weg hat es eine kleine, aber gleichbleibende Wahrscheinlichkeit, mit einem Wasserstoffkern zusammenzustoßen. Anfangs dachten wir, dass die Erhaltung der Strangeness das K-Teilchen daran hindern würde, bei einer solchen Wechselwirkung ein Λ0 zu erzeugen. Jetzt sehen wir jedoch, dass das nicht richtig ist. Denn obwohl unser K-Teilchen als ein K0 startet – das kein Λ0 erzeugen kann – bleibt es nicht so. Nach einer 0 Weile gibt es eine gewisse Amplitude, dass es in den K -Zustand übergegangen ist. Wir können daher erwarten, manchmal ein Λ0 zu sehen, das entlang der Spur des K-Teilchens erzeugt worden ist. Die Wahrscheinlichkeit für dieses Ereignis ist durch die Amplitude C− gegeben, die wir durch Umformung von (11.50) in Beziehung zu C1 und C2 bringen können. Die Beziehung lautet 1 C− = √ (C1 − C2 ) = 2
1 2
e−βt e−iαt − 1 .
(11.55) 0
Während unser K-Teilchen dahinfliegt, ist die Wahrscheinlichkeit, dass es sich wie ein K „verhalten“ wird, gleich |C− |2 . Dies ist |C− |2 =
1 1 + e−2βt − 2e−βt cos αt . 4
(11.56)
Ein kompliziertes und seltsames Ergebnis!
Hier nun die bemerkenswerte Vorhersage von Gell-Mann und Pais: Wenn ein K0 erzeugt wird, 0 ändert sich die Wahrscheinlichkeit, dass es sich in ein K verwandelt – was sich durch seine Fähigkeit, ein Λ0 zu erzeugen, zeigen kann – gemäß (11.56) mit der Zeit. Diese Vorhersage kam allein durch Logik und die Anwendung der Grundprinzipien der Quantenmechanik zustande – ohne irgendeine Kenntnis der inneren Vorgänge des K-Teilchens. Da niemand etwas über die inneren Vorgänge weiß, war dies das Äußerste, was Gell-Mann und Pais erreichen konnten. Sie
11.5 Das neutrale K-Meson |C− |2
227
(a)
1,0
(b) α = 4πβ 2β = 1010 s−1
0,75
0,75
0,50
0,50
0,25
0,25
0
0
0,5
1,0
1,5
t (10
−10
s)
|C− |2
2,0
0
0
α = πβ 2β = 1010 s−1
2
4
6
8
t (10−10 s)
Abb. 11.6: Die in (11.56) gegebene Funktion (a) für α = 4πβ, (b) für α = πβ (mit 2β = 1010 s−1 ).
konnten keine theoretischen Werte für α und β angeben. Und bis heute war noch niemand dazu in der Lage. Sie konnten einen Wert für β angeben, den sie aus der experimentell beobachteten Geschwindigkeit des Zerfalls in zwei π’s erhielten (2β = 1010 s−1 ), aber sie konnten nichts über α aussagen. Wir haben (11.56) als Funktion der Zeit für zwei Werte von α in Abbildung 11.6 aufgetragen. Sie können sehen, dass die Form der Kurve sehr stark vom Verhältnis α/β abhängt. Zuerst 0 gibt es keine K -Wahrscheinlichkeit, dann baut sie sich auf. Wenn α groß ist, führt die Wahrscheinlichkeit große Schwingungen aus. Wenn α kleiner ist, gibt es wenige oder gar keine Schwingungen – die Wahrscheinlichkeit steigt nur langsam auf 1/4 an. Typischerweise wird sich nun das K-Teilchen mit einer konstanten Geschwindigkeit nahe der Lichtgeschwindigkeit bewegen. Die Kurven von Abbildung 11.6 stellen dann auch die Wahr0 scheinlichkeit längs der Spur dar, ein K zu beobachten – mit typischen Entfernungen von mehreren Zentimetern. Sie können sehen, warum diese Vorhersage so eigentümlich ist. Sie erzeugen ein einzelnes Teilchen, und anstatt dass es einfach zerfällt, tut es etwas anderes. Manchmal zerfällt es, und manchmal verwandelt es sich in ein andersartiges Teilchen. Seine charakteristische Wahrscheinlichkeit, eine Wirkung zu erzeugen, ändert sich auf eine seltsame Art, während es dahinfliegt. Es gibt in der Natur nichts, was diesem Verhalten gleicht. Und diese höchst bemerkenswerte Vorhersage wurde vor allem aus Betrachtungen der Interferenz von Amplituden gewonnen. Wenn wir irgendwo die Möglichkeit haben, die Grundprinzipien der Quantenmechanik in reinster Form zu überprüfen – ist die Überlagerung von Amplituden richtig oder nicht? – dann ist es hier. Trotz der Tatsache, dass dieser Effekt nun schon vor mehreren Jahren vorhergesagt worden ist, gibt es noch keine klare experimentelle Entscheidung. Es gibt einige grobe Resultate, die zeigen, dass das α nicht null ist und dass der Effekt wirklich auftritt – sie zeigen, dass α zwischen 2β und 4β liegt. Das ist alles, was experimentell bekannt ist. Es wäre sehr schön, die Kurve genau zu überprüfen, um zu sehen, ob das Überlagerungsprinzip auch noch in einer so geheimnisvollen Welt wie der der seltsamen Teilchen gilt – mit unbekannten Gründen für die Zerfälle und unbekannten Gründen für die Strangeness. Die Untersuchung, die wir gerade beschrieben haben, ist charakteristisch dafür, wie die Quantenmechanik heute bei der Suche nach einem Verständnis der seltsamen Teilchen angewandt
228
11 Weitere Zweizustandssysteme
wird. Alle komplizierten Theorien, von denen Sie vielleicht hören werden, sind nicht mehr und nicht weniger als derartiger elementarer Hokuspokus, der das Überlagerungsprinzip und andere grundlegende Prinzipien der Quantenmechanik verwendet. Manche Leute behaupten, dass sie Theorien hätten, mit denen es möglich sei, β und α zu berechnen oder zumindest bei gegebenem α das β, aber diese Theorien sind völlig unbrauchbar. Zum Beispiel besagt die Theorie, die den Wert von α bei gegebenem β vorhersagt, dass der Wert von α unendlich groß sein sollte. Das Gleichungssystem, mit dem sie beginnen, enthält zwei π-Mesonen und geht dann von den zwei π’s auf ein K0 zurück usw. Am Ende ergibt sich tatsächlich ein Paar von Gleichungen, so wie wir sie angegeben haben; aber weil es eine unendliche Anzahl von Zuständen von zwei π’s gibt, die von ihren Impulsen abhängen, ergibt die Integration über alle Möglichkeiten ein α, das unendlich groß ist. Aber das α der Natur ist nicht unendlich groß. Daher sind die dynamischen Theorien fehlerhaft. Es ist wirklich bemerkenswert, dass die Phänomene, die überhaupt in der Welt der seltsamen Teilchen vorhergesagt werden können, aus jenen Prinzipien der Quantenmechanik folgen, die sich auf einem Niveau bewegen, auf dem Sie diese gerade lernen.
11.6
Verallgemeinerung auf N-Zustandssysteme
Mit den Zweizustandssystemen sind wir nun fertig. In den folgenden Kapiteln untersuchen wir Systeme mit mehr Zuständen. Die Verallgemeinerung der Konzepte, die wir für zwei Zustände ausgearbeitet haben, auf N-Zustandssysteme ist recht einfach. Es geht so. Wenn ein System N verschiedene Zustände hat, können wir jeden Zustand | ψ(t) � als Linearkombination von irgendeinem System von Basiszuständen | i � darstellen: | ψ(t) � = | i � Ci (t) , i = 1, 2, 3, . . . , N. (11.57) alle i
Die Koeffizienten Ci (t) sind die Amplituden � i | ψ(t) �. Das zeitliche Verhalten der Amplituden Ci wird bestimmt durch die Gleichungen i
dCi (t) = Hi j C j , dt j
i = 1, 2, 3, . . . , N,
(11.58)
wobei die Energiematrix Hi j die Physik des Problems beschreibt. Es sieht genauso wie bei zwei Zuständen aus. Nur läuft jetzt sowohl i als auch j über alle N Basiszustände, und die Energiematrix Hi j – oder, wenn Sie es vorziehen, die Hamilton-Matrix – ist eine N × N-Matrix mit N 2 Zahlen. Wie vorher ist Hi∗j = H ji (solange Teilchen erhalten bleiben), und die Diagonalelemente Hii sind reelle Zahlen. Wir haben eine allgemeine Lösung für die Ci eines Zweizustandssystems gefunden, für den Fall, dass die Energiematrix zeitlich konstant ist. Es ist auch nicht schwierig, Gleichung (11.58) für ein N-Zustandssystem zu lösen, wenn H zeitunabhängig ist. Wieder suchen wir zuerst nach einer möglichen Lösung, bei der alle Amplituden dieselbe Zeitabhängigkeit haben. Wir versuchen es mit Ci = ai e−(i/)Et .
(11.59)
11.6 Verallgemeinerung auf N-Zustandssysteme
229
Wenn wir diese Ci in (11.58) einsetzen, erhalten wir dCi (t)/dt = (−i/)ECi . Den gemeinsamen Exponentialfaktor können wir aus allen Termen herauskürzen. Dies ergibt � Eai = Hi j a j , i = 1, 2, 3, . . . , N, (11.60) j
was ein System von N linearen algebraischen Gleichungen in den N Unbekannten a1 , a2 , . . . , aN ist. Sie erhalten nur dann eine Lösung, wenn Sie Glück haben – nur dann, wenn die Determinante der Koeffizienten von allen a’s null ist. Es ist aber nicht nötig, so spitzfindig zu sein; Sie können einfach anfangen, die Gleichungen auf beliebige Art zu lösen, und Sie werden feststellen, dass sie nur für gewisse Werte von E gelöst werden können. (Bedenken Sie, dass E die einzige Variable in den Gleichungen ist.) Wenn Sie jedoch formal sein wollen, dann schreiben Sie (11.60) in der Form � (Hi j − δi j E)a j = 0 , i = 1, 2, 3, . . . , N.
(11.61)
j
Dann können Sie die Regel anwenden, dass diese Gleichungen nur für Werte von E eine Lösung haben, für die det(Hi j − δi j E) = 0
(11.62)
gilt. Jeder Term der Determinante ist einfach Hi j , außer dass E von jedem Diagonalelement subtrahiert wird. Das heißt, (11.62) ist gleichbedeutend mit ⎞ ⎛ H12 H13 . . .⎟⎟ ⎜⎜⎜H11 − E ⎟ ⎜⎜⎜ H H22 − E H23 . . .⎟⎟⎟⎟⎟ 21 det ⎜⎜⎜⎜ = 0. (11.63) ⎜⎝⎜ H31 H32 H33 − E . . .⎟⎟⎟⎠⎟ ... ... ... ...
Dies ist natürlich nur eine spezielle Art, eine algebraische Gleichung für E zu schreiben, die die Summe einer Gruppe von Produkten aller Terme in einer bestimmten Anordnung ist. Diese Produkte ergeben alle Potenzen von E bis E N .
Wir haben also ein Polynom N-ter Ordnung, das gleich null ist, und es gibt im Allgemeinen N Wurzeln. (Wir müssen jedoch bedenken, dass einige von ihnen mehrfache Wurzeln sein können, was bedeutet, dass zwei oder mehr Wurzeln gleich sind.) Bezeichnen wir die N Wurzeln mit E I , E II , E III , . . . , En , . . . , EN .
(11.64)
(Wir verwenden n, um die n-te römische Zahl darzustellen, sodass n die Werte I, II, . . . , N annimmt.) Es kann zwar sein, dass einige dieser Energien gleich sind – sagen wir E II = E III – wir wollen aber dennoch verschiedene Bezeichnungen verwenden. Die Gleichungen (11.60) und (11.61) haben für jedes En eine Lösung. Wenn Sie irgendein En in (11.60) einsetzen und nach den ai auflösen, erhalten Sie ein System von Koeffizienten, das zur Energie En gehört. Wir wollen dieses System mit ai (n) bezeichnen. Wenn wir diese ai (n) in (11.59) verwenden, erhalten wir die Amplituden Ci (n), dass der Zustand mit der bestimmten Energie En in den Basiszuständen | i � ist. Wenn | n � den Zustandsvektor des Zustands mit der bestimmten Energie En bei t = 0 bezeichnet, können wir schreiben Ci (n) = � i | n � e−(i/)En t ,
230
11 Weitere Zweizustandssysteme
mit � i | n � = ai (n) .
(11.65)
Der vollständige Zustand | ψn (t) � mit der bestimmten Energie En kann dann geschrieben werden als | ψn (t) � = | i � ai (n) e−(i/)En t , i
oder | ψn (t) � = | n � e−(i/)En t .
(11.66)
Die Zustandsvektoren | n � beschreiben die Konfiguration der Zustände mit bestimmter Energie, haben aber die Zeitabhängigkeit ausgeklammert. Sie sind also konstante Vektoren, die wir als neues Basissystem verwenden können. Jeder der Zustände | n � hat – wie Sie leicht zeigen können – die Eigenschaft, dass er, wenn man auf ihn den Hamilton-Operator Hˆ anwendet, En -mal denselben Zustand ergibt: Hˆ | n � = En | n � .
(11.67)
Die Energie En ist daher eine Zahl, die ein Charakteristikum des Hamilton-Operators Hˆ ist. Wie wir gesehen haben, hat ein Hamilton-Operator im Allgemeinen mehrere charakteristische Energien. Diese werden die Eigenwerte der Matrix Hi j bzw. des Operators Hˆ genannt. Zu jedem Eigenwert von Hˆ – mit anderen Worten zu jeder Energie – gibt es einen Zustand mit bestimmter Energie, den wir einen „stationären Zustand“ genannt haben. Die Physiker nennen gewöhnlich ˆ Jeder Eigenzustand entspricht einem speziellen die Zustände | n � „die Eigenzustände von H.“ Eigenwert En . Im Allgemeinen können nun die N Zustände | n � auch als Basissystem verwendet werden. Damit dies gilt, müssen alle Zustände orthogonal sein, was bedeutet, dass für jedes verschiedene Zustandspaar | n � und | m � gilt �n|m� = 0.
(11.68)
Dies ist automatisch erfüllt, wenn alle Energien verschieden sind. Auch können wir alle ai (n) mit einem geeigneten Faktor multiplizieren, sodass alle Zustände normiert sind, also � n | n � = 1 für alle n .
(11.69)
Falls (11.63) zufällig zwei (oder mehr) Wurzeln mit derselben Energie hat, gibt es einige geringfügige Komplikationen. Zunächst gibt es noch zwei verschiedene Systeme von ai ’s, die zur gleichen Energie gehören, aber die Zustände, die sie ergeben, brauchen nicht orthogonal zu sein. Angenommen, Sie führen das oben beschriebene Verfahren durch und finden zwei stationäre Zustände | μ � und | ν � mit gleicher Energie. Dann müssen sie nicht zwangsläufig orthogonal sein – wenn Sie Pech haben, ist �μ|ν� 0.
11.6 Verallgemeinerung auf N-Zustandssysteme
231
Sie können sich jedoch immer zwei neue Zustände | μ� � und | ν� � konstruieren, die immer noch dieselbe Energie haben, aber orthogonal sind, sodass gilt � μ� | ν� � = 0 .
(11.70)
Sie können dies erreichen, indem Sie | μ� � und | ν� � aus einer geeigneten Linearkombination von | μ � und | ν � aufbauen, wobei die Koeffizienten so gewählt werden, dass sie Gleichung (11.70) lösen. Es ist immer günstig, dies zu tun. Wir wollen allgemein annehmen, dass dies erfolgt ist, sodass wir alle Energie-Eigenzustände | n � als orthogonal betrachten können.
Wir wollen zu Übungszwecken beweisen, dass zwei Energie-Eigenzustände mit verschiedenen Energien tatsächlich orthogonal sind. Für den Zustand | n � mit der Energie E n gilt Hˆ | n � = En | n � .
(11.71)
Diese Operatorgleichung ist in Wirklichkeit eine Gleichung zwischen Zahlen. Wenn wir die fehlenden Teile ergänzen, bedeutet sie dasselbe wie � i | Hˆ | j � � j | n � = En � i | n � . (11.72) j
Wenn wir das komplex Konjugierte dieser Gleichung nehmen, erhalten wir ∗ � i | Hˆ | j � � j | n �∗ = En∗ � i | n �∗ .
(11.73)
j
Beachten Sie nun, dass das komplex Konjugierte einer Amplitude die umgekehrte Amplitude ist, sodass (11.73) geschrieben werden kann als � n | j � � j | Hˆ | i � = En∗ � n | i � . (11.74) j
Da diese Gleichung für jedes i gilt, ist ihre „Kurzform“ � n | Hˆ = En∗ � n | ,
(11.75)
die die Adjungierte zu Gleichung (11.71) genannt wird. Nun können wir leicht beweisen, dass En eine reelle Zahl ist. Wir multiplizieren (11.71) von links mit � n | und erhalten � n | Hˆ | n � = En ,
(11.76)
da � n | n � = 1 ist. Dann multiplizieren wir (11.75) von rechts mit | n � und erhalten � n | Hˆ | n � = E n∗ .
(11.77)
Aus (11.76) und (11.77) folgt En = En∗ ,
(11.78)
was bedeutet, dass En reell ist. Wir können in Gleichung (11.75) den Stern von En weglassen. Endlich sind wir soweit, zeigen zu können, dass die verschiedenen Energie-Eigenzustände orthogonal sind. Seien | n � und | m � zwei Energie-Eigenzustände mit bestimmter Energie. Wenn
232
11 Weitere Zweizustandssysteme
wir Gleichung (11.75) für den Zustand m benutzen und sie von rechts mit | n � multiplizieren, erhalten wir � m | Hˆ | n � = Em � m | n � . Wenn wir aber (11.71) von links mit � m | multiplizieren, erhalten wir � m | Hˆ | n � = En � m | n � .
Da die linken Seiten dieser beiden Gleichungen gleich sind, sind es die rechten Seiten auch: Em � m | n � = En � m | n � .
(11.79)
Für Em = En ist die Gleichung trivial. Wenn aber die Energien der beiden Zustände | m � und | n � verschieden sind (Em En ), folgt aus (11.79), dass � m | n � null sein muss, was wir beweisen wollten. Die beiden Energie-Eigenzustände sind notwendig orthogonal, wenn Em und En numerisch verschieden sind.
12
Die Hyperfeinaufspaltung im Wasserstoff
12.1
Basiszustände für ein System mit zwei Spin- 12 -Teilchen
In diesem Kapitel beschäftigen wir uns mit der „Hyperfeinaufspaltung“ des Wasserstoffs, weil sie ein physikalisch interessantes Beispiel ist, das wir bereits mit unseren bisherigen Kenntnissen der Quantenmechanik untersuchen können. Es ist ein Beispiel mit mehr als zwei Zuständen, und es wird die Methoden der Quantenmechanik veranschaulichen, wenn sie auf etwas kompliziertere Probleme angewandt wird. Es ist hinreichend kompliziert, sodass Sie, nachdem Sie gesehen haben, wie dieses eine Problem behandelt wird, sofort die Verallgemeinerung für alle möglichen Arten von Problemen ableiten können. Wie Sie wissen, besteht das Wasserstoffatom aus einem Elektron, das sich in der Nachbarschaft des Protons befindet. Es kann einen von mehreren diskreten Energiezuständen annehmen, wobei in jedem dieser Zustände die Bewegungsform des Elektrons verschieden ist. Der erste angeregte Zustand liegt zum Beispiel 3/4 Rydberg oder etwa 10 Elektronenvolt über dem Grundzustand. Aber nicht einmal der so genannte Grundzustand ist wegen der Spins von Elektron und Proton wirklich ein einzelner Zustand mit nur einer Energie. Diese Spins sind der Grund für die „Hyperfeinstruktur“, d. h. die Aufspaltung der Energieniveaus in mehrere, dicht benachbarte Niveaus. Das Elektron kann entweder Spin „up“ oder Spin „down“ haben, und das Proton kann ebenfalls entweder Spin „up“ oder Spin „down“ haben. Es gibt daher vier mögliche Spinzustände für jeden dynamischen Zustand des Atoms. Das heißt, wenn man von „dem Grundzustand“ des Wasserstoffs spricht, meint man in Wirklichkeit die „vier Grundzustände“ und nicht nur den alleruntersten. Die vier Spinzustände haben nicht alle exakt die gleiche Energie; es gibt geringfügige Verschiebungen gegenüber der Energie, die wir ohne Spin erwarten würden. Die Verschiebungen sind jedoch wesentlich kleiner als die etwa 10 Elektronenvolt zwischen dem Grundzustand und dem nächsthöheren Zustand. Als Folge davon ist die Energie jedes dynamischen Zustands in einen Satz von dicht benachbarten Energieniveaus aufgespalten – die so genannte Hyperfeinaufspaltung. In diesem Kapitel wollen wir die Energiedifferenzen zwischen den vier Spinzuständen berechnen. Die Hyperfeinaufspaltung ist auf die Wechselwirkung der magnetischen Momente von Elektron und Proton zurückzuführen, die für jeden Spinzustand eine etwas andere Energie ergibt. Die Energieverschiebungen betragen nur etwa ein Zehnmillionstel Elektronenvolt, was sehr klein ist im Vergleich zu 10 Elektronenvolt! Wegen dieser großen Lücke können wir den Grundzustand des Wasserstoffs als „Vierzustandssystem“ ansehen, ohne uns um die Tatsache zu kümmern, dass es in Wirklichkeit viel mehr Zustände mit höherer Energie gibt. Wir werden
234
12 Die Hyperfeinaufspaltung im Wasserstoff
uns hier auf eine Untersuchung der Hyperfeinstruktur des Grundzustandes des Wasserstoffatoms beschränken. Für unsere Zwecke müssen wir nicht die Einzelheiten über die Positionen des Elektrons und des Protons beachten, weil dies alles sozusagen vom Atom selbst bearbeitet worden ist – es hat sich selbst bearbeitet, indem es in den Grundzustand gegangen ist. Wir müssen nur wissen, dass ein Elektron und ein Proton benachbart sind, mit einer bestimmten räumlichen Beziehung. Zusätzlich können sie verschiedene relative Ausrichtungen ihrer Spins haben. Nur die Wirkungen der Spins möchten wir näher betrachten. Die erste Frage, die wir zu beantworten haben, lautet: Was sind die Basiszustände des Systems? Nun ist diese Frage nicht ganz richtig gestellt. So etwas wie „die“ Basiszustände gibt es nicht, weil natürlich das System von Basiszuständen, das Sie wählen, nicht das einzig mögliche ist. Es können immer neue Systeme aus Linearkombinationen der alten gemacht werden. Es gibt immer viele Wahlmöglichkeiten für die Basiszustände, und jede Wahl ist gleichberechtigt. Daher lautet die Frage nicht, was ist das Basissystem, sondern was könnte ein Basissystem sein? Wir können wählen, welches wir wollen und was uns geeignet erscheint. Es ist gewöhnlich am besten, mit einem Basissystem zu beginnen, das physikalisch das verständlichste ist. Es braucht nicht die Lösung eines Problems zu sein und muss auch keine direkte Bedeutung haben, aber es wird allgemein das Verständnis der Vorgänge erleichtern. Wir wählen die folgenden vier Basiszustände: Zustand 1: Elektron und Proton Spin up Zustand 2: Elektron Spin up, Proton Spin down Zustand 3: Elektron Spin down, Proton Spin up Zustand 4: Elektron und Proton Spin down Wir brauchen eine bequeme Notation für diese vier Zustände, wir möchten sie daher folgendermaßen darstellen: Zustand 1: | ++ � ; Elektron up, Proton up Zustand 2: | +− � ; Elektron up, Proton down Zustand 3: | −+ � ; Elektron down, Proton up Zustand 4: | −− � ; Elektron down, Proton down
(12.1)
Sie müssen sich merken, dass sich das erste Plus- bzw. Minuszeichen auf das Elektron bezieht und das zweite auf das Proton. Wir haben die Notation in Abbildung 12.1 zusammengefasst, um im Folgenden bequem darauf Bezug nehmen zu können. Es wird auch manchmal bequem sein, diese Zustände mit | 1 �, | 2 �, | 3 � und | 4 � zu bezeichnen.
Vielleicht sagen Sie: „Aber diese Teilchen wechselwirken, und vielleicht sind dies nicht die richtigen Basiszustände. Es hört sich so an, als ob Sie die zwei Teilchen unabhängig betrachten.“
Ja, das stimmt! Die Wechselwirkung wirft die Frage nach der Hamilton-Matrix des Systems auf; aber die Wechselwirkung spielt keine Rolle bei der Frage, wie man das System beschreibt. Was wir als Basiszustände wählen, hat nichts mit dem zu tun, was als Nächstes geschieht. Es kann sein, dass das Atom nicht für immer in einem dieser Basiszustände bleiben kann, selbst wenn es so begonnen hat. Das ist eine andere Frage. Das ist die Frage, wie sich die Amplituden
12.1 Basiszustände für ein System mit zwei Spin- 21 -Teilchen
235
Elektronen | + + �, | 1 � Proton
| + − �, | 2 �
| − + �, | 3 �
| − − �, | 4 � Abb. 12.1: Ein Satz von Basiszuständen für den Grundzustand des Wasserstoffatoms.
mit der Zeit in einer speziellen (festgelegten) Basis ändern. Bei der Auswahl der Basiszustände wählen wir nur die „Einheitsvektoren“ für unsere Beschreibung. Weil wir gerade dabei sind, diskutieren wir gleich das allgemeine Problem, einen Satz von Basiszuständen zu finden, wenn man mehr als ein Teilchen betrachtet. Sie kennen die Basiszustände für ein einzelnes Teilchen. Ein Elektron zum Beispiel ist in Wirklichkeit – nicht in unseren vereinfachten Fällen – vollständig beschrieben durch die Angabe der jeweiligen Amplituden, in einem der folgenden Zustände zu sein: | Elektron „up“ mit Impuls p � oder | Elektron „down“ mit Impuls p �
Es gibt tatsächlich zwei unendliche Sätze von Zuständen, für jeden Wert von p und jede Spinrichtung einen Zustand. Das heißt, dass ein Elektronenzustand | ψ � vollständig beschrieben ist, wenn Sie alle Amplituden � +, p | ψ� und � −, p | ψ� kennen. Dabei sind + und − die Komponenten des Drehimpulses längs einer Achse – gewöhnlich der z-Achse –, und p ist der Impulsvektor. Es muss daher zwei Amplituden für jeden möglichen Impuls geben (ein mehrfach unendliches System von Basiszuständen). Das ist alles, was es zur Beschreibung eines einzelnen Teilchens gibt.
236
12 Die Hyperfeinaufspaltung im Wasserstoff
Wenn man mehr als ein Teilchen betrachtet, können die Basiszustände auf ähnliche Art geschrieben werden. Wenn zum Beispiel ein Elektron und ein Proton in einer komplizierteren Situation als der hier betrachteten auftreten, könnten die Basiszustände von folgender Art sein: | ein Elektron mit Spin „up“, das sich mit dem Impuls p1 bewegt, und ein Proton mit Spin „down“, das sich mit dem Impuls p2 bewegt.� Und so weiter für andere Spinkombinationen. Wenn es mehr als zwei Teilchen gibt – dasselbe Prinzip. Wie Sie sehen, ist es wirklich sehr einfach, die möglichen Basiszustände aufzuschreiben. Das einzige Problem besteht darin, die Hamilton-Matrix zu finden. Für unsere Untersuchung des Grundzustands des Wasserstoffs müssen wir nicht die vollständigen Sätze von Basiszuständen für die verschiedenen Impulse benutzen. Wir setzen spezielle Impulszustände für das Proton und das Elektron voraus, wenn wir „Grundzustand“ sagen. Einzelheiten dieser Anordnung – die Amplituden für alle Impulsbasiszustände – können zwar ausgerechnet werden, aber das ist ein anderes Problem. Wir befassen uns jetzt nur mit den Wirkungen der Spins, wir können uns also auf die vier Basiszustände von (12.1) beschränken. Unser nächstes Problem ist: Was ist die Hamilton-Matrix für dieses System von Zuständen?
12.2
Der Hamilton-Operator für den Grundzustand des Wasserstoffs
Sie werden gleich erfahren, was das ist. Aber zuerst sei an Folgendes erinnert: Jeder Zustand | ψ � kann immer als Linearkombination der Basiszustände geschrieben werden. Wir können daher schreiben | ψ � = | ++ � � + + | ψ � + | +− � � + − | ψ � + | −+ � � − + | ψ � + | −− � � − − | ψ � .
(12.2)
| ψ � = | ++ � C1 + | +− � C2 + | −+ � C3 + | −− � C4 .
(12.3)
Beachten Sie, dass die vollständigen Klammern nur komplexe Zahlen sind, wir können sie daher auch wie gewöhnlich als Ci schreiben, wobei i = 1, 2, 3 oder 4 ist. Gleichung (12.2) wird dann zu
Durch die Angabe der vier Amplituden Ci ist der Spinzustand | ψ � vollständig beschrieben. Wenn sich diese vier Amplituden zeitlich ändern – und das werden sie – wird die Geschwindigkeit der zeitlichen Änderung durch den Operator Hˆ angegeben. Das Problem besteht also darin, Hˆ zu finden. Es gibt keine allgemeine Regel, wie man die Hamilton-Matrix eines atomaren Systems angibt, und die richtige Formel zu finden, ist eine größere Herausforderung, als ein System von Basiszuständen zu finden. Wir können zwar eine allgemeine Regel angeben, wie man einen Satz von Basiszuständen für jedes Problem mit einem Proton und einem Elektron wählt, aber die Beschreibung der allgemeinen Hamilton-Matrix einer solchen Kombination ist auf diesem Niveau
12.2 Der Hamilton-Operator für den Grundzustand des Wasserstoffs
237
zu schwierig. Stattdessen wollen wir durch eine heuristische Argumentation zu einer HamiltonMatrix kommen – und Sie werden sie als die richtige annehmen müssen, weil die Ergebnisse mit der experimentellen Beobachtung übereinstimmen. Tabelle 12.1: Eigenschaften der Sigma-Operatoren
σz | + � = + | + �
σz | − � = − | − �
σx | + � = + | − �
σx | − � = + | + �
σy | + � = +i | − � σy | − � = −i | + �
Sie werden sich erinnern, dass wir im vorigen Kapitel die Hamilton-Matrix eines einzelnen Spin- 21 -Teilchens beschreiben konnten, indem wir die Sigma-Matrizen – oder die gleichwertigen Sigma-Operatoren – benutzt haben. Die Eigenschaften der Sigma-Operatoren sind in Tabelle 12.1 noch einmal zusammengestellt. Diese Operatoren, die nur eine bequeme, vereinfachende Methode waren, um die Matrixelemente des Typs � + | σz | + � im Auge zu behalten, waren zur Beschreibung des Verhaltens eines einzelnen Teilchens vom Spin 12 nützlich. Die Frage lautet: Können wir ein analoges Mittel finden, um ein System mit zwei Spins zu beschreiben? Die Antwort ist ja, es ist sogar sehr leicht: Wir erfinden dazu ein Konstrukt, das wir „Sigma-Elektron“ nennen wollen und das wir durch den Vektoroperator σe mit den x-, y- und z-Komponenten σex , σey und σez darstellen. Wir treffen nun die Vereinbarung, dass, wenn einer dieser Operatoren auf einen unserer vier Basiszustände des Wasserstoffatoms angewendet wird, dieser nur auf den Elektronenspin wirkt, und zwar genau so, als wenn das Elektron ganz für sich allein wäre. Beispiel: Was ist σey | −+ �? Da die Anwendung von σy auf ein „down“-Elektron −i-mal den entsprechenden Zustand mit dem „up“-Elektron liefert, gilt σey | −+ � = −i | ++ � . (Wenn σey auf den kombinierten Zustand wirkt, dreht es den Elektronenspin um, beeinflusst das Proton aber nicht und multipliziert das Ergebnis mit −i.) Angewendet auf die anderen Zustände, ergibt σey σey | ++ � = i | −+ � , σey | +− � = i | −− � , σey | −− � = −i | +− � . Beachten Sie, dass die Operatoren σe lediglich auf das erste Spinsymbol wirken, das heißt auf den Elektronenspin. Als Nächstes definieren wir den entsprechenden Operator „Sigma-Proton“ für den Protonenp p p spin. Seine drei Komponenten σ x , σy , σz wirken ebenso wie σe , jedoch nur auf den Proto-
238
12 Die Hyperfeinaufspaltung im Wasserstoff p
nenspin. Wenn zum Beispiel σ x auf die vier Basiszustände wirkt, erhalten wir gemäß Tabelle 12.1 p
σ x | ++ � σpx | +− � p σ x | −+ � p σ x | −− �
= = = =
| +− � | ++ � | −− � | −+ �
, , , .
Wie Sie sehen, ist es nicht sehr schwierig. Im allgemeinen Fall können wir nun komplexere Operatoren anwenden. Wir können zum Beip spiel Produkte der beiden Operatoren antreffen, wie σey σz . Wenn wir ein solches Produkt auswerten, wenden wir zuerst den rechten Operator an und dann den linken.1 So erhalten wir zum Beispiel p p σex σz | +− � = σex σz | +− � = σex (− | +− �) = −σex | +− � = − | −− � .
Beachten Sie, dass diese Operatoren reine Zahlen nicht beeinflussen – wir haben diese Tatsache benutzt, als wir σex (−1) = (−1)σex geschrieben haben. Wir sagen, dass die Operatoren mit reinen Zahlen „kommutieren“ oder dass eine Zahl „durch den Operator gezogen werden kann“. Sie p können sich im Umgang mit den Operatoren üben, indem Sie zeigen, dass das Produkt σex σz folgende Ergebnisse für die vier Zustände liefert: p
σex σz | ++ � = | −+ � , p
σex σz | +− � = − | −− � , p
σex σz | −+ � = | ++ � , p
σex σz | −− � = − | +− � .
Wenn wir alle möglichen Operatorkombinationen bilden und jede Art von Operator höchstens einmal verwenden, gibt es sechzehn Möglichkeiten. Ja, sechzehn – vorausgesetzt, wir schließen auch den „Einheitsoperator“ 1ˆ mit ein. Zunächst gibt es die drei Operatoren σex , σey , σez . Dann die p p p drei Operatoren σ x , σy , σz – das macht sechs. Zusätzlich gibt es die neun möglichen Produkte p der Form σex σy , was insgesamt 15 ergibt. Und es gibt den Einheitsoperator, der jeden Zustand unverändert lässt. Insgesamt also sechzehn. Beachten Sie nun, dass für ein Vierzustandssystem die Hamilton-Matrix eine 4 × 4-Matrix sein muss – sie hat also sechzehn Elemente. Man kann leicht zeigen, dass jede 4 × 4-Matrix – und insbesondere auch die Hamilton-Matrix – als Linearkombination der sechzehn DoppelSpinmatrizen geschrieben werden kann, die dem Satz von Operatoren entsprechen, den wir gerade aufgestellt haben. Für die Wechselwirkung zwischen einem Proton und einem Elektron, die nur ihre Spins erfasst, erwarten wir daher, dass der Hamilton-Operator als Linearkombination dieser 16 Operatoren geschrieben werden kann. Die einzige Frage ist, wie? Nun, zunächst wissen wir, dass die Wechselwirkung nicht von der Wahl der Koordinatenachsen abhängt. Wenn es keine äußeren Einflüsse – etwa ein magnetisches Feld – gibt, die eine Vorzugsrichtung im Raum festlegen, kann der Hamilton-Operator nicht von der Wahl der x-, y- und 1
Bei diesen speziellen Operatoren spielt die Reihenfolge, in der sie angewendet werden, keine Rolle.
12.2 Der Hamilton-Operator für den Grundzustand des Wasserstoffs
239
z-Achsen abhängen. Das bedeutet, dass der Hamilton-Operator keinen Ausdruck wie σex ganz allein haben kann. Das wäre unsinnig, weil dann jemand mit einem anderen Koordinatensystem andere Ergebnisse erhalten würde. Die einzigen Möglichkeiten sind entweder ein Term mit der Einheitsmatrix, sagen wir eine ˆ oder eine Kombination der Sigmas, die nicht von den Koordinaten abKonstante a (mal 1), hängt – eine „invariante“ Kombination. Die einzige skalare invariante Kombination von zwei Vektoren ist das innere Produkt. Dieses lautet für unsere Sigmas σe · σp = σex σpx + σey σpy + σez σpz .
(12.4)
Dieser Operator ist invariant bezüglich einer Drehung des Koordinatensystems. Daher ist die einzige Möglichkeit für einen Hamilton-Operator mit der richtigen Symmetrie im Raum eine Konstante E0 mal die Einheitsmatrix plus eine Konstante A mal dem inneren Produkt, also Hˆ = E0 + A σe · σp .
(12.5)
Das ist unser Hamilton-Operator. Wegen der Symmetrie des Raumes ist dies die einzige Möglichkeit, solange es kein äußeres Feld gibt. Der konstante Term sagt uns nicht viel; er hängt nur von dem Niveau ab, von dem aus wir die Energien messen. Wir könnten genauso gut E0 = 0 setzen. Der zweite Term sagt uns alles, was wir wissen müssen, um die Niveauaufspaltung des Wasserstoffs zu berechnen. Wenn Sie wollen, können Sie den Hamilton-Operator auch anders betrachten. Bei zwei benachbarten Magneten mit magnetischen Momenten μe und μp hängt die wechselseitige Energie unter anderem von μe · μp ab. Und wie Sie sich erinnern werden, hatten wir herausgefunden, dass die klassische Größe, die wir μe nennen, in der Quantenmechanik als μe σe erscheint. Entsprechend wird die klassische Größe μp in der Quantenmechanik zu μp σp (wobei μp das magnetische Moment des Protons ist, welches etwa 1000-mal kleiner als μe ist und entgegengesetztes Vorzeichen hat). Daher besagt (12.5), dass die Wechselwirkungsenergie wie die der Wechselwirkung zwischen zwei Magneten ist – nur nicht ganz, weil die Wechselwirkung der beiden Magnete vom radialen Abstand zwischen ihnen abhängt. Gleichung (12.5) könnte aber – und tut sie tatsächlich – eine Art mittlere Wechselwirkung beschreiben. Das Elektron bewegt sich innerhalb des Atoms überall herum, und unser Hamilton-Operator gibt nur die mittlere Wechselwirkungsenergie an. Alles was er aussagt, ist, dass es bei einer gegebenen räumlichen Anordnung von Elektron und Proton eine Energie gibt, die, klassisch ausgedrückt, proportional zum Kosinus des Winkels zwischen den beiden magnetischen Momenten ist. Dieses klassische qualitative Bild hilft Ihnen vielleicht zu verstehen, woher Gleichung (12.5) kommt, aber wichtig ist, dass sie die richtige quantenmechanische Formel ist. Die Größenordnung der klassischen Wechselwirkung zwischen zwei Magneten ist das Produkt der beiden magnetischen Momente dividiert durch die dritte Potenz des Abstands zwischen ihnen. Der Abstand zwischen Elektron und Proton im Wasserstoffatom ist, grob gesagt, ein halber Atomradius oder 0,5 Ångström. Es lässt sich daher grob abschätzen, dass die Konstante A ungefähr gleich dem Produkt der beiden magnetischen Momente μe und μp dividiert durch die dritte Potenz von 1/2 Ångström sein sollte. Diese Abschätzung ergibt eine Zahl in der richtigen Größenordnung. Es stellt sich heraus, dass A mit der vollständigen Quantentheorie des Wasserstoffatoms genau berechnet werden kann. Doch so weit sind wir noch nicht. A ist tatsächlich schon mit einer Genauigkeit von 30 zu einer Million berechnet worden. Im Gegensatz zur
240
12 Die Hyperfeinaufspaltung im Wasserstoff
Umklappkonstanten A des Ammoniakmoleküls, die theoretisch überhaupt nicht gut bestimmt werden konnte, kann also unsere Konstante A für den Wasserstoff aus einer ausführlicheren Theorie berechnet werden. Trotzdem wollen wir für unsere Zwecke A als eine Zahl ansehen, die experimentell bestimmt werden kann, und die Physik dieser Situation untersuchen. Wir können den durch (12.5) gegebenen Hamilton-Operator in der Gleichung iC˙ i = Hi j C j
(12.6)
j
verwenden, um herauszufinden, wie die Spinwechselwirkung die Energieniveaus beeinflusst. Um dies zu tun, müssen wir die sechzehn Matrixelemente Hi j = � i | H | j � berechnen, die den sechzehn Paaren aus den vier Basiszuständen in (12.1) entsprechen. Zunächst rechnen wir aus, was Hˆ | j � für jeden der vier Basiszustände ist, zum Beispiel p p p (12.7) Hˆ | ++ � = A σe · σp | ++ � = A σex σ x + σey σy + σez σz + + .
Wenn wir die Methoden benutzen, die wir vor kurzem beschrieben haben – es ist leicht, wenn Sie sich Tabelle 12.1 gemerkt haben –, finden wir, wie jedes Paar von σ’s auf | ++ � wirkt. Die Antwort ist p
σex σ x | ++ � = + | −− � , p σey σy | ++ � = − | −− � , p σez σz
(12.8)
| ++ � = + | ++ � .
Damit wird (12.7) zu Hˆ | ++ � = A | −− � − | −− � + | ++ � = A | ++ � .
(12.9)
Da unsere vier Basiszustände alle orthogonal sind, ergibt sich daraus sofort � + + | H | ++ � = A � + + | ++ � = A ,
� + − | H | ++ � = A � + − | ++ � = 0 ,
� − + | H | ++ � = A � − + | ++ � = 0 ,
(12.10)
� − − | H | ++ � = A � − − | ++ � = 0 .
Wenn wir beachten, dass � j | H | i � = � i | H | j �∗ ist, können wir schon die Differentialgleichung für die Amplitude C1 aufschreiben: iC˙ 1 = H11C1 + H12 C2 + H13C3 + H14 C4 (12.11)
oder iC˙ 1 = AC1 . Das ist alles! Wir erhalten nur den einen Term.
Um nun die übrigen hamiltonschen Gleichungen zu erhalten, müssen wir dieselbe Prozedur ˆ angewendet auf die anderen Basiszustände, durchführen. Zuerst sollten Sie etwas üben, für H,
12.2 Der Hamilton-Operator für den Grundzustand des Wasserstoffs
241
Tabelle 12.2: Spinoperatoren für das Wasserstoffatom p
σex σ x | ++ �= + | −− � p
σex σ x | +− �= + | −+ � p
σex σ x | −+ �= + | +− � p
σex σ x | −− �= + | ++ � p
σey σy | ++ �= − | −− � p
σey σy | +− �= + | −+ � p
σey σy | −+ �= + | +− � p
σey σy | −− �= − | ++ � p
σez σz | ++ �= + | ++ � p
σez σz | +− �= − | +− � p
σez σz | −+ �= − | −+ � σez σpz | −− �= + | −− �
indem Sie die in Tabelle 12.2 angegebenen Sigmaprodukte überprüfen. Dann können wir sie verwenden und erhalten Hˆ | +− � = A{2 | −+ � − | +− �} , Hˆ | −+ � = A{2 | +− � − | −+ �} , Hˆ | −− � = A | −− � .
(12.12)
Wenn wir dann alle der Reihe nach von links mit allen anderen Basis-Zustandsvektoren multiplizieren, erhalten wir die folgende Hamilton-Matrix Hi j ⎛ ⎞ ⎜⎜⎜A 0 0 0⎟⎟⎟ ⎜⎜⎜ ⎟ ⎜⎜⎜ 0 −A 2A 0⎟⎟⎟⎟⎟ ⎜ ⎟⎟⎟ . Hi j = ⎜⎜⎜⎜ (12.13) ⎜⎜⎜ 0 2A −A 0⎟⎟⎟⎟⎟ ⎜⎜⎜ ⎟⎟⎟ ⎝0 0 0 A⎠ Das bedeutet natürlich nichts anderes, als dass unsere Differentialgleichungen für die vier Amplituden Ci folgende Form annehmen: iC˙ 1 = AC1 , iC˙ 2 = −AC2 + 2AC3 , iC˙ 3 = 2AC2 − AC3 ,
iC˙ 4 = AC4 .
(12.14)
242
12 Die Hyperfeinaufspaltung im Wasserstoff
Bevor wir diese Gleichungen lösen, können wir nicht widerstehen, eine geschickte Regel zu erwähnen, die auf Dirac zurückgeht. Sie wird Ihnen das Gefühl geben, wirklich fortgeschritten zu sein, doch für unsere weitere Arbeit brauchen wir sie nicht. Wir wissen aus den Gleichungen (12.9) und (12.12), dass σe · σp | ++ � = | ++ � ,
σe · σp | +− � = 2 | −+ � − | +− � , σe · σp | −+ � = 2 | +− � − | −+ � ,
(12.15)
σe · σp | −− � = | −− � .
Schaut her, sagte Dirac, ich kann die erste und letzte Gleichung auch schreiben als σe · σp | ++ � = 2 | ++ � − | ++ � ,
σe · σp | −− � = 2 | −− � − | −− � . dann sind sie alle ganz ähnlich. Nun erfinde ich einen neuen Operator, den ich mit PSpinaustausch bezeichne und für den ich die folgenden Eigenschaften definiere:2 PSpinaustausch | ++ � = | ++ � ,
PSpinaustausch | +− � = | −+ � , PSpinaustausch | −+ � = | +− � , PSpinaustausch | −− � = | −− � . Alles, was der Operator bewirkt, ist die Vertauschung der Spinrichtungen der beiden Teilchen. Dann kann ich das Gleichungssystem in (12.15) als eine einfache Operatorgleichung schreiben: σe · σp = 2PSpinaustausch − 1 .
(12.16)
Das ist die Formel von Dirac. Sein „Spinaustauschoperator“ ergibt eine handliche Regel zur Berechnung von σe · σp . (Sie sehen, jetzt können Sie alles machen. Die Tore stehen weit offen.)
12.3
Die Energieniveaus
Nun sind wir so weit, dass wir die Energieniveaus des Grundzustands vom Wasserstoff berechnen können, indem wir die hamiltonschen Gleichungen (12.14) lösen. Wir möchten die Energien der stationären Zustände finden. Das bedeutet, dass wir jene speziellen Zustände | ψ � finden wollen, für die jede Amplitude Ci = � i | ψ � in dem zu | ψ � gehörenden Satz dieselbe Zeitabhängigkeit hat – nämlich e−iωt . Dann hat der Zustand die Energie E = ω. Wir möchten daher einen Satz finden, für den gilt Ci = ai e(−i/)Et , 2
Dieser Operator wird heute der „Spinaustauschoperator“ genannt.
(12.17)
12.3 Die Energieniveaus
243
wobei die vier Koeffizienten ai unabhängig von der Zeit sind. Um zu sehen, ob wir solche Amplituden finden können, setzen wir (12.17) in (12.14) ein und sehen, was geschieht. Jedes i dCi /dt in den Gleichungen (12.14) verwandelt sich in ECi , und – wenn wir den gemeinsamen Exponentialfaktor herausgekürzt haben – jedes Ci wird ein ai . Wir erhalten Ea1 = Aa1 , Ea2 = −Aa2 + 2Aa3 ,
(12.18)
Ea3 = 2Aa2 − Aa3 , Ea4 = Aa4 ,
was wir nach a1 , a2 , a3 und a4 auflösen müssen. Es trifft sich gut, dass die erste Gleichung unabhängig von den übrigen ist – das bedeutet, dass wir eine Lösung direkt ablesen können. Mit E = A ergibt sich die Lösung a1 = 1 ,
a2 = a3 = a4 = 0 .
(Natürlich ergibt sich auch eine Lösung, wenn wir alle a’s gleich null setzen, aber das ist dann überhaupt kein Zustand!) Bezeichnen wir den Zustand unserer ersten Lösung mit | I �:3 | I � = | 1 � = | ++ � .
(12.19)
Seine Energie ist EI = A . Analog dazu können Sie sofort aus der letzten Gleichung in (12.18) eine weitere Lösung erkennen, nämlich a1 = a2 = a3 = 0 , E = A.
a4 = 1 ,
Diese Lösung wollen wir als Zustand | II � bezeichnen: | II � = | 4 � = | −− � , E II = A .
(12.20)
Nun wird es etwas schwieriger; die beiden Gleichungen, die in (12.18) übrigbleiben, sind gekoppelt. Aber wir haben das alles schon früher einmal gemacht. Wenn wir die beiden Gleichungen addieren, erhalten wir E(a2 + a3 ) = A(a2 + a3 ) .
(12.21)
Wenn wir sie voneinander subtrahieren, erhalten wir
3
E(a2 − a3 ) = −3A(a2 − a3 ) .
(12.22)
Der Zustand ist in Wirklichkeit | I � e−(i/)E I t ; aber wie gewöhnlich wollen wir die Zustände durch die konstanten Vektoren darstellen, die bei t = 0 gleich den vollständigen Vektoren sind.
244
12 Die Hyperfeinaufspaltung im Wasserstoff
Bei näherer Betrachtung – und wenn wir uns an das Ammoniakmolekül erinnern – erkennen wir, dass es zwei Lösungen gibt: a2 = a3 ,
E=A (12.23)
und a2 = −a3 ,
E = −3A .
Sie sind Mischungen√von | 2 � und | 3 �. Wir bezeichnen diese Zustände mit | III � und | IV � und fügen den Faktor 1/ 2 dazu, um die Zustände zu normieren. Wir erhalten 1 1 | III � = √ (| 2 � + | 3 �) = √ , (| +− � + | −+ �) , 2 2 E III = A
(12.24)
1 1 | IV � = √ (| 2 � − | 3 �) = √ , (| +− � − | −+ �) , 2 2 E IV = −3A .
(12.25)
und
Wir haben vier stationäre Zustände und ihre Energien gefunden. Beachten Sie, dass unsere vier Zustände orthogonal sind. Sie können daher, falls gewünscht, auch als Basiszustände benutzt werden. Unser Problem ist damit vollständig gelöst. Drei der Zustände haben die Energie A, und der vierte hat die Energie −3A. Der Mittelwert ist null – was bedeutet, dass wir uns, als wir in (12.5) E0 = 0 gesetzt hatten, dafür entschieden hatten, alle Energien von der mittleren Energie aus zu messen. Wir können das EnergieniveauDiagramm für den Grundzustand des Wasserstoffs zeichnen (siehe Abbildung 12.2). E0 + A
I, II, III
E0 |ΔE| = ω
E0 − 3A
IV
Abb. 12.2: Energieniveau-Diagramm für den Grundzustand von atomarem Wasserstoff.
Nun ist die Energiedifferenz zwischen dem Zustand | IV � und jedem anderen Zustand 4A. Ein Atom, das zufällig in den Zustand | I � gelangt ist, könnte von dort in den Zustand | IV � fallen und Licht emittieren. Kein optisches Licht, weil die Energie so klein ist – es würde ein Mikrowellenquant emittieren. Oder, wenn wir Wasserstoffgas mit Mikrowellen bestrahlen, werden wir eine Energieabsorption beobachten, wenn die Atome im Zustand | IV � Energie aufnehmen und in einen der oberen Zustände übergehen – aber nur bei der Frequenz ω = 4A/. Diese Frequenz wurde experimentell gemessen; das beste Ergebnis4 ist f = ω/2π = (1 420 405 751,800 ± 0,028) Schwingungen pro Sekunde (Hertz)
4
Crampton, Kleppner und Ramsey; Physikal Review Letters, Bd. 11, Seite 338 (1963).
(12.26)
12.4 Die Zeeman-Aufspaltung
245
Der Fehler ist nur zwei zu 100 Milliarden! Wahrscheinlich ist keine fundamentale physikalische Größe je genauer gemessen worden als diese – es ist eine der bemerkenswertesten Messungen in der Physik. Die Theoretiker waren sehr froh, dass sie die Energie bis zu einer Genauigkeit von 3 zu 105 berechnen konnten, aber mittlerweile wurde sie mit einer Genauigkeit von 2 zu 1011 gemessen – eine Million mal genauer als die Theorie. Die Experimentatoren sind daher den Theoretikern weit voraus. In der Theorie des Grundzustands des Wasserstoffatoms sind Sie so gut wie jeder andere. Auch Sie können einfach den Wert für A aus dem Experiment entnehmen – das muss letzten Endes jeder tun. Sie haben wahrscheinlich schon einmal von der „21-Zentimeter-Linie“ des Wasserstoffs gehört. Das ist die Wellenlänge der 1420-MHz-Spektrallinie zwischen den Hyperfeinzuständen. Strahlung dieser Wellenlänge wird von dem atomaren Wasserstoffgas in den Galaxien emittiert oder absorbiert. Mit Radioteleskopen, die auf 21-Zentimeter-Wellen (oder ungefähr 1420 Megahertz) eingestellt sind, können wir daher die Geschwindigkeiten und den Ort von Konzentrationen des atomaren Wasserstoffgases beobachten. Durch Intensitätsmessungen können wir die Wasserstoffmenge abschätzen. Durch Messungen der aus dem Doppler-Effekt folgenden Frequenzverschiebung können wir Aussagen über die Bewegung des Gases in der Galaxis machen. Das ist eines der umfangreichen Programme der Radioastronomie. Wir haben daher jetzt über etwas sehr Reales gesprochen – es ist kein fiktives Problem.
12.4
Die Zeeman-Aufspaltung
Obwohl wir das Problem, die Energieniveaus des Wasserstoffgrundzustandes zu finden, gelöst haben, würden wir dieses interessante System gern eingehender untersuchen. Um mehr darüber auszusagen – um zum Beispiel die Geschwindigkeit zu berechnen, mit der das Wasserstoffatom Radiowellen von 21 Zentimetern absorbiert oder emittiert –, müssen wir wissen, was geschieht, wenn das Atom gestört wird. Wir müssen so wie beim Ammoniakmolekül vorgehen. Nachdem wir damals die Energieniveaus gefunden hatten, haben wir untersucht, was geschieht, wenn sich das Molekül in einem elektrischen Feld befindet. Anschließend konnten wir den Effekt des elektrischen Feldes als Radiowelle darstellen. Beim Wasserstoffatom beeinflusst das elektrische Feld die Niveaus nicht, außer dass es sie alle um einen konstanten Betrag, der proportional dem Quadrat der Feldstärke ist, verschiebt – was ganz belanglos ist, weil es die Energiedifferenzen nicht ändert. Wichtig ist jetzt das magnetische Feld. Der nächste Schritt ist daher, den Hamilton-Operator für eine kompliziertere Situation aufzuschreiben, in der sich das Atom in einem äußeren Magnetfeld befindet. Wie lautet dann der Hamilton-Operator? Wir werden die Antwort einfach angeben, ohne einen „Beweis“ zu liefern. Der Hamilton-Operator lautet Hˆ = A( σe · σp ) − μe σe · B − μp σp · B .
(12.27)
Er besteht jetzt aus drei Teilen. Der erste Term Aσe ·σp beschreibt die magnetische Wechselwirkung zwischen dem Elektron und dem Proton – sie ist genauso wie im Fall ohne magnetisches Feld. Diesen Term hatten wir vorher schon; und der Einfluss des Magnetfeldes auf die Konstante A ist vernachlässigbar. Die Wirkung des äußeren Magnetfeldes kommt in den letzten beiden Termen zum Ausdruck. Der zweite Term −μe σe · B ist die Energie, die das Elektron im magne-
246
12 Die Hyperfeinaufspaltung im Wasserstoff
tischen Feld hätte, wenn es dort allein wäre.5 Entsprechend ist der letzte Term −μp σp · B die Energie, die ein Proton allein hätte. Klassisch wäre die Energie der beiden zusammen die Summe der beiden Energien, und das ist auch quantenmechanisch richtig. In einem magnetischen Feld ist die Wechselwirkungsenergie, die sich aus dem magnetischen Feld ergibt, einfach die Summe der Wechselwirkungsenergien des Elektrons mit dem äußeren Feld und des Protons mit dem Feld – beide werden durch die Sigma-Operatoren ausgedrückt. In der Quantenmechanik sind diese Ausdrücke nicht wirklich die Energien, aber wenn wir an die klassischen Formeln für die Energie denken, haben wir eine Möglichkeit, uns an die Regeln zur Formulierung des Hamilton-Operators zu erinnern. Jedenfalls ist (12.27) der richtige Hamilton-Operator. Nun müssen wir zum Anfang zurückgehen und mit der Behandlung des Problems von vorn beginnen. Ein großer Teil der Arbeit ist jedoch getan – wir müssen nur die Effekte der neuen Terme hinzufügen. Nehmen wir ein konstantes magnetisches Feld B in z-Richtung an. Dann müssen wir zu unserem Hamilton-Operator Hˆ die neuen Terme hinzufügen, die wir mit Hˆ � bezeichnen können: p Hˆ � = − μe σez + μp σz B .
Wenn wir Tabelle 12.1 anwenden, erhalten wir sofort Hˆ � | ++ � = −(μe + μp )B | ++ � , Hˆ � | +− � = −(μe − μp )B | +− � , Hˆ � | −+ � = −(−μe + μp )B | −+ � , Hˆ � | −− � = (μe + μp )B | −− � .
(12.28)
Wie praktisch! Die Anwendung des Hˆ � auf jeden Zustand ergibt einfach eine Zahl mal diesen Zustand. Die Matrix � i | H � | j � hat daher nur Diagonalelemente – wir können einfach die Koeffizienten in (12.28) zu den entsprechenden Diagonalelementen von (12.13) addieren, und aus den hamiltonschen Gleichungen von (12.14) wird i dC1 /dt = A − (μe + μp )B C1 , i dC2 /dt = − A + (μe − μp )B C2 + 2AC3 , i dC3 /dt = 2AC2 − A − (μe − μp )B C3 , i dC4 /dt = A + (μe + μp )B C4 .
(12.29)
Die Form der Gleichungen hat sich nicht verändert – nur die Koeffizienten. Solange sich B nicht zeitlich ändert, können wir wie vorher fortfahren. Wenn wir Ci = ai e−(i/)Et einsetzen, erhalten 5
Bedenken Sie, dass klassisch U = −μ · B ist. Daher ist die Energie am niedrigsten, wenn das Moment in Richtung des Feldes zeigt. Bei positiv geladenen Teilchen ist das magnetische Moment parallel zum Spin, und bei negativ geladenen Teilchen ist es entgegengesetzt. In (12.27) ist daher μp eine positive Zahl, während μe eine negative Zahl ist.
12.4 Die Zeeman-Aufspaltung
247
wir – als eine Modifikation von (12.18) – Ea1 = A − (μe + μp )B a1 , Ea2 = − A + (μe − μp )B a2 + 2Aa3 , Ea3 = 2Aa2 − A − (μe − μp )B a3 , Ea4 = A + (μe + μp )B a4 .
(12.30)
Glücklicherweise sind die erste und die vierte Gleichung immer noch von den übrigen unabhängig, daher ist dasselbe Verfahren anwendbar. Die erste Lösung ist der Zustand | I �, für den a1 = 1, a2 = a3 = a4 = 0 ist, oder
und
| I � = | 1 � = | ++ �
(12.31)
E I = A − (μe + μp )B . Die zweite Lösung ist
und
| II � = | 4 � = | −− �
(12.32)
E II = A + (μe + μp )B . Für die übrigen beiden Gleichungen ist ein wenig mehr Mühe erforderlich, weil jetzt die Koeffizienten von a2 und a3 nicht mehr gleich sind. Aber sie sind genauso wie das Paar, das wir für das Ammoniakmolekül hatten. Wenn wir uns Gleichung (9.20) anschauen, können wir folgende Analogie feststellen (wobei wir beachten müssen, dass die dortigen Bezeichnungen 1 und 2 hier 2 und 3 entsprechen): H11 → −A − (μe − μp )B , H21 → 2A ,
H12 → 2A ,
H22 → −A + (μe − μp )B .
Die Energien sind durch (9.25) gegeben, nämlich H11 + H22 (H11 − H22 )2 E= ± + H12 H21 . 2 4
Mit den durch (12.33) gegebenen Substitutionen wird die Energieformel zu E = −A ± (μe − μp )2 B2 + 4A2 .
(12.33)
(12.34)
Während wir in Kapitel 9 die Bezeichnungen E I und E II für diese Energien verwendet haben, bezeichnen wir sie bei diesem Problem mit E III und E IV , E III = A −1 + 2 1 + (μe − μp )2 B2 /4A2 , (12.35) E IV = −A 1 + 2 1 + (μe − μp )2 B2 /4A2 .
248
12 Die Hyperfeinaufspaltung im Wasserstoff
Damit haben wir die Energien der vier stationären Zustände eines Wasserstoffatoms in einem konstanten Magnetfeld gefunden. Überprüfen wir unser Ergebnis, indem wir B gegen null gehen lassen und dann sehen, ob wir dieselben Energien erhalten, die wir im vorhergehenden Abschnitt hatten. Sie sehen, wir erhalten sie tatsächlich. Für B = 0 sind die Energien E I , E II und E III gleich +A und E IV ist gleich −3A. Auch unsere Bezeichnung der Zustände stimmt mit der vorherigen überein. Wenn wir jedoch das Magnetfeld anlegen, ändern sich die Energien auf verschiedene Art. Sehen wir, wie sie sich verhalten. Zuerst müssen wir beachten, dass für das Elektron μe negativ und etwa 1000-mal größer als μp ist – welches positiv ist. Daher sind μe + μp und μe − μp beide negative Zahlen und fast gleich. Bezeichnen wir sie mit −μ bzw. −μ� : μ = −(μe + μp ),
μ� = −(μe − μp ) .
(12.36)
(Sowohl μ als auch μ� sind positive Zahlen und fast gleich dem Betrag von μe – welcher etwa ein bohrsches Magneton ist.) Dann sind unsere vier Energien E I = A + μB , E II = A − μB , E III = A −1 + 2 1 + μ�2 B2 /4A2 , E IV = −A 1 + 2 1 + μ�2 B2 /4A2 .
(12.37)
Die Energie E I , beginnt bei A und wächst linear mit B – mit dem Anstieg μ. Die Energie E II beginnt auch bei A, nimmt aber mit wachsendem B linear ab – ihr Anstieg ist −μ. Diese beiden Niveaus variieren mit B, wie in Abbildung 12.3 zu sehen ist. Gezeigt sind in der Abbildung auch die Energien E III und E IV . Sie haben eine andere B-Abhängigkeit. Für kleines B hängen sie quadratisch von B ab, sodass sie anfangs einen sehr flachen Anstieg haben. Dann beginnen sie sich zu krümmen, und für große B nähern sie sich Geraden mit dem Anstieg ±μ� , der fast gleich dem Anstieg von E I bzw. E II ist. Die Verschiebung der Energieniveaus eines Atoms infolge eines Magnetfeldes wird ZeemanEffekt genannt. Wir sagen, dass die Kurven in Abbildung 12.3 die Zeeman-Aufspaltung des Grundzustandes von Wasserstoff zeigen. Wenn kein Magnetfeld anliegt, erhalten wir nur eine Spektrallinie aus der Hyperfeinstruktur des Wasserstoffs. Der Übergang zwischen dem Zustand | IV � und einem der oberen Zustände tritt unter Absorption oder Emission eines Photons auf, dessen Frequenz, 1420 Megahertz, 1/h-mal die Energiedifferenz 4A ist. Wenn sich das Atom jedoch in einem Magnetfeld B befindet, gibt es viel mehr Linien. Es kann Übergänge zwischen zwei beliebigen der vier Zustände geben. Wenn sich daher Atome in allen vier Zuständen befinden, kann durch jeden der sechs Übergänge, die durch die vertikalen Pfeile in Abbildung 12.4 dargestellt sind, Energie absorbiert oder emittiert werden. Viele dieser Übergänge können durch die Rabi-Molekularstrahltechnik beobachtet werden, die wir in Band IV, Abschnitt 6.3 beschrieben haben. Wodurch werden die Übergänge bewirkt? Die Übergänge treten auf, wenn Sie (zusätzlich zum konstanten, starken Feld B) ein schwaches magnetisches Störfeld anlegen, das sich zeitlich ändert. Es ist genauso, wie wir es bei der Wirkung eines variierenden elektrischen Feldes auf das Ammoniakmolekül gesehen haben. Nur ist es hier das magnetische Feld, das sich an die
12.5 Die Zustände in einem magnetischen Feld
249
E A 4
EI
3
+ =A
E III
2 1 0
−3
μB �
+ −A
1
2
−1 −2
μB
−A
EI
3 I
=A
−μ
4 μB/A
B
−μ� B
−4
EI V
Abb. 12.3: Die Energieniveaus des Grundzustands von Wasserstoff in einem Magnetfeld B.
−5
magnetischen Momente koppelt und den Effekt auslöst. Aber die Theorie folgt der Methode, die wir für das Ammoniakmolekül ausgearbeitet haben. Die Theorie ist am einfachsten, wenn Sie ein magnetisches Störfeld nehmen, das in der xy-Ebene rotiert – obwohl auch jedes horizontal schwingende Feld geeignet ist. Wenn Sie dieses Störfeld als Zusatzterm in die hamiltonschen Gleichungen einsetzen, erhalten Sie Lösungen mit zeitlich variierenden Amplituden – wie wir es beim Ammoniakmolekül gefunden haben. Sie können daher leicht und genau die Wahrscheinlichkeit für einen Übergang von einem Zustand zum anderen ausrechnen. Und Sie werden feststellen, dass alles mit dem Experiment übereinstimmt.
12.5
Die Zustände in einem magnetischen Feld
Wir möchten jetzt den Verlauf der Kurven in Abbildung 12.3 besprechen. Zunächst einmal sind die Energien für starke Felder leicht zu verstehen und recht interessant. Für hinreichend großes B (nämlich für μB/A � 1) können wir die 1 in den Formeln (12.37) vernachlässigen. Aus den vier Energien wird E I = A + μB , E III = −A + μ B , �
E II = A − μB ,
E IV = −A − μ� B .
(12.38)
Dies sind die Gleichungen der vier Geraden in Abbildung 12.3. Wir können diese Energien physikalisch folgendermaßen verstehen. Die Beschaffenheit der stationären Zustände in einem
250
12 Die Hyperfeinaufspaltung im Wasserstoff
E
I III
Bz
II
IV
Abb. 12.4: Übergänge zwischen Energieniveaus des Grundzustands von Wasserstoff in einem Magnetfeld B = (0, 0, Bz ).
Null-Feld ist durch die Wechselwirkung der beiden magnetischen Momente vollständig bestimmt. Die Mischungen der Basiszustände | +− � und | −+ � in den stationären Zuständen | III � und | IV � sind eine Folge dieser Wechselwirkung. Bei starken äußeren Feldern jedoch werden das Proton und das Elektron fast überhaupt nicht vom Feld des jeweils anderen Teilchens beeinflusst; jedes wird sich so verhalten, als wäre es allein in dem äußeren Feld. Dann wird der Elektronenspin, wie wir schon oft gesehen haben, entweder parallel oder antiparallel zum äußeren magnetischen Feld stehen. Angenommen, der Elektronenspin ist „up“, d. h. in Richtung des Feldes. Seine Energie ist dann −μe B. Das Proton hat immer noch beide Möglichkeiten. Wenn der Protonenspin ebenfalls „up“ ist, ist seine Energie −μp B. Die Summe der beiden ist −(μe + μp )B = μB. Das finden wir auch für E I – und das ist auch gut so, weil wir den Zustand | ++ � = | I � beschreiben. Es gibt noch den kleinen Zusatzterm A (jetzt μB � A), der die Wechselwirkungsenergie zwischen Proton und Elektron darstellt, wenn deren Spins parallel sind. (Wir nahmen ursprünglich A als positiv an, weil die Theorie es so fordert, und experimentell ist es tatsächlich so.) Andererseits kann das Proton auch den Spin down haben. Dann geht seine Energie in dem äußeren Feld gegen +μp B, sodass es zusammen mit dem Elektron die Energie −(μe − μp )B = μ� B hat. Und die Wechselwirkungsenergie wird −A. Die Summe ist gerade die in (12.38) gegebene Energie E III . Aus dem Zustand | III � muss daher bei starken Feldern der Zustand | +− � werden.
Nehmen wir jetzt an, dass der Elektronenspin „down“ ist. Seine Energie im äußeren Feld ist μe B. Wenn das Proton ebenfalls „down“ ist, haben die beiden zusammen die Energie (μe + μp )B = −μB plus die Wechselwirkungsenergie A, da ihre Spins parallel sind. Das ergibt die Energie E II in (12.38) und entspricht dem Zustand | −− � = | II � – was erfreulich
12.5 Die Zustände in einem magnetischen Feld
251
ist. Wenn schließlich das Elektron „down“ und das Proton „up“ ist, erhalten wir die Energie (μe − μp )B − A (minus A für die Wechselwirkung, weil die Spins entgegengesetzt sind), was genau E IV ist. Und der Zustand entspricht | −+ �.
„Moment mal!“ sagen Sie vielleicht. „Die Zustände | III � und | IV � sind nicht die Zustände | +− � und | −+ �; sie sind Mischungen der beiden.“ Nun ja, nur ganz wenig. Für B = 0 sind sie tatsächlich Mischungen, aber wir haben noch nicht ausgerechnet, was sie für großes B sind. Als wir in unseren Formeln von Kapitel 9 die Analogien von (12.33) benutzt haben, um die Energien der stationären Zustände zu erhalten, hätten wir dort auch die dazugehörigen Amplituden entnehmen können. Sie folgen aus Gleichung (9.24), welche lautet a2 E − H22 = . a3 H21 Das Verhältnis a2 /a3 ist natürlich genau C2 /C3 . Wenn wir die entsprechenden Größen aus (12.33) einsetzen, erhalten wir E + A − (μe − μp )B C2 = C3 2A oder E + A + μ� B C2 , = C3 2A
(12.39)
wobei wir für E die zugehörigen Energien benutzen müssen, also entweder E III oder E IV . Für den Zustand | III � erhalten wir zum Beispiel C μ� B 2 . (12.40) ≈ C3 III A
Für großes B gilt daher beim Zustand | III � C2 � C3 ; der Zustand wird fast vollständig zum Zustand | 2 � = | +− �. Wenn wir E IV in (12.39) einsetzen, erhalten wir ganz ähnlich (C2 /C3 )IV � 1: für starke Felder wird der Zustand | IV � einfach zum Zustand | 3 � = | −+ �. Sie sehen, dass die Koeffizienten in den Linearkombinationen unserer Basiszustände, die die stationären Zustände bilden, von B abhängen. Der Zustand, den wir | III � nennen, ist bei sehr schwachen Feldern eine 50 : 50-Mischung von | +− � und | −+ �, verschiebt sich aber bei starken Feldern vollständig nach | +− �. Dagegen geht der Zustand | IV �, der bei schwachen Feldern eine 50 : 50-Mischung (mit entgegengesetzten Vorzeichen) von | +− � und | −+ � ist, in den Zustand | −+ � über, wenn die Spins durch ein starkes äußeres Feld entkoppelt werden.
Wir möchten Ihre Aufmerksamkeit nun auf das lenken, was bei sehr schwachen magnetischen Feldern geschieht. Es gibt eine Energie bei −3A, die sich nicht ändert, wenn Sie ein schwaches Magnetfeld anlegen. Und es gibt eine andere Energie bei +A, die sich in drei verschiedene Energieniveaus aufspaltet, wenn Sie ein schwaches Magnetfeld anlegen. Bei schwachen Feldern ändern sich die Energien proportional zu B, wie in Abbildung 12.5 gezeigt. Nehmen wir an, wir hätten irgendwie eine Reihe von Wasserstoffatomen ausgesucht, die alle die Energie −3A haben. Wenn wir sie durch einen Stern-Gerlach-Apparat – mit einem nicht zu starken Feld – gehen lassen, würden sie einfach geradewegs hindurchgehen. (Da ihre Energie nicht von B abhängt, gibt es – gemäß dem Prinzip der virtuellen Arbeit – keine Kraft, die bei einem magnetischen Feldgradienten auf sie wirkt.) Nehmen wir dagegen an, wir würden eine Reihe von
252
12 Die Hyperfeinaufspaltung im Wasserstoff
E
+A
j
m
I
1
+1
III II
1 1
0 −1
0
B
IV
−3A
0
0
Abb. 12.5: Die Zustände des Wasserstoffatoms bei schwachen magnetischen Feldern.
Atomen mit der Energie +A aussuchen und sie durch einen Stern-Gerlach-Apparat, sagen wir einen S -Apparat, gehen lassen. (Wieder sollte das Feld in dem Apparat nicht so stark sein, dass es das Innere des Atoms aufspaltet. Das Feld muss also so schwach sein, dass sich die Energien linear mit B verändern.) Wir würden drei Strahlen erhalten. Die Zustände | I � und | II � erfahren entgegengesetzte Kräfte – ihre Energien ändern sich linear mit B mit den Anstiegen ±μ, die Kräfte sind daher wie bei einem Dipol mit μz = ∓μ; der Zustand | III � aber geht gerade hindurch. Wir haben daher wieder die Situation aus Kapitel 5. Ein Wasserstoffatom mit der Energie +A ist ein Spin-eins-Teilchen. Dieser Energiezustand ist ein „Teilchen“, für das j = 1 ist, und er kann – bezüglich irgendeines räumlichen Koordinatensystems – durch die Basiszustände | +S �, | 0 S � und | −S � beschrieben werden, die wir in Kapitel 5 benutzt haben. Wenn dagegen ein Wasserstoffatom die Energie −3A hat, ist es ein Spin-null-Teilchen. (Beachten Sie, dass das Gesagte nur für infinitesimale magnetische Felder streng gilt.) Wir können daher die Zustände in einem magnetischen Feld der Stärke null folgendermaßen zuordnen: ⎫ ⎧ ⎪ ⎪ ⎪ ⎪ | I � = | ++ � | +S � ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ | +− � + | −+ � ⎪ ⎬ ⎨ | III � = Spin 1 ⎪ |0S � (12.41) √ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ ⎩ | II � = | −− � | −S � | +− � − | −+ � Spin 0 . (12.42) | IV � = √ 2 In Kapitel 6 von Band IV haben wir gesagt, dass für jedes Teilchen die Komponente des Drehimpulses längs irgendeiner Achse nur gewisse Werte annehmen kann, die jeweils den Abstand voneinander haben. Die z-Komponente des Drehimpulses Jz kann j, ( j − 1), ( j − 2)/, . . . , (− j) sein, wobei j der Spin des Teilchens ist (der ganz- oder halbzahlig sein kann). Dies schreibt man gewöhnlich Jz = m ,
(12.43)
wobei m für eine der Zahlen j, j−1, j−2, . . . , − j steht. Sie werden daher in Büchern sehen, dass man die vier Grundzustände des Wasserstoffs durch die so genannten Quantenzahlen j und m
12.6 Die Projektionsmatrix für Spin eins
253
identifiziert (sie werden oft auch die „Gesamtdrehimpuls-Quantenzahl“ ( j) und „magnetische Quantenzahl“ (m) genannt). Dann bezeichnet man anstelle unserer Zustandssymbole | I �, | II � usw. einen Zustand als | j, m �. Daher würde man unsere kleine Tabelle von Zuständen für ein Null-Feld in (12.41) und (12.42), wie in Tabelle 12.3 gezeigt, schreiben. Es ist keine neue Physik, sondern nur eine Frage der Notation. Tabelle 12.3: Zustände des Wasserstoffatoms
Zustand | j, m �
j
m
| 1, +1 �
1
+1
| 1, 0 �
1
0
| 1, −1 �
1
| 0, 0 �
0
−1
12.6
0
unsere Bezeichnung | I � = | +S �
| III � = | 0 S � | II � = | −S �
| IV �
Die Projektionsmatrix für Spin eins6
Wir wollen nun unser Wissen über das Wasserstoffatom benutzen, um etwas Spezielles zu besprechen. In Kapitel 5 hatten wir gezeigt, dass ein Teilchen vom Spin eins, das in einem der Basiszustände (+, 0, oder −) bezüglich eines Stern-Gerlach-Apparates mit spezieller räumlicher Orientierung – sagen wir eines S -Apparates – ist, eine gewisse Amplitude hat, in jedem der drei Zustände bezüglich eines T -Apparates mit anderer Orientierung im Raum zu sein. Es gibt immer neun solche Amplituden � jT | iS �, die zusammen die Projektionsmatrix bilden. In Abschnitt 5.7 haben wir ohne Beweis die Terme dieser Matrix für verschiedene Orientierungen von T bezüglich S angegeben. Nun werden wir Ihnen eine Methode zeigen, wie sie hergeleitet werden können. Im Wasserstoffatom haben wir ein Spin-eins-System gefunden, das aus zwei Spin- 21 -Teilchen aufgebaut ist. Wir haben in Kapitel 6 schon ausgeführt, wie die Spin- 21 -Amplituden zu transformieren sind. Wir können diese Information benutzen, um die Transformation für Spin eins zu berechnen. Dies geht folgendermaßen: Wir haben ein System (ein Wasserstoffatom mit der Energie +A), das den Spin eins hat. Nehmen wir an, wir lassen es durch einen Stern-GerlachApparat S laufen, sodass wir wissen, es ist danach in einem der Basiszustände bezüglich S , sagen wir in | +S �. Wie sieht die Amplitude aus, dass es in einem der Basiszustände, sagen wir | +T �, bezüglich des T -Apparates sein wird? Wenn wir das Koordinatensystem des S -Apparates als x, y, z-System bezeichnen, ist der Zustand | +S � derjenige, den wir mit | ++ � bezeichnet haben. Aber nehmen wir an, ein Anderer hätte seine z-Achse in Richtung der Achse von T gelegt. Er wird seine Zustände auf ein System beziehen, das wir mit x� , y� , z� bezeichnen wollen. Seine „up“- und „down“-Zustände für das Elektron und das Proton werden andere als unsere sein. Sein „plus-plus“-Zustand – den wir in Bezug auf das „gestrichene“ System | +� +� � schreiben können – ist der | +T �-Zustand des Spin-eins-Teilchens. Was wir suchen, ist � +T | +S �, was einfach eine andere Notation für die Amplitude � +� +� | ++ � ist. 6
Wer Kapitel 6 übersprungen hat, sollte auch diesen Abschnitt auslassen.
254
12 Die Hyperfeinaufspaltung im Wasserstoff
Die Amplitude � +� +� | ++ � können wir auf folgende Art ermitteln. In unserem System hat das Elektron im | ++ �-Zustand den Spin „up“. Das bedeutet, dass es eine Amplitude � +� | + �e hat, in seinem System „up“ zu sein, und eine Amplitude � −� | + �e , in seinem System „down“ zu sein. Analog dazu hat das Proton im | ++ �-Zustand in unserem System den Spin „up“ und die Amplituden � +� | + �p und � −� | + �p , den Spin „up“ bzw. „down“ im „gestrichenen“ System zu haben. Da wir von zwei verschiedenen Teilchen sprechen, ist die Amplitude, dass beide Teilchen zusammen in seinem System „up“ sind, das Produkt der beiden Amplituden � +� +� | ++ � = � +� | + �e � +� | + �p .
(12.44)
Wir haben die Indizes e und p an die Amplituden � +� | + � gesetzt, um zu verdeutlichen, welches Teilchen wir meinen. Sie sind aber beide nur die Transformationsamplituden für ein Spin- 21 Teilchen, sodass sie also in Wirklichkeit identische Zahlen sind. Sie sind tatsächlich einfach die Amplitude, die wir in Kapitel 6 � +T | +S � genannt haben, und die wir in die Tabellen am Ende des Kapitels 6 eingetragen haben. Nun kommen wir jedoch mit den Bezeichnungen etwas in Bedrängnis. Wir müssen irgendwie die Amplitude � +T | +S � für ein Spin- 21 -Teilchen von der Amplitude für Spin-eins-Teilchen unterscheiden, die wir ebenfalls � +T | +S � genannt haben – denn schließlich sind sie vollkommen verschieden! Wir hoffen, es ist nicht zu verwirrend, aber zumindest im Moment werden wir andere Symbole für die Spin- 21 -Amplituden verwenden müssen. Damit Sie die Übersicht behalten, stellen wir die neue Notation in Tabelle 12.4 zusammen. Die Bezeichnung | +S �, | 0 � und | −S � für die Zustände eines Spin-eins-Teilchens wollen wir beibehalten. Tabelle 12.4: Spin- 12 -Amplituden
Kapitel 12
Kapitel 6
a = �+ |+� b = � −� | + � c = � +� | − �
� +T | +S � � −T | +S � � +T | −S �
�
d = � −� | − �
� −T | −S �
Mit unserer neuen Bezeichnung wird aus (12.44) einfach � +� +� | ++ � = a2 und dies ist gerade die Spin-eins-Amplitude � +T | +S �. Nun wollen wir annehmen, dass das Koordinatensystem des anderen Apparats (T oder „gestrichener“ Apparat) bezüglich unserer z-Achse um den Winkel φ gedreht ist. Dann folgt aus Tabelle 6.2 a = � +� | + � = eiφ/2 . Wir erhalten daher aus (12.44) die Spin-eins-Amplitude � +T | +S � = � +� +� | ++ � = (eiφ/2 )2 = eiφ . Sie können sehen, wie es geht.
(12.45)
12.6 Die Projektionsmatrix für Spin eins
255
Betrachten wir nun den allgemeinen Fall für beliebige Zustände. Wenn das Proton und das Elektron in unserem System – dem S -System – beide „up“ sind, dann sind die Amplituden, dass es in einem der vier möglichen Zustände im System des Anderen – im T -System – sein wird, � +� +� | ++ � = � +� | + �e � +� | + �p = a2 ,
� +� −� | ++ � = � +� | + �e � −� | + �p = ab , � −� +� | ++ � = � −� | + �e � +� | + �p = ba ,
(12.46)
� −� −� | ++ � = � −� | + �e � −� | + �p = b2 .
Wir können dann den Zustand | ++ � durch folgende Linearkombination ausdrücken: | ++ � = a2 | +� +� � + ab{| +� −� � + | −� +� �} + b2 | −� −� � .
(12.47) √ Wir bemerken jetzt, dass | +� +� � der Zustand | +T � ist, dass {| +� −� � + | −� +� �} einfach 2-mal dem Zustand | 0 T � ist – siehe (12.41) – und dass | −� −� � = | −T � ist. Gleichung (12.47) kann also auch geschrieben werden als | +S � = a2 | +T � +
√
2 ab | 0 T � + b2 | −T � .
(12.48)
Auf ähnliche Art können Sie leicht zeigen, dass | −S � = c2 | +T � +
√ 2 cd | 0 T � + d 2 | −T � .
(12.49)
Für | 0 S � ist es etwas komplizierter, da 1 | 0 S � = √ {| +− � + | −+ �} . 2 Wir können aber die Zustände | +− � und | −+ � durch die „gestrichenen“ Zustände ausdrücken und die Summe bilden. Das heißt | +− � = ac | +� +� � + ad | +� −� � + bc | −� +� � + bd | −� −� �
(12.50)
und | −+ � = ac | +� +� � + bc | +� −� � + ad | −� +� � + bd | −� −� � . √ Wenn wir die Summe bilden und mit 1/ 2 multiplizieren, erhalten wir
(12.51)
2 ad + bc 2 | 0 S � = √ ac | +� +� � + √ {| +� −� � + | −� +� �} + √ bd | −� −� � . 2 2 2 Daraus folgt |0S � =
√ √ 2 ac | +T � + (ad + bc) | 0 T � + 2 bd | −T � .
(12.52)
256
12 Die Hyperfeinaufspaltung im Wasserstoff
Wir haben jetzt alle gesuchten Amplituden. Die Koeffizienten der Gleichungen (12.48), (12.49) und (12.52) sind die Matrixelemente � jT | iS �. Fassen wir sie zusammen: √ ⎛ ⎞ 2 ⎜⎜⎜ 2 ac √ c2 ⎟⎟⎟ a ⎜⎜⎜ √ ⎟⎟ � jT | iS � = ⎜⎜⎜ 2 ab ad + bc (12.53) 2 cd⎟⎟⎟⎟ . √ ⎝ ⎠ 2 bd d2 b2 Wir haben die Spin-eins-Transformation durch die Spin- 21 -Amplituden a, b, c und d ausgedrückt.
Wenn zum Beispiel das T -System gegen S um den Winkel α um die y-Achse gedreht ist wie in Abbildung 5.6, sind die Amplituden in Tabelle 12.4 genau die Matrixelemente von Ry (α) in Tabelle 6.2. α , 2 α c = sin , 2
a = cos
b = − sin d = cos
α , 2
α . 2
(12.54)
Wenn wir diese in (12.53) verwenden, erhalten wir die Formeln von (5.38), die wir dort ohne Beweis angegeben haben. Was geschieht eigentlich mit dem Zustand | IV �?! Nun ja, er ist ein Spin-null-System und hat daher nur einen Zustand – er ist in allen Koordinatensystemen derselbe. Wir können prüfen, dass alles richtig ist, indem wir die Differenz der Gleichungen (12.50) und (12.51) bilden. Wir erhalten � � | +− � − | −+ � = (ad − bc) | +� −� � − | −� +� � .
Aber (ad − bc) ist die Determinante der Spin- 21 -Matrix und daher gleich 1. Wir erhalten | IV � � = | IV � für jede relative Orientierung der beiden Koordinatensysteme.
13
Ausbreitung im Kristallgitter
13.1
Zustände des Elektrons im eindimensionalen Gitter
Auf den ersten Blick könnten Sie denken, dass ein Elektron mit niedriger Energie große Schwierigkeiten hat, durch einen festen Kristall zu gehen. Die Atome sind so dicht zusammengepackt, dass ihre Mittelpunkte nur einige Ångström voneinander entfernt sind, und der effektive Durchmesser der Atome für die Elektronenstreuung liegt in der Größenordnung von einem Ångström. Das heißt, die Atome sind im Verhältnis zu ihren Abständen groß, sodass man als mittlere freie Weglänge zwischen zwei Zusammenstößen etwa einige Ångström erwarten würde – was praktisch nichts ist. Man sollte erwarten, dass das Elektron fast sofort mit dem einen oder dem anderen Atom zusammenstößt. Nichtsdestoweniger ist es ein allgegenwärtiges Phänomen der Natur, dass bei einem fehlerfreien Gitter die Elektronen glatt und leicht durch den Kristall wandern können – fast so, als würden sie sich im Vakuum bewegen. Diese erstaunliche Tatsache ist der Grund, warum Metalle die Elektrizität so gut leiten. Sie hat auch die Entwicklung vieler Bauelemente erlaubt. Sie ist zum Beispiel auch der Grund, warum es möglich war, Radioröhren durch Transistoren zu ersetzen. In einer Radioröhre bewegen sich die Elektronen frei durch ein Vakuum, während sie sich im Transistor frei durch ein Kristallgitter bewegen. Die Funktionsweise hinter dem Verhalten eines Transistors wird in diesem Kapitel beschrieben; im nächsten werden wir die Anwendung dieser Prinzipien in verschiedenen Bauelementen besprechen. Die Elektronenleitung in einem Kristall ist ein Beispiel für ein sehr allgemeines Phänomen. Nicht nur Elektronen können durch Kristalle wandern, sondern auch andere „Dinge“, etwa atomare Anregungen, können sich auf eine ähnliche Art bewegen. Daher trifft man auf das Phänomen, das wir besprechen wollen, bei vielen Fragestellungen der Festkörperphysik. Sie werden sich erinnern, dass wir viele Beispiele für Zweizustandssysteme diskutiert haben. Betrachten wir nun ein Elektron, das sich an zwei verschiedenen Positionen aufhalten kann, wobei es sich in jeder Position in derselben Art von Umgebung befindet. Wir nehmen außerdem an, dass es eine gewisse Amplitude für den Übergang von einer Position in die andere gibt und natürlich dieselbe Amplitude für den umgekehrten Weg, genauso wie wir es beim Ion des Wasserstoffmoleküls in Abschnitt 10.1 besprochen haben. Die Gesetze der Quantenmechanik liefern dann die folgenden Resultate. Es gibt für das Elektron zwei mögliche Zustände mit bestimmter Energie. Jeder Zustand kann durch die Amplituden beschrieben werden, dass sich das Elektron in einer der beiden Grundpositionen befindet. In jedem der Zustände mit bestimmter Energie sind die Beträge dieser beiden Amplituden zeitlich konstant, und die Phasen variieren zeitlich mit der gleichen Frequenz. Wenn wir das Elektron von einer Position aus starten lassen, wird es sich später in die andere bewegt haben und noch später wird es wieder in die erste Position zurückschwingen. Die Amplituden für diesen Vorgang sind analog zu den Bewegungen zweier gekoppelter Pendel.
258
13 Ausbreitung im Kristallgitter
Betrachten wir nun ein vollkommenes Kristallgitter, wobei wir uns vorstellen, dass sich ein Elektron mit einer bestimmten Energie in einer Art „Loch“ bei einem konkreten Atom befinden kann. Nehmen wir weiter an, dass das Elektron eine Amplitude hat, sich in ein anderes Loch bei einem der benachbarten Atome zu bewegen. Das ähnelt einem Zweizustandssystem – aber mit einer zusätzlichen Komplikation. Wenn das Elektron bei dem benachbarten Atom ankommt, kann es sich später an einen anderen Ort bewegen, aber genauso gut auch zu seinem Ausgangspunkt zurückkehren. Wir haben jetzt eine Situation, die nicht zu zwei gekoppelten Pendeln analog ist, sondern zu einer unendlichen Zahl von Pendeln, die alle miteinander gekoppelt sind. Es entspricht etwa dem, was man bei jenen Apparaten sieht, die aus einer langen Reihe von an einem Torsionsdraht befestigten Stäben bestehen, wie man sie in den ersten Physiksemestern benutzt, um die Wellenausbreitung zu demonstrieren. Wenn Sie einen harmonischen Oszillator betrachten, der mit einem anderen harmonischen Oszillator gekoppelt ist und dieser mit noch einem usw., und wenn Sie dann eine Störung an einer Stelle vornehmen, dann wird sich die Störung entlang der Linie als Welle fortpflanzen. Dieselbe Situation liegt vor, wenn Sie ein Elektron in die Nähe eines Atoms aus einer Atomkette bringen. Die einfachste Methode, das mechanische Problem zu lösen, besteht gewöhnlich nicht darin zu überlegen, was geschieht, wenn ein Puls von einem bestimmten Ort ausgeht, sondern eher darin, die Lösungen für stationäre Wellen zu suchen. Es gibt gewisse Verschiebungsformen, die sich als Welle mit einer einzigen festen Frequenz durch den Kristall fortpflanzen. Nun geschieht dasselbe mit dem Elektron – einfach aus dem Grund, weil es quantenmechanisch durch ähnliche Gleichungen beschrieben wird. Eines muss jedoch klargestellt werden: Die Amplitude für das Elektron, an einem Ort zu sein, ist eine Amplitude und keine Wahrscheinlichkeit. Wenn das Elektron einfach von einer Stelle zur anderen dahinfließen würde wie Wasser, das durch ein Loch strömt, wäre das Verhalten ganz anders. Wenn wir zum Beispiel zwei Wasserbehälter betrachten, die durch ein Rohr verbunden sind, sodass die Flüssigkeit vom einen zum anderen fließen kann, dann gleichen sich die Wasserstände exponentiell einander an. Was aber beim Elektron geschieht, ist ein Fließen der Amplitude und nicht nur ein simples Fließen der Wahrscheinlichkeit. Und es ist ein Charakteristikum des imaginären Terms in den Differentialgleichungen der Quantenmechanik, dass er die exponentielle Lösung in eine oszillatorische Lösungen umwandelt. Was dann geschieht, unterscheidet sich grundlegend von der Strömung zwischen verbundenen Behältern. Wir wollen nun die quantenmechanischen Verhältnisse quantitativ untersuchen. Stellen Sie sich ein eindimensionales System vor, das aus einer langen Reihe von Atomen besteht (siehe Abbildung 13.1). (Ein Kristall ist natürlich dreidimensional, aber die Physik ist sehr ähnlich; wenn Sie erst einmal den eindimensionalen Fall verstanden haben, werden Sie auch verstehen, was in drei Dimensionen geschieht.) Als Nächstes wollen wir überlegen, was geschieht, wenn wir ein einzelnes Elektron in diese Anordnung von Atomen bringen. Natürlich sind in einem realen Kristall schon Millionen von Elektronen vorhanden. Aber die meisten von ihnen (bei einem Nichtleiterkristall fast alle) nehmen Positionen in irgendeiner Bewegungsform um ihr eigenes Atom ein – und alles ist völlig stationär. Wir möchten jedoch jetzt überlegen, was geschieht, wenn wir ein zusätzliches Elektron hineinbringen. Wir werden nicht betrachten, was die anderen tun, weil wir annehmen, dass es zur Änderung ihrer Bewegungsform einer hohen Anregungsenergie bedarf. Wir werden ein Elektron so hinzufügen, dass wir ein schwach gebundenes negatives Ion erzeugen. Bei der Beobachtung, was das eine zusätzliche Elektron tut, machen wir eine Näherung, die das Geschehen im Inneren der Atome vernachlässigt.
13.1 Zustände des Elektrons im eindimensionalen Gitter Atom
b (a)
259
n
· · · n−3 n−2 n−1
n+1 n+2 n+3 · · ·
Elektron (b) |n − 1� (c) |n� (d)
Abb. 13.1: Die Basiszustände eines Elektrons in einem eindimensionalen Kristall.
|n + 1�
Natürlich könnte sich dann das Elektron zu einem anderen Atom bewegen, sodass das negative Ion nun an einem anderen Platz sitzt. Wir nehmen an, dass das Elektron mit einer gewissen Amplitude von einem Atom zu seinem linken oder rechten Nachbarn springen kann, genauso wie es zwischen zwei Protonen hin und her springt. Wie beschreiben wir ein solches System? Was sind die geeigneten Basiszustände? Wenn Sie sich in Erinnerung rufen, wie wir vorgegangen sind, als wir nur zwei mögliche Positionen hatten, dann ahnen Sie sicher schon, wie es gehen wird. Nehmen wir an, dass in unserer Atomreihe die Abstände alle gleich sind und dass wir die Atome der Reihe nach nummerieren, wie in Abbildung 13.1 (a) gezeigt. Einer der Basiszustände ist, dass das Elektron beim Atom Nummer 6 ist, ein anderer Basiszustand ist, dass das Elektron bei Atom Nummer 7 oder bei Atom Nummer 8 ist usw. Wir können den n-ten Basiszustand beschreiben, indem wir sagen, dass das Elektron bei Atom Nummer n ist. Wir bezeichnen ihn mit | n �. Abbildung 13.1 zeigt, was wir meinen mit den drei Basiszuständen |n − 1� ,
|n�
und
|n + 1� .
Wenn wir diese Basiszustände benutzen, kann jeder Zustand | φ � des Elektrons in unserem eindimensionalen Kristall beschrieben werden durch Angabe aller Amplituden � n | φ �, dass der Zustand | φ � im Basiszustand | n � ist – womit die Amplitude gemeint ist, dass er sich beim n-ten Atom befindet. Dann können wir den Zustand | φ � schreiben als Überlagerung der Basiszustände |φ� = |n��n|φ� . (13.1) n
Als Nächstes nehmen wir an, dass es für ein Elektron, das bei einem Atom ist, eine gewisse Amplitude gibt, dass es zu dem Atom auf einer der beiden Seiten hinüberwechselt. Und wir wollen den einfachsten Fall annehmen, bei dem es nur zu den beiden nächsten Nachbarn wechseln kann – um zu den übernächsten Nachbarn zu kommen, muss es zwei Schritte ausführen. Wir setzen die Amplitude (pro Zeiteinheit), dass das Elektron von einem Atom zum nächsten wechselt, gleich iA/.
260
13 Ausbreitung im Kristallgitter
Wir schreiben nun die Amplitude � n | φ � für die Anwesenheit beim n-ten Atom als Cn . Dann wird Gleichung (13.1) zu |φ� = | n � Cn . (13.2) n
Wenn wir zu einem gegebenen Zeitpunkt alle Amplituden Cn kennen würden, könnten wir ihre Absolutquadrate bilden und so die Wahrscheinlichkeit dafür erhalten, dass man das Elektron vorfindet, wenn man zu diesem Zeitpunkt das Atom n betrachtet.
Wie wird die Situation zu einem späteren Zeitpunkt aussehen? Wegen der Analogie zu den zuvor untersuchten Zweizustandssystemen schlagen wir vor, dass die hamiltonschen Gleichungen für dieses System aus Gleichungen wie diesen hier bestehen sollten: i
dCn (t) = E0 Cn (t) − ACn+1 (t) − ACn−1 (t) . dt
(13.3)
Der erste Koeffizient auf der rechten Seite, E0 , ist physikalisch die Energie, die das Elektron haben würde, wenn es nicht von einem der Atome wegfließen könnte. (Es spielt keine Rolle, was wir E0 nennen; wie wir mehrfach gesehen haben, stellt es in Wirklichkeit nichts anderes dar, als den gewählten Energienullpunkt.) Der nächste Term stellt die Amplitude pro Zeiteinheit dar, dass das Elektron aus dem (n + 1)-ten Loch in das n-te Loch wechselt; und der letzte Term ist die Amplitude, dass es aus dem (n − 1)-ten Loch kommt. Wie üblich wollen wir annehmen, dass A eine Konstante ist (unabhängig von t). Für die vollständige Beschreibung des Verhaltens des Zustands | φ � erhalten wir eine Gleichung wie (13.3) für jede der Amplituden Cn . Da wir einen Kristall mit einer sehr großen Anzahl von Atomen betrachten wollen, wollen wir annehmen, dass es eine unendlich große Anzahl von Zuständen gibt, sodass die Atome in beiden Richtungen nicht aufhören. (Zur Behandlung des endlichen Falles müssten wir uns überlegen, was an den Rändern geschieht.) Wenn die Zahl N unserer Basiszustände unendlich groß ist, dann haben wir auch unendlich viele hamiltonsche Gleichungen! Wir wollen nur einen kleinen Ausschnitt aufschreiben: .. .. . . dCn−1 i = E0Cn−1 − ACn−2 − ACn , dt dCn = E0Cn − ACn−1 − ACn+1 , i dt dCn+1 = E0Cn+1 − ACn − ACn+2 . i dt .. .. . .
13.2
(13.4)
Zustände mit bestimmter Energie
Wir könnten vieles an einem Elektron in einem Gitter untersuchen, zunächst aber wollen wir versuchen, die Zustände mit bestimmter Energie zu finden. Wie wir in früheren Kapiteln gesehen haben, bedeutet dies, dass wir eine Situation finden müssen, in der sich alle Amplituden mit
13.2 Zustände mit bestimmter Energie
261
derselben Frequenz ändern, wenn sie sich überhaupt zeitlich ändern. Wir suchen nach Lösungen der Form Cn = an e−iEt/ .
(13.5)
Die komplexe Zahl an gibt uns Aufschluss über den zeitlich konstanten Teil der Amplitude, das Elektron beim n-ten Atom zu finden. Wenn wir diesen Lösungsansatz in die Gleichungen (13.4) einsetzen, erhalten wir das Ergebnis Ean = E0 an − Aan+1 − Aan−1 .
(13.6)
Wir haben unendlich viele solche Gleichungen für die unendlich vielen Unbekannten an – was natürlich erschreckend ist. Alles, was wir tun müssen, ist, die Determinanten zu berechnen . . ., aber halt! Determinanten sind schön, wenn es 2, 3 oder 4 Gleichungen gibt. Aber wenn es eine große Zahl – oder gar eine unendlich große Zahl – von Gleichungen gibt, sind Determinanten nicht gut zu handhaben. Es ist dann besser, wenn wir versuchen, die Gleichungen direkt zu lösen. Zuerst wollen wir die Atome nach ihrem Ort bezeichnen; wir wollen sagen, dass das Atom n bei xn und das Atom (n + 1) bei xn+1 ist. Wenn wir den Atomabstand wie in Abbildung 13.1 mit b bezeichnen, dann gilt xn+1 = xn + b. Und wenn wir den Ursprung in das Atom null legen, dann gilt einfach xn = nb. Wir können dann (13.5) folgendermaßen umschreiben: Cn = a(xn )e−iEt/ ,
(13.7)
und aus Gleichung (13.6) wird Ea(xn ) = E0 a(xn ) − Aa(xn+1 ) − Aa(xn−1 ) .
(13.8)
Oder, wenn wir die Tatsache benutzen, dass xn+1 = xn + b ist, können wir auch schreiben Ea(xn ) = E0 a(xn ) − Aa(xn + b) − Aa(xn − b) .
(13.9)
Diese Gleichung hat eine gewisse Ähnlichkeit mit einer Differentialgleichung. Sie besagt, dass eine Größe a(x) an einem Punkt (xn ) zu derselben physikalischen Größe an benachbarten Punkten (xn ± b) in Beziehung steht. (Eine Differentialgleichung verknüpft den Wert einer Funktion an einem Punkt mit deren Werten an infinitesimal benachbarten Punkten.) Vielleicht helfen uns die üblichen Methoden zur Lösung von Differentialgleichungen hier irgendwie weiter. Versuchen wir es. Lineare Differentialgleichungen mit konstanten Koeffizienten werden immer durch Exponentialfunktionen gelöst. Wir können das auch hier versuchen. Nehmen wir als Lösungsansatz a(xn ) = eikxn .
(13.10)
Dann wird aus Gleichung (13.9) Eeikxn = E0 eikxn − Aeik(xn +b) − Aeik(xn −b) .
Wir können jetzt den gemeinsamen Faktor eikxn herauskürzen. Wir erhalten E = E0 − A eikb + e−ikb .
(13.11)
(13.12)
262
13 Ausbreitung im Kristallgitter
Der Klammerausdruck ist gleich 2 cos kb. Daraus folgt E = E0 − 2A cos kb .
(13.13)
Wir sehen also, dass es für jede beliebige Wahl der Konstanten k eine Lösung gibt, deren Energie durch diese Gleichung gegeben ist. Es gibt verschiedene mögliche Energien, die von k abhängen, und jedes k entspricht einer anderen Lösung. Es gibt unendlich viele Lösungen – was nicht überrascht, da wir mit unendlich vielen Basiszuständen begonnen haben. Schauen wir nun, was diese Lösungen bedeuten. Für jedes k sind die a’s durch (13.10) gegeben. Die Amplituden Cn sind dann Cn = eikxn e−(i/)Et ,
(13.14)
wobei Sie daran denken sollten, dass die Energie E gemäß (13.13) auch von k abhängt. Die Ortsabhängigkeit der Amplituden ist eikxn . Die Amplituden oszillieren, wenn wir von einem Atom zum nächsten gehen. Damit meinen wir, dass sich die Amplitude in der Reihe wie eine komplexe Schwingung verhält – ihr Betrag ist bei jedem Atom gleich, aber ihre Phase zu einem gegebenen Zeitpunkt nimmt von einem Atom zum nächsten um den Betrag (ikb) zu. Wir können den Vorgang veranschaulichen, indem wir für jedes Atom den Realteil der Amplitude durch eine vertikale Linie darstellen (siehe Abbildung 13.2). Re(Cn ) xn x Abb. 13.2: Die Änderung des Realteils von Cn mit x.
Die Einhüllende dieser vertikalen Linien (gestrichelte Kurve) ist natürlich eine Kosinuskurve. Der Imaginärteil von Cn ist ebenfalls eine oszillierende Funktion, aber um 90◦ phasenverschoben, sodass das Absolutquadrat (das die Summe der Quadrate des Real- und des Imaginärteiles ist) für alle C’s gleich ist. Wenn wir folglich ein k herausgreifen, erhalten wir einen stationären Zustand mit einer bestimmten Energie E. Und für jeden derartigen Zustand wird das Elektron mit gleicher Wahrscheinlichkeit bei jedem Atom gefunden – keines der Atome wird bevorzugt. Nur die Phase ist bei verschiedenen Atomen unterschiedlich. Auch ändern sich die Phasen im Laufe der Zeit. Gemäß (13.14) pflanzen sich der Real- und der Imaginärteil im Kristall als Wellen fort – nämlich als der Real- oder Imaginärteil von ei[kxn −(E/)t] .
(13.15)
Die Wellen können nach positivem oder negativem x propagieren, je nachdem, welches Vorzeichen k hat. Beachten Sie, dass wir die Zahl k in unserem Lösungsansatz (13.10) als reell angenommen haben. Wir können jetzt erkennen, warum dies so sein muss, wenn wir eine unendliche Reihe
13.2 Zustände mit bestimmter Energie
263
von Atomen haben. Angenommen, k wäre eine imaginäre Zahl, sagen wir −ik� . Dann würden � sich die Amplituden a(xn ) wie ek xn verhalten, was bedeutet, dass die Amplitude für positives k� größer und größer würde, wenn wir zu großen x gehen – oder zu großen negativen x, wenn k� eine negative Zahl ist. Diese Lösung wäre in Ordnung, wenn wir uns mit einer endlichen Reihe von Atomen beschäftigten. Sie kann aber für eine unendliche Kette von Atomen keine physikalische Lösung sein. Es würden sich unendlich große Amplituden ergeben – und daher unendlich große Wahrscheinlichkeiten, was offensichtlich nicht als Darstellung der realen Situation infrage kommt. Wir werden später ein Beispiel sehen, bei dem ein imaginäres k sinnvoll ist. E E0 + 2A E0
E0 − 2A −π/b
0
π/b
k
Abb. 13.3: Die Energie der stationären Zustände als Funktion des Parameters k.
Die Beziehung zwischen der Energie E und der Wellenzahl k, wie sie in (13.13) angegeben ist, ist in Abbildung 13.3 aufgetragen. Wie Sie der Abbildung entnehmen können, kann die Energie von (E0 − 2A) bei k = 0 bis (E0 + 2A) bei k = ±π/b gehen. Die Darstellung ist für positives A gezeichnet; für negatives A wäre die Kurve einfach invertiert, aber der Energiebereich wäre der gleiche. Das wichtige Ergebnis ist, dass zwar jede Energie innerhalb eines gewissen Energiebereiches oder „-bandes“ möglich ist, aber keine andere. Wenn ein Elektron in einem Kristall in einem stationären Zustand ist, kann es nach unseren Annahmen keine Energiewerte außerhalb dieses Bandes haben. Nach (13.13) entsprechen die betragsmäßig kleinsten k-Werte den niederenergetischen Zuständen, d. h. E ≈ (E0 − 2A). Wenn k dem Betrage nach größer wird (entweder nach positiven oder negativen Werten), wächst anfangs die Energie, erreicht dann aber ein Maximum bei k = ±π/b, wie in Abbildung 13.3 gezeigt. Für k-Werte, die größer als π/b sind, würde die Energie wieder abnehmen. Aber wir brauchen solche Werte von k nicht wirklich zu betrachten, weil sie keine neuen Zustände ergeben – sie wiederholen nur die Zustände, die wir schon bei kleineren k hatten. Wir können das folgendermaßen erkennen. Betrachten Sie den Zustand mit niedrigster Energie, bei dem k = 0 ist. Der Koeffizient a(xn ) ist für alle xn gleich 1. Nun würden wir dieselbe Energie für k = 2π/b erhalten. Aber dann ergibt sich unter Verwendung von (13.10) a(xn ) = ei(2π/b)xn . Wenn wir jedoch annehmen, dass x0 im Ursprung ist, können wir xn = nb setzen. Dann erhalten wir für alle a(xn ) a(xn ) = ei2πn = 1 . Der durch diese a(xn ) beschriebene Zustand ist physikalisch derselbe, den wir für k = 0 erhalten haben. Er stellt keine andere Lösung dar.
264
13 Ausbreitung im Kristallgitter 2
Re a(xn )
1
x
Abb. 13.4: Zwei Werte von k, die dieselbe physikalische Situation darstellen; Kurve 1 gilt für k = −π/4b, Kurve 2 für k = 7π/4b.
Als nächstes Beispiel nehmen wir an, dass k gleich −π/4b ist. Der Realteil von a(xn ) variiert dann wie die Kurve 1 in Abbildung 13.4. Wenn k gleich 7π/4b ist, variiert der Realteil von a(xn ) wie die Kurve 2 in der Abbildung. (Die vollständigen Kosinuskurven haben natürlich keine Bedeutung; was wichtig ist, sind allein die Werte an den Punkten xn . Die Kurven dienen nur der besseren Verständlichkeit.) Sie sehen, dass beide Werte von k bei allen xn dieselben Amplituden ergeben. Das Endergebnis ist, dass wir alle möglichen Lösungen unseres Problems erhalten, wenn wir nur k-Werte aus einem gewissen begrenzten Bereich nehmen. Wir wollen, wie in Abbildung 13.3, den Bereich zwischen −π/b und +π/b wählen. In diesem Bereich nimmt die Energie der stationären Zustände mit wachsendem Betrag von k gleichförmig zu. Eine Randbemerkung über etwas, womit Sie spielen können, sei angefügt. Nehmen wir an, dass das Elektron nicht nur zum nächsten Nachbarn mit einer Amplitude (pro Zeiteinheit) i A / springen kann, sondern dass es auch die Möglichkeit hat, mit einer anderen solchen Amplitude i B / mit einem einzigen Satz zum übernächsten Nachbarn zu springen. Sie werden feststellen, dass die Lösung wieder in der Form an = eikxn geschrieben werden kann – dieser Lösungstyp ist universell. Sie werden außerdem feststellen, dass die stationären Zustände mit der Wellenzahl k die Energie (E0 − 2A cos kb − 2B cos 2kb) haben. Dies zeigt, dass die Form der Kurve von E über k nicht allgemeingültig ist, sondern von den speziellen Voraussetzungen des Problems abhängt. Sie ist nicht immer eine Kosinuswelle – sie muss auch nicht unbedingt symmetrisch bezüglich irgendeiner horizontalen Linie sein. Es ist jedoch immer richtig, dass sich die Kurve außerhalb des k-Intervalls von −π/b bis π/b wiederholt, sodass Sie sich um andere Werte von k nicht kümmern müssen. Sehen wir uns etwas genauer an, was bei betragsmäßig kleinem k geschieht – das heißt, wenn die Änderungen der Amplituden von einem xn zum nächsten recht gering sind. Definieren wir den Energienullpunkt als E0 = 2A. Dann liegt das Minimum der Kurve von Abbildung 13.3 beim Energienullpunkt. Für hinreichend kleine k können wir dann schreiben cos kb ≈ 1 − k2 b2 /2 , und die durch (13.13) gegebene Energie wird zu E = Ak2 b2 .
(13.16)
Wir erhalten das Ergebnis, dass die Energie des Zustandes proportional zum Quadrat der Wellenzahl ist, die die räumlichen Änderungen der Amplituden Cn beschreibt.
13.3 Zeitabhängige Zustände
13.3
265
Zeitabhängige Zustände
In diesem Abschnitt wollen wir das Verhalten der Zustände im eindimensionalen Gitter ausführlicher diskutieren. Wenn ein Elektron die Amplitude Cn hat, bei xn zu sein, dann ist die Wahrscheinlichkeit, es dort zu finden, |Cn |2 . Für die stationären Zustände, die wir durch (13.14) beschrieben haben, ist diese Wahrscheinlichkeit für alle xn gleich und ändert sich nicht mit der Zeit. Wie können wir eine Situation darstellen, die wir in groben Zügen dadurch beschreiben würden, dass wir sagen: Ein Elektron mit einer gewissen Energie befindet sich in einem gewissen Gebiet – sodass es mit größerer Wahrscheinlichkeit an dem einen als an irgendeinem anderen Ort gefunden wird? Wir können dazu eine Überlagerung mehrerer Lösungen vom Typ (13.14) bilden, die leicht verschiedene k-Werte – und daher leicht verschiedene Energien – haben. Dann wird, zumindest bei t = 0, die Amplitude Cn aufgrund der Interferenz zwischen den verschiedenen Termen mit dem Ort variieren, genauso wie man Schwebungen erhält, wenn eine Überlagerung von Wellen verschiedener Wellenlängen vorliegt (wie wir in Band II, Kapitel 23 besprochen haben). Wir können daher ein „Wellenpaket“ mit einer vorherrschenden Wellenzahl k0 und verschiedenen anderen Wellenzahlen nahe bei k0 bilden.1 Re C(xn )
v
x
Abb. 13.5: Der Realteil von C(xn ) als Funktion von x für eine Überlagerung mehrerer Zustände mit ähnlicher Energie. (Der Abstand b ist in dem gezeigten Maßstab von x sehr klein).
In einer Überlagerung stationärer Zustände stellen die Amplitudensätze zu verschiedenen kWerten Zustände dar, die etwas unterschiedliche Energien und daher leicht unterschiedliche Frequenzen haben. Das Interferenzbild der sich insgesamt ergebenden Cn wird daher auch zeitlich variieren – es wird ein „Schwebungsbild“ geben. Wie wir in Kapitel 23 von Band II gesehen haben, werden sich die Spitzen der Schwebung (die Stellen, wo |C(xn )|2 groß ist) im Verlauf der Zeit in x-Richtung bewegen. Sie bewegen sich mit einer Geschwindigkeit, die wir „Gruppengeschwindigkeit“ genannt haben. Wir haben festgestellt, dass diese Gruppengeschwindigkeit bestimmt ist durch die Änderung der Frequenz mit k: vGruppe =
dω . dk
(13.17)
Dieselbe Herleitung kann auch hier verwendet werden. Ein „klümpchenhafter“ Elektronenzustand – nämlich einer, dessen Cn räumlich wie das Wellenpaket von Abbildung 13.5 variiert – bewegt sich in unserem eindimensionalen „Kristall“ mit der Geschwindigkeit v gleich dω/dk, wobei ω = E/ ist. Wenn wir (13.16) für E benutzen, erhalten wir v= 1
2Ab2 k.
Vorausgesetzt, wir versuchen nicht, das Paket zu schmal zu machen.
(13.18)
266
13 Ausbreitung im Kristallgitter
Mit anderen Worten, die Elektronen bewegen sich mit einer Geschwindigkeit proportional zu dem typischen k. Gleichung (13.16) besagt dann, dass die Energie eines solchen Elektrons proportional zum Quadrat seiner Geschwindigkeit ist – es verhält sich also wie ein klassisches Teilchen. Solange wir die Dinge in einem Maßstab betrachten, der so groß ist, dass wir die Feinstruktur nicht erkennen, liefert unser quantenmechanisches Bild dieselben Ergebnisse wie die klassische Physik. Wenn wir (13.18) nach k umstellen und den erhaltenen Ausdruck in (13.16) einsetzen, können wir tatsächlich schreiben E=
1 2
meff v2 ,
(13.19)
wobei meff eine Konstante ist. Die zusätzliche „Bewegungsenergie“ des Elektrons in einem Paket hängt in der gleichen Weise von der Geschwindigkeit ab wie bei einem klassischen Teilchen. Die Konstante meff – die „effektive Masse“ genannt wird – ist gegeben durch meff =
2 . 2Ab2
(13.20)
Beachten Sie auch, dass wir schreiben können meff v = k .
(13.21)
Wenn wir beschließen, meff v den „Impuls“ zu nennen, ist er mit der Wellenzahl k auf dieselbe Art verknüpft, die wir früher für ein freies Teilchen beschrieben haben. Vergessen Sie nicht, dass meff nichts mit der tatsächlichen Masse eines Elektrons zu tun hat. Sie kann ganz anders sein – obwohl es in realen Kristallen oft zufällig vorkommt, dass sie von derselben Größenordnung ist, etwa dem Zwei- bis Zwanzigfachen der Elektronenmasse im Vakuum. Wir haben nun ein bemerkenswertes Rätsel gelöst – wie ein Elektron in einem Kristall (etwa ein zusätzliches Elektron, das in Germanium gebracht wurde) direkt durch den Kristall hindurchgehen kann und es sich vollkommen frei bewegt, auch wenn es alle Atome anstößt. Es tut dies, indem seine Amplituden von einem Atom zum nächsten wandern, wobei es sich seinen Weg durch den Kristall bahnt. Das ist der Mechanismus, wie Festkörper Elektrizität leiten.
13.4
Ein Elektron im dreidimensionalen Gitter
Sehen wir uns nun an, wie wir diese Überlegungen erweitern können, um das Verhalten eines Elektrons in drei Dimensionen zu verstehen. Die Ergebnisse stellen sich als sehr ähnlich heraus. Angenommen, wir betrachten ein rechtwinkliges Atomgitter mit den Gitterabständen a, b, c in den drei Richtungen. (Wenn Sie ein kubisches Gitter möchten, wählen Sie die drei Abstände alle gleich.) Weiter nehmen wir an, dass die Amplitude (pro Zeiteinheit) für einen Sprung zu einem Nachbarn in x-Richtung (iA x /), für einen Sprung in y-Richtung (iAy /) und für einen Sprung in z-Richtung (iAz /) ist. Wie können wir jetzt die Basiszustände beschreiben? Wie im eindimensionalen Fall liegt ein Basiszustand dann vor, wenn sich das Elektron bei dem Atom befindet, dessen Koordinaten x, y, z sind, wobei (x, y, z) einer der Gitterpunkte ist. Wenn wir unseren Ursprungspunkt bei einem Atom wählen, liegen diese Punkte alle bei x = nxa ,
y = ny b
und z = nz c ,
13.4 Ein Elektron im dreidimensionalen Gitter
267
wobei n x , ny , nz beliebige ganze Zahlen sind. Zur Bezeichnung dieser Punkte wollen wir jetzt anstelle von Indizes einfach x, y und z verwenden, unter der Voraussetzung, dass sie nur Werte an den Gitterpunkten annehmen. Ein Basiszustand wird also durch die Notation | Elektron bei x, y, z � dargestellt, und für ein Elektron in einem beliebigen Zustand | ψ � ist die Amplitude, in diesem Basiszustand zu sein, C(x, y, z) = � Elektron bei x, y, z | ψ �.
Wie vorher können sich die Amplituden C(x, y, z) zeitlich ändern. Mit unseren Annahmen erhalten die hamiltonschen Gleichungen folgendes Aussehen: i
dC(x, y, z) = E0C(x, y, z) − A xC(x + a, y, z) − A xC(x − a, y, z) dt −AyC(x, y + b, z) − AyC(x, y − b, z) −AzC(x, y, z + c) − AzC(x, y, z − c) .
(13.22)
Das sieht ziemlich kompliziert aus; Sie können aber erkennen, wo die einzelnen Terme herkommen. Wieder können wir versuchen, einen stationären Zustand zu finden, bei dem sich alle C’s auf dieselbe Art zeitlich ändern. Wir machen also wieder einen Exponentialansatz: C(x, y, z) = e−iEt/ ei(kx x+ky y+kz z) .
(13.23)
Wenn Sie dies in (13.22) einsetzen, sehen Sie, dass dieser Ansatz die Gleichung erfüllt, vorausgesetzt, die Energie E ist mit k x , ky und kz folgendermaßen verknüpft: E = E0 − 2A x cos k x a − 2Ay cos ky b − 2Az cos kz c .
(13.24)
Die Energie hängt jetzt von den drei Wellenzahlen k x , ky , kz ab, die die Komponenten eines dreidimensionalen Vektors k bilden. Tatsächlich können wir den Ansatz (13.23) in Vektornotation ausdrücken: C(x, y, z) = e−iEt/ eik·r .
(13.25)
Die Amplitude variiert wie eine komplexe ebene Welle in drei Dimensionen und bewegt sich dabei in die Richtung von k, und zwar mit der Wellenzahl k = (k2x + ky2 + kz2 )1/2 . Die Energie, die mit diesen stationären Zuständen verbunden ist, hängt von den drei Komponenten von k auf die durch (13.24) gegebene komplizierte Art ab. Die Art der Änderung von E mit k hängt von den Vorzeichen und Beträgen der A x , Ay und Az ab. Wenn diese drei Zahlen alle positiv sind und wenn wir an kleinen absoluten Werten von k interessiert sind, ist die Abhängigkeit relativ einfach. Wenn wir die Kosinusfunktionen entwickeln, wie wir es zuvor getan haben, um (13.16) herzuleiten, dann erhalten wir E = Emin + A x a2 k2x + Ay b2 ky2 + Az c2 kz2 .
(13.26)
Bei einem einfachen kubischen Gitter mit dem Gitterabstand a erwarten wir, dass A x , Ay und Az gleich sind, also beispielsweise alle gleich A. Dann vereinfacht sich (13.26) zu E = Emin + Aa2 (k2x + ky2 + kz2 )
268
13 Ausbreitung im Kristallgitter
oder E = Emin + Aa2 k2 .
(13.27)
Dies entspricht (13.16). Den Argumenten folgend, die wir dort benutzt haben, erwarten wir, dass sich ein Elektronenpaket (gebildet durch Überlagerung vieler Zustände mit fast gleichen Energien) in drei Dimensionen ebenfalls wie ein klassisches Teilchen mit einer bestimmten effektiven Masse bewegt. In einem Kristall, der eine niedrigere Symmetrie als die kubische Symmetrie hat (oder auch in einem kubischen Kristall, in dem der Zustand des Elektrons bei jedem Atom asymmetrisch ist), sind die drei Koeffizienten A x , Ay und Az verschieden. Dann ist die „effektive Masse“ eines Elektrons, das in einem kleinen Volumen lokalisiert ist, abhängig von der Bewegungsrichtung. Es könnte zum Beispiel eine andere Trägheit bei der Bewegung in x-Richtung als bei der Bewegung in y-Richtung haben. (Die Details dieser Situation werden durch den „Tensor der effektiven Masse“ beschrieben.)
13.5
Weitere Zustände in einem Gitter
Gemäß (13.24) können die Elektronenzustände, über die wir gesprochen haben, nur Energien in einem gewissen „Energieband“ haben, das den Energiebereich vom Energieminimum E0 − 2(A x + Ay + Az ) bis zum Energiemaximum E0 + 2(A x + Ay + Az ) umfasst. Andere Energien sind zwar möglich, sie gehören aber zu einer anderen Klasse von Elektronenzuständen. Bei den beschriebenen Zuständen haben wir uns Basiszustände vorgestellt, in denen sich ein Elektron bei einem Atom des Kristalls in irgendeinem speziellen Zustand befindet, sagen wir im Zustand niedrigster Energie. Wenn Sie ein Atom im leeren Raum betrachten, ein Elektron hinzufügen und dadurch ein Ion erzeugen, dann kann das Ion auf viele Arten gebildet werden. Das Elektron kann sich so verhalten, dass der Zustand mit niedrigster Energie gebildet wird, oder so, dass der eine oder andere von vielen möglichen „angeregten Zuständen“ des Ions gebildet wird, wobei jeder eine bestimmte Energie oberhalb der niedrigsten Energie hat. Dasselbe kann in einem Kristall vorkommen. Nehmen wir an, die Energie E0 , die wir oben herausgegriffen haben, entspricht Basiszuständen, welche Ionen der niedrigstmöglichen Energie sind. Wir könnten uns auch ein neues System von Basiszuständen denken, in dem das Elektron auf andere Weise in der Nähe des n-ten Atoms sitzt – in einem der angeregten Zustände des Ions –, sodass die Energie E0 jetzt ein ganzes Stück höher liegt. Wie vorher gibt es eine Amplitude A (die anders als vorher ist), dass das Elektron aus seinem angeregten Zustand bei dem einen Atom in denselben angeregten Zustand bei einem benachbarten Atom springen wird. Die ganze Untersuchung verläuft dann wie vorher; wir finden ein Band von möglichen Energien, das sich bei einer höheren Energie befindet. Es kann im Allgemeinen viele solche Bänder geben, wobei jedes einem anderen Anregungsniveau entspricht.
13.5 Weitere Zustände in einem Gitter
269
Es gibt auch noch andere Möglichkeiten. Es kann eine Amplitude geben, dass das Elektron in einem angeregten Zustand bei dem einen Atom in einen nicht angeregten Zustand beim nächsten Atom springt. (Dies nennt man eine Wechselwirkung zwischen den Bändern.) Die mathematische Theorie wird immer komplizierter, je mehr Bänder Sie berücksichtigen und je mehr Koeffizienten Sie für den Übergang zwischen den möglichen Zuständen hinzufügen. Es sind jedoch keine neuen Konzepte erforderlich; die Gleichungen werden fast genauso gebildet wie in unserem einfachen Beispiel. Wir sollten auch anmerken, dass es nicht mehr viel zu sagen gibt über die verschiedenen Koeffizienten wie die Amplitude A, die in der Theorie erscheinen. Im Allgemeinen sind sie sehr schwer zu berechnen, man weiß daher in den praktischen Fällen theoretisch sehr wenig über diese Parameter, und für eine konkrete Situation können wir nur experimentell bestimmte Werte nehmen. Es gibt andere Situationen, wo die Physik und die Mathematik fast genau dem entsprechen, was wir für ein sich im Kristall bewegendes Elektron gefunden haben, wo aber das sich bewegende „Objekt“ ein ganz anderes ist. Nehmen wir zum Beispiel an, dass unser ursprünglicher Kristall – oder vielmehr unser lineares Gitter – aus einer Reihe von neutralen Atomen besteht, wobei jedes ein schwach gebundenes äußeres Elektron besitzt. Dann stellen wir uns vor, dass wir ein Elektron entfernen. Welches Atom hat sein Elektron verloren? Cn sei jetzt die Amplitude, dass das Elektron des Atoms bei xn fehlt. Es wird im Allgemeinen eine Amplitude (pro Zeiteinheit) iA/ geben, dass ein Elektron von einem benachbarten Atom – sagen wir vom (n − 1)-ten Atom – zum n-ten springt und das (n − 1)-te Atom ohne Elektron zurücklässt. Das ist dasselbe, als ob man sagt, dass es für das „fehlende Elektron“ eine Amplitude iA/ für den Sprung vom n-ten Atom zum (n−1)-ten Atom gibt. Sie können sehen, dass die Gleichungen genau dieselben sind – der Wert von A braucht natürlich nicht derselbe zu sein wie zuvor. Wieder erhalten wir dieselben Formeln für die Energieniveaus, für die „Wahrscheinlichkeitswellen“, die sich mit der Gruppengeschwindigkeit (13.18) durch den Kristall bewegen, für die effektive Masse usw. Nur beschreiben die Wellen jetzt das Verhalten des fehlenden Elektrons – oder des „Lochs“. Ein „Loch“ verhält sich daher genau so wie ein Teilchen mit einer bestimmten Masse meff . Sie können sehen, dass dieses Teilchen scheinbar eine positive Ladung hat. Im nächsten Kapitel werden Sie mehr über solche Löcher erfahren. Als weiteres Beispiel betrachten wir eine Reihe identischer neutraler Atome, von denen eins in einen angeregten Zustand gebracht worden ist – das heißt, es hat eine höhere Energie als im Grundzustand. Sei Cn die Amplitude, dass das n-te Atom angeregt ist. Es kann mit einem benachbarten Atom reagieren, indem es ihm seine zusätzliche Energie abgibt und selbst in den Grundzustand zurückgeht. Wir bezeichnen die Amplitude (pro Zeiteinheit) für diesen Prozess mit iA/. Sie können sehen, dass das schon wieder dieselbe Mathematik ist. Das sich bewegende Objekt heißt jetzt Exziton. Es verhält sich wie ein neutrales „Teilchen“, das sich durch den Kristall bewegt und die Anregungsenergie mit sich trägt. Solche Bewegungen können bei gewissen biologischen Prozessen vorkommen, etwa beim Sehen oder bei der Photosynthese. Man hat vermutet, dass die Lichtabsorption in der Netzhaut ein „Exziton“ erzeugt, das sich durch eine periodische Struktur bewegt (wie durch die Schichten in den Stäbchenzellen, die wir in Kapitel 11 von Band II beschrieben haben; siehe Abbildung 11.5), um dann an einer besonderen Station angehäuft zu werden, wo die Energie benutzt wird, um eine chemische Reaktion in Gang zu setzen.
270
13.6
13 Ausbreitung im Kristallgitter
Streuung an Fehlerstellen in einem Gitter
Wir möchten jetzt den Fall eines einzelnen Elektrons betrachten, das sich in einem nicht vollkommenen Kristall befindet. Unsere frühere Untersuchung hat ergeben, dass vollkommene Kristalle vollkommene Leitfähigkeit haben – dass Elektronen wie im Vakuum reibungsfrei durch den Kristall schlüpfen können. Eines der wichtigsten Dinge, die ein Elektron daran hindern können, ewig weiter zu laufen, ist ein Fehler oder eine Unregelmäßigkeit im Kristall. Als Beispiel nehmen wir an, dass irgendwo im Kristall ein Atom fehlt; oder wir nehmen an, dass jemand ein „falsches“ Atom auf einen der Atomplätze gesetzt hat, sodass sich die Dinge dort anders verhalten als an den anderen Atomplätzen. Sagen wir, die Energie E0 oder die Amplitude A könnte verschieden sein. Wie würden wir beschreiben, was dann geschieht? Um konkret zu sein, betrachten wir den eindimensionalen Fall und nehmen an, dass das Atom Nummer „null“ ein „Fremdatom“ ist und einen anderen E0 -Wert als alle übrigen Atome hat. Bezeichnen wir diese Energie mit (E0 + F). Was geschieht? Wenn das Elektron beim Atom „null“ ankommt, gibt es eine Wahrscheinlichkeit, dass das Elektron zurückgestreut wird. Wenn ein Wellenpaket auf seinem Weg eine Stelle erreicht, wo die Verhältnisse ein wenig anders sind, wird ein Teil von ihm seinen Weg fortsetzen und ein Teil wird zurückgestreut. Es ist recht schwierig, diese Situation unter Benutzung eines Wellenpakets zu untersuchen, weil sich alles zeitlich ändert. Es ist viel leichter, mit den Lösungen der stationären Zustände zu arbeiten. Wir werden daher mit stationären Zuständen arbeiten, die, wie wir feststellen werden, aus fortlaufenden Wellen gebildet werden können, die durchgelassene und reflektierte Anteile haben. In drei Dimensionen würden wir den reflektierten Teil die Streuwelle nennen, da er sich in verschiedene Richtungen ausbreitet. Wir beginnen mit einem System von Gleichungen, die genauso sind wie (13.6), nur dass die Gleichung für n = 0 von allen übrigen verschieden ist. Die fünf Gleichungen für n = −2, −1, 0, +1 und +2 sehen so aus: .. .
.. .
Ea−2 = E0 a−2 − Aa−1 − Aa−3 , Ea−1 = E0 a−1 − Aa0 − Aa−2 ,
Ea0 = (E0 + F)a0 − Aa1 − Aa−1 ,
(13.28)
Ea1 = E0 a1 − Aa2 − Aa0 , Ea2 = E0 a2 − Aa3 − Aa1 , .. ... .
Es gibt natürlich noch all die anderen Gleichungen für |n| größer als 2. Nun, diese sehen genau wie (13.6) aus. Im allgemeinen Fall sollten wir eigentlich ein anderes A für die Amplitude benutzen, dass das Elektron zum Atom „null“ hin oder davon weg springt. Die Haupteigenschaften des Vorgangs werden sich aber auch aus dem vereinfachten Beispiel ergeben, bei dem alle A’s gleich sind. Der Lösungsansatz (13.10) wäre weiterhin brauchbar für alle Gleichungen bis auf die eine für Atom „null“ – er ist für diese eine Gleichung nicht richtig. Wir brauchen eine andere Lösung,
13.6 Streuung an Fehlerstellen in einem Gitter
271
die wir uns folgendermaßen beschaffen können. Die Funktion (13.10) stellt eine Welle dar, die in positive x-Richtung läuft. Eine Welle, die in negative x-Richtung läuft, also a(xn ) = e−ikxn , wäre eine ebenso gute Lösung. Die allgemeine Lösung, die wir für (13.6) hätten nehmen können, ist eine Kombination einer vorwärts- und einer rückwärtslaufenden Welle, also an = αeikxn + βe−ikxn .
(13.29)
Diese Lösung ist die Überlagerung einer Welle mit der Amplitude α, die sich in +x-Richtung bewegt, und einer Welle mit der Amplitude β, die sich in −x-Richtung bewegt.
Nun betrachten wir das Gleichungssystem für unser neues Problem – die Gleichungen in (13.28) zusammen mit jenen für alle anderen Atome. Die Gleichungen, die nur an mit n < 0 enthalten, werden alle durch (13.29) erfüllt, unter der Bedingung, dass k mit E und dem Gitterabstand b verknüpft ist durch E = E0 − 2A cos kb .
(13.30)
Dies bedeutet physikalisch, dass sich eine „einfallende“ Welle mit der Amplitude α dem Atom „null“ (dem „Streuzentrum“) von links nähert und eine „gestreute“ oder „reflektierte“ Welle mit der Amplitude β wieder nach links zurückgeht. Ohne Beschränkung der Allgemeinheit können wir die Amplitude α der einfallenden Welle gleich 1 setzen. Dann ist die Amplitude β im Allgemeinen eine komplexe Zahl. Wir können analoge Aussagen über die Lösungen von an für n > 0 treffen. Die Koeffizienten können andere sein. Wir erhalten daher für sie an = γ eikxn + δ e−ikxn ,
für n ≥ 1 .
(13.31)
Hier ist γ die Amplitude einer Welle, die nach rechts geht, und δ die Amplitude einer Welle, die von rechts kommt. Wir betrachten jedoch die physikalische Situation, in der eine Welle ursprünglich nur von links ausgeht und in der es nur eine „durchgelassene“ Welle gibt, die hinter dem Streuzentrum – oder Fremdatom – herauskommt, und versuchen, eine Lösung für δ = 0 zu finden. Wir können sicher alle Gleichungen (13.28) für die an bis auf die mittleren drei durch die folgenden Lösungsansätze befriedigen an (für n < 0) = eikxn + βe−ikxn ,
(13.32)
an (für n > 0) = γeikxn . Die Situation, über die wir sprechen, ist in Abbildung 13.6 dargestellt. gestreute Welle β einfallende Welle 1 n
−4
−3
−2
−1
durchgelassene Welle γ
0
1
2
3
4
Abb. 13.6: Wellen in einem eindimensionalen Gitter mit einem „Fremdatom“ bei n = 0.
272
13 Ausbreitung im Kristallgitter
Wenn wir die Formeln (13.32) für a−1 und a+1 benutzen, liefern uns die drei mittleren Gleichungen von (13.28) eine Lösung für a0 und auch für die beiden Koeffizienten β und γ. Wir haben dann eine vollständige Lösung gefunden. Wenn wir xn = nb setzen, müssen wir die folgenden drei Gleichungen lösen (E − E0 ) eik(−b) + βe−ik(−b) = −A a0 + eik(−2b) + βe−ik(−2b) , (E − E0 − F)a0 = −A γeikb + eik(−b) + βe−ik(−b) , (E − E0 )γeikb = −A γeik(2b) + a0 .
(13.33)
Beachten Sie, dass E in Abhängigkeit von k durch (13.30) gegeben ist. Wenn Sie diesen Wert für E in die Gleichungen einsetzen und bedenken, dass cos x = 21 (eix + e−ix ) ist, erhalten Sie aus der ersten Gleichung a0 = 1 + β
(13.34)
und aus der dritten Gleichung a0 = γ .
(13.35)
Diese beiden Gleichungen sind nur dann verträglich, wenn γ = 1 + β.
(13.36)
Diese Gleichung besagt, dass die durchgelassene Welle (γ) gleich der einfallenden Welle (1) mit einer hinzugefügten Welle (β) ist, die gleich der reflektierten Welle ist. Dies ist nicht immer richtig, aber für eine Streuung an nur einem Atom trifft es zu. Wenn es eine Anhäufung von Fremdatomen gäbe, wäre der Betrag, der zur Vorwärtswelle hinzukommt, nicht unbedingt gleich der reflektierten Welle. Wir erhalten die Amplitude β der reflektierten Welle aus der mittleren Gleichung des Systems (13.33): β=
−F . F − 2iA sin kb
(13.37)
Damit haben wir die vollständige Lösung für das Gitter mit einem Fremdatom. Sie werden sich vielleicht wundern, wieso die durchgelassene Welle „mehr“ sein kann als die einfallende Welle, wie es gemäß (13.36) den Anschein hat. Doch bedenken Sie, dass β und γ komplexe Zahlen sind und dass die Anzahl der Teilchen (oder vielmehr die Wahrscheinlichkeit, ein Teilchen zu finden) in einer Welle proportional zum Absolutquadrat der Amplitude ist. Tatsächlich gibt es nur dann eine „Erhaltung des Elektrons“, wenn |β|2 + |γ|2 = 1 . Sie können zeigen, dass dies für unsere Lösung zutrifft.
(13.38)
13.7 Einfang durch eine Gitterfehlerstelle
13.7
273
Einfang durch eine Gitterfehlerstelle
Es gibt eine weitere interessante Situation, die auftreten kann, wenn F eine negative Zahl ist. Wenn die Energie des Elektrons beim Fremdatom (bei n = 0) niedriger als überall sonst ist, dann kann das Elektron von diesem Atom eingefangen werden. Das heißt, wenn (E0 + F) unterhalb der niedrigsten Stelle des Bandes bei (E0 − 2A) ist, dann kann das Elektron in einem Zustand mit E < E0 − 2A „eingefangen“ werden. Solch eine Lösung kann sich aus dem, was wir bisher getan haben, nicht ergeben. Wir können diese Lösung jedoch erhalten, wenn wir im Lösungsansatz (13.10) imaginäre Zahlen für k zulassen. Setzen wir k = ±iκ. Wieder können wir verschiedene Lösungen für n < 0 und n > 0 erhalten. Eine mögliche Lösung für n < 0 ist an (für n < 0) = c e+κxn .
(13.39)
Wir müssen das Pluszeichen im Exponenten verwenden, denn sonst würde die Amplitude für große negative Werte von n unbegrenzt groß. Entsprechend ergibt sich eine mögliche Lösung für n > 0: an (für n > 0) = c� e−κxn .
(13.40)
Wenn wir diese Lösungsansätze in (13.28) einsetzen, sind alle Gleichungen bis auf die mittleren drei befriedigt, falls E = E0 − A(eκb + e−κb ) .
(13.41)
Da die Summe der beiden Exponentialausdrücke immer größer als 2 ist, liegt diese Energie unterhalb des regulären Bandes und ist damit das, wonach wir suchen. Die übrigen drei Gleichungen in (13.28) sind erfüllt, wenn a0 = c = c� ist und wenn κ so gewählt ist, dass A(eκb − e−κb ) = −F .
(13.42)
Wenn wir diese Gleichungen mit (13.41) kombinieren, erhalten wir die Energie des eingefangenen Elektrons: √ E = E0 − 4A2 + F 2 . (13.43) Das eingefangene Elektron hat eine bestimmte Energie, die etwas unterhalb des Leitungsbandes liegt. Beachten Sie, dass die durch (13.39) und (13.40) gegebenen Amplituden nicht bedeuten, dass das eingefangene Elektron direkt beim Fremdatom sitzt. Die Wahrscheinlichkeit, das Elektron bei benachbarten Atomen zu finden, ist durch das Quadrat dieser Amplituden gegeben. Bei einer speziellen Wahl der Parameter (c = c� ) könnte sie wie in der Balkendarstellung von Abbildung 13.7 variieren. Am größten ist die Wahrscheinlichkeit, das Elektron beim Fremdatom zu finden. Für benachbarte Atome fällt die Wahrscheinlichkeit exponentiell mit dem Abstand vom Fremdatom ab. Dies ist ein weiteres Beispiel für den „Tunneleffekt“. Vom Standpunkt der klassischen Physik aus hat das Elektron nicht genug Energie, um aus dem „Energieloch“ herauszukommen. Aber quantenmechanisch kann es ein kleines Stück hinaussickern.
274
13 Ausbreitung im Kristallgitter Wahrscheinlichkeit c2 e−2κx
c2 e+2κx
x
Fremdatom n
−4 −3 −2 −1
13.8
0
1
2
3
4
Abb. 13.7: Die relativen Wahrscheinlichkeiten, ein eingefangenes Elektron an Atomplätzen in der Nähe des einfangenden Fremdatoms zu finden.
Streuamplituden und gebundene Zustände
Abschließend wollen wir unser Beispiel benutzen, um einen Aspekt zu erläutern, der in der Physik hochenergetischer Teilchen sehr nützlich ist. Es handelt sich um eine Beziehung zwischen Streuamplituden und gebundenen Zuständen. Nehmen wir an, wir hätten – durch Experiment und theoretische Berechnung – entdeckt, auf welche Weise Pionen an Protonen gestreut werden. Dann wird ein neues Teilchen entdeckt, und man fragt sich, ob es vielleicht einfach eine Kombination von einem Pion und einem Proton ist, die in einem gebundenen Zustand zusammengehalten werden (ähnlich wie ein Elektron an ein Proton gebunden ist und ein Wasserstoffatom bildet). Unter einem gebundenen Zustand verstehen wir eine Kombination, die eine niedrigere Energie als die beiden freien Teilchen hat. Es gibt eine allgemeine Theorie, die besagt, dass es einen gebundenen Zustand bei jener Energie gibt, bei der die Streuamplitude unendlich wird, wenn man sie rechnerisch auf Energiebereiche außerhalb des erlaubten Bandes extrapoliert (der mathematische Ausdruck heißt „analytische Fortsetzung“). Der physikalische Grund dafür ist der folgende. Ein gebundener Zustand ist eine Situation, in der es lediglich eine an einen Punkt gebundene Welle gibt, und es gibt keine Welle, die hineinkommt, um diesen Zustand zu erzeugen, er existiert einfach für sich. Das relative Verhältnis zwischen der so genannten „gestreuten“ oder erzeugten Welle und der „hineingeschickten“ Welle ist folglich unendlich. Wir können diesen Gedanken in unserem Beispiel nachprüfen. Schreiben wir den Ausdruck (13.37) für die Streuamplitude direkt in Abhängigkeit von der Energie des gestreuten Teilchens (anstatt in Abhängigkeit von k). Da Gleichung (13.30) in der Form 2A sin kb = 4A2 − (E − E0 )2 , geschrieben werden kann, ist die Streuamplitude β=
−F . F − i 4A2 − (E − E0 )2
(13.44)
Gemäß unserer Ableitung darf diese Gleichung eigentlich nur für reale Zustände benutzt werden – für solche, die Energien im Energieband E = E0 ± 2A haben. Nehmen wir aber an, wir vergessen diese Tatsache und erweitern die Formel auf „unphysikalische“ Energiebereiche, wo |E − E0 | > 2A ist. Für diese unphysikalischen Bereiche können wir schreiben2 4A2 − (E − E0 )2 = i (E − E0 )2 − 4A2 . 2
Wie das Vorzeichen der Wurzel gewählt werden muss, ist eine technische Angelegenheit, die mit den erlaubten Vorzeichen von κ in (13.39) und (13.40) zusammenhängt. Wir möchten hier darauf nicht eingehen.
13.8 Streuamplituden und gebundene Zustände
275
Dann ist die „Streuamplitude“, was immer sie nun bedeuten mag, β=
−F . F + (E − E0 )2 − 4A2
(13.45)
Nun fragen wir: Gibt es eine Energie, für die β unendlich wird (d. h. für die der Ausdruck für β einen „Pol“ hat)? Ja, solange F negativ ist, wird der Nenner von (13.45) null, wenn (E − E0 )2 − 4A2 = F 2 oder wenn E = E0 ±
√ 4A2 + F 2 .
Das Minuszeichen ergibt genau die Energie, die wir in (13.43) für die eingefangene Energie gefunden haben. Wie ist es mit dem Pluszeichen? Dies ergibt eine Energie oberhalb des erlaubten Energiebandes. Und tatsächlich gibt es da einen weiteren gebundenen Zustand, der uns entgangen ist, als wir die Gleichungen (13.28) gelöst haben. Wir überlassen es Ihnen als Übungsaufgabe, die Energie und die Amplituden an für diesen gebundenen Zustand zu finden. Die Beziehung zwischen Streuung und gebundenen Zuständen liefert uns einen der nützlichsten Anhaltspunkte bei unserem Bemühen, die experimentellen Beobachtungen bezüglich der neuen seltsamen Teilchen zu verstehen.
14
Halbleiter
Literaturhinweis: C. Kittel, Einführung in die Festkörperphysik.
14.1
Elektronen und Löcher in Halbleitern
Eine der bemerkenswerten und dramatischen Entwicklungen ist die Anwendung der Festkörperphysik bei der Entwicklung von elektronischen Bauelementen wie den Transistoren. Die Untersuchung der Halbleiter führte zu der Entdeckung ihrer nützlichen Eigenschaften und zu einer großen Zahl praktischer Anwendungen. Die Umwälzungen auf diesem Gebiet gehen so schnell, dass unsere heutigen Aussagen schon im nächsten Jahr veraltet sein können. Sie werden jedenfalls unvollständig sein. Es ist auch vollkommen klar, dass mit der weiter voranschreitenden Untersuchung dieser Materialien viele neue und noch faszinierendere Dinge möglich sein werden. Für den noch ausstehenden Stoff in diesem Band brauchen Sie dieses Kapitel nicht, aber es dürfte interessant sein zu sehen, dass zumindest etwas von dem, was Sie lernen, eine Beziehung zu der praktischen Welt hat. Es gibt eine große Zahl bekannter Halbleiter. Wir wollen uns auf jene konzentrieren, die zur Zeit die am weitesten verbreitete technische Anwendung finden. Das sind gleichzeitig die am besten verstandenen, und darauf aufbauend, können wir bis zu einem gewissen Grad auch viele der anderen verstehen. Die Halbleitersubstanzen, die heute allgemein am gebräuchlichsten sind, sind Silizium und Germanium. Diese Elemente kristallisieren im Diamantgitter, einer bestimmten kubischen Struktur, bei der die Atome tetraederförmig mit ihren nächsten Nachbarn verbunden sind. Sie sind bei sehr niedrigen Temperaturen – nahe dem absoluten Nullpunkt – Isolatoren, während sie bei etwa Raumtemperatur die Elektrizität leiten. Sie sind keine Metalle; sie heißen Halbleiter. Wenn wir ein zusätzliches Elektron in einen Silizium- oder Germaniumkristall hineinbringen, der sich auf einer tiefen Temperatur befindet, erhalten wir genau die Situation, die wir im vorigen Kapitel beschrieben haben. Das Elektron wird im Kristall herumwandern, wobei es von einem Atomplatz zum nächsten springt. Tatsächlich haben wir nur das Verhalten von Elektronen in einem einfach kubischen Gitter betrachtet, weshalb die Gleichungen für das Gitter von Silizium oder Germanium ein wenig anders sind. Alle wesentlichen Aspekte haben wir jedoch durch die Ergebnisse für das einfach kubische Gitter erfasst. Wie wir in Kapitel 13 gesehen haben, können die Elektronen im Gitter nur Energien in einem gewissen Energieband haben, das Leitungsband genannt wird. Gemäß (13.24) ist innerhalb dieses Bandes die Energie mit der Wellenzahl k in der Wahrscheinlichkeitsamplitude C verknüpft durch E = E0 − 2A x cos k x a − 2Ay cos ky b − 2Az cos kz c .
(14.1)
278
14 Halbleiter
Die A’s sind die Amplituden für Sprünge in die x-, y- und z-Richtung, und a, b und c sind die Gitterabstände in diesen Richtungen. Für Energien in der Nähe der unteren Grenze des Bandes können wir (14.1) annähern durch E = Emin + A x a2 k2x + Ay b2 ky2 + Az c2 kz2
(14.2)
(siehe Gleichung (13.26)). Wenn wir eine Elektronenbewegung in eine bestimmte Richtung betrachten, sodass die Komponenten von k immer in demselben Verhältnis stehen, dann ist die Energie eine quadratische Funktion der Wellenzahl und, wie wir gesehen haben, des Elektronenimpulses. Wir können schreiben E = Emin + αk2 ,
(14.3)
wobei α eine Konstante ist. In Abbildung 14.1 ist E gegen k aufgetragen. Eine solche Darstellung nennen wir ein „Energiediagramm“. Ein Elektron in einem speziellen Energie- und Impulszustand kann durch einen Punkt, wie der Punkt S in der Abbildung, charakterisiert werden. E
S Emin
k
Abb. 14.1: Das Energiediagramm für ein Elektron in einem isolierenden Kristall.
Wie wir in Kapitel 13 auch erwähnt haben, erhalten wir eine ähnliche Situation, wenn wir ein Elektron aus einem neutralen Isolator entfernen. Dann kann ein Elektron von einem benachbarten Atom überspringen und das „Loch“ füllen, wodurch es bei dem Atom, von dem es ausging, ein anderes „Loch“ zurücklässt. Wir können dieses Verhalten beschreiben, indem wir eine Amplitude angeben, das Loch bei einem speziellen Atom zu finden, und indem wir sagen, dass das Loch von einem Atom zum nächsten springen kann. (Offenbar ist die Amplitude A, dass das Loch von Atom a zu Atom b springt, genau gleich der Amplitude, dass ein Elektron vom Atom b in das Loch bei Atom a springt.) Die Mathematik ist für das Loch genauso, wie sie für das zusätzliche Elektron war, und wir erhalten wieder, dass die Energie des Lochs mit der Wellenzahl durch eine Gleichung wie (14.1) oder (14.2) verknüpft ist, nur dass sie natürlich andere Zahlenwerte für die Amplituden A x , Ay und Az hat. Das Loch hat eine Energie, die mit der Wellenzahl in seiner Wahrscheinlichkeitsamplitude in Beziehung steht. Seine Energie liegt in einem begrenzten Band, und nahe der unteren Grenze des Bandes ändert sich die Energie quadratisch mit der Wellenzahl (oder dem Impuls)
14.1 Elektronen und Löcher in Halbleitern
279
ebenso wie in Abbildung 14.1. Wenn wir den Ausführungen von Abschnitt 13.3 folgen, erkennen wir, dass sich das Loch ebenfalls wie ein klassisches Teilchen verhält, welches eine gewisse effektive Masse hat – mit dem Unterschied, dass in nichtkubischen Kristallen die Masse von der Bewegungsrichtung abhängt. Das Loch verhält sich daher wie ein positives Teilchen, das sich durch den Kristall bewegt. Die Ladung des Loch-Teilchens ist positiv, weil es sich am Platz eines fehlenden Elektrons befindet; und wenn es sich in eine Richtung bewegt, dann handelt es sich eigentlich um ein Elektron, das sich in die entgegengesetzte Richtung bewegt. Wenn wir mehrere Elektronen in einen neutralen Kristall bringen, dann werden sie sich ähnlich wie die Atome eines Gases von niedrigem Druck herumbewegen. Wenn nicht zu viele Elektronen da sind, werden ihre Wechselwirkungen nicht sehr bedeutsam sein. Wenn wir dann ein elektrisches Feld quer durch den Kristall gehen lassen, setzen sich die Elektronen in Bewegung und es fließt ein elektrischer Strom. Schließlich werden alle Elektronen zu dem einen Ende des Kristalls gezogen, und wenn dort eine Metallelektrode angebracht ist, werden sie eingesammelt und lassen den Kristall neutral zurück. Auf ähnliche Art könnten wir viele Löcher in einen Kristall bringen. Sie würden ohne Vorzugsrichtung herumwandern, wenn kein elektrisches Feld vorhanden ist. Liegt ein Feld vor, werden sie zum negativen Pol fließen und dort „eingesammelt“ – was wirklich geschieht, ist, dass die Löcher durch Elektronen aus der Metallelektrode neutralisiert werden. Man kann im Kristall auch gleichzeitig Löcher und Elektronen haben. Wenn es nicht zu viele sind, werden sie alle unabhängig ihrer Wege gehen. Liegt ein elektrisches Feld vor, werden sie alle zum Strom beitragen. Aus offensichtlichen Gründen werden die Elektronen negative Ladungsträger und die Löcher positive Ladungsträger genannt. Wir haben bisher den Fall betrachtet, dass Elektronen von außen in den Kristall gebracht oder aus dem Kristall entfernt werden. Es ist aber auch möglich, ein Elektron-Loch-Paar zu erzeugen, indem man ein gebundenes Elektron von einem neutralen Atom wegnimmt und es an einen etwas entfernten Ort im Kristall bringt. Es gibt dann ein freies Elektron und ein freies Loch, und die beiden können sich wie beschrieben herumbewegen. E
S − Emin
E− k
Abb. 14.2: Die Energie E − ist erforderlich, um ein freies Elektron im Zustand S zu „erzeugen“.
Die Energie, die erforderlich ist, um ein Elektron in einen Zustand S zu bringen – wir sagen, um den Zustand S zu „erzeugen“ –, ist die in Abbildung 14.2 eingezeichnete Energie E − . Das − ist eine Energie oberhalb von Emin . Die Energie, die erforderlich ist, um ein Loch in einem � + Zustand S zu erzeugen, ist die Energie E + aus Abbildung 14.3, die einen Wert größer als Emin
280
14 Halbleiter E
S�
+ Emin
E+ k
Abb. 14.3: Die Energie E + ist erforderlich, um ein Loch im Zustand S � zu „erzeugen“.
hat. Wenn wir jetzt ein Elektron-Loch-Paar in den Zuständen S und S � erzeugen wollen, dann ist die erforderliche Energie einfach E − + E + . Die Erzeugung von Elektron-Loch-Paaren ist ein üblicher Vorgang, wie wir später sehen werden. Man fasst daher häufig Abbildung 14.2 und Abbildung 14.3 zusammen, wobei die LochEnergie nach unten aufgetragen wird, obwohl sie natürlich eine positive Energie ist. Wir haben unsere beiden Darstellungen auf diese Art in Abbildung 14.4 zusammengefasst. Der Vorteil dieser Darstellung ist, dass die Energie EPaar = E − + E + , die erforderlich ist, um ein E − (Elektron) Elektron
S − Emin
EPaar k
+ Emin
S� Loch
E + (Loch) (positive Energie nach unten)
Abb. 14.4: Energiediagramm für ein Elektron und ein Loch in einem Bild.
14.1 Elektronen und Löcher in Halbleitern
281
E − (Elektron) Elektronenleitungsband
Zustand S
− Emin
ELücke + Emin
Valenzband
Zustand S �
E + (Loch)
Abb. 14.5: Energieniveaudiagramm für Elektronen und Löcher.
Paar mit dem Elektron in S und dem Loch in S � zu erzeugen, einfach der vertikale Abstand zwischen S und S � ist, der aus der Abbildung abgelesen werden kann. Die zur Erzeugung eines − + Paares erforderliche Mindestenergie wird „Energielücke“ genannt und ist gleich Emin + Emin . Sie werden manchmal ein einfacheres Diagramm sehen, das Energieniveau-Diagramm genannt wird. Es wird dann gezeichnet, wenn man nicht an der k-Variablen interessiert ist. Ein solches Diagramm – das in Abbildung 14.5 gezeigt ist – gibt einfach die möglichen Energien für die Elektronen und Löcher wieder.1 Wie können Elektron-Loch-Paare erzeugt werden? Es gibt dazu mehrere Möglichkeiten. Zum Beispiel können Photonen absorbiert werden und ein Paar erzeugen, wenn die Energie des Photons mindestens so groß wie die Energierlücke ist. Die Paarerzeugungsrate ist proportional zur Lichtintensität. Wenn zwei Elektroden als Metallschichten auf ein Plättchen des Kristalls gebracht werden und eine „Vorspannung“ angelegt wird, dann werden die Elektronen und Löcher zu den Elektroden gezogen. Der Stromfluss ist proportional zur Lichtintensität. Dieser Mechanismus ist verantwortlich für das Phänomen der lichtelektrischen Leitfähigkeit und für die Funktion von Photozellen. Elektron-Loch-Paare können auch durch hochenergetische Teilchen erzeugt werden. Wenn ein sich schnell bewegendes Teilchen – zum Beispiel ein Proton oder Pion mit einer Energie von 1
In vielen Büchern wird dieses Energiediagramm anders interpretiert. Die Energieskala bezieht sich dann nur auf Elektronen. Anstelle der Energie des Lochs betrachtet man die Energie, die ein Elektron haben würde, wenn es das Loch füllt. Diese Energie ist niedriger als die Energie des freien Elektrons, und zwar genau um den Betrag, den Sie in Abbildung 14.5 sehen. Bei dieser Interpretation der Energieskala ist die Energielücke die minimale Energie, die einem Elektron gegeben werden muss, um es aus seinem gebundenen Zustand in das Leitungsband anzuheben.
282
14 Halbleiter
einigen zehn oder hundert MeV – durch einen Kristall geht, reißt sein elektrisches Feld Elektronen aus ihren gebundenen Zuständen und erzeugt Elektron-Loch-Paare. Solche Ereignisse treten auf einem Millimeter Weg einige hunderttausendmal auf. Nach dem Durchgang des Teilchens können die Ladungsträger eingesammelt werden, was einen elektrischen Strompuls zur Folge hat. Dies ist der Vorgang, der sich in Halbleiterzählern abspielt, die bei Experimenten in der Kernphysik eingesetzt werden. Solche Zähler erfordern nicht unbedingt Halbleiter, sie können auch aus kristallinen Nichtleitern hergestellt werden. Tatsächlich wurde der erste solche Zähler unter Verwendung eines Diamantkristalls gebaut, der bei Raumtemperatur ein Nichtleiter ist. Es bedarf sehr reiner Kristalle, wenn sich die Löcher und Elektronen, ohne eingefangen zu werden, frei bis zu den Elektroden bewegen sollen. Die Halbleiter Silizium und Germanium werden deshalb benutzt, weil sie mit hoher Reinheit in akzeptablen Größen (Abmessungen von Zentimetern) hergestellt werden können. Bisher haben wir uns mit Halbleiterkristallen bei Temperaturen nahe dem absoluten Nullpunkt beschäftigt. Bei endlichen Temperaturen gibt es noch einen anderen Mechanismus, durch den Elektron-Loch-Paare entstehen können. Die Paar-Energie kann dann aus der thermischen Energie des Kristalls stammen. Die Wärmeschwingungen des Kristalls können ihre Energie auf ein Paar übertragen – und dabei deren „spontane“ Erzeugung verursachen. Die Wahrscheinlichkeit, dass sich in der Zeiteinheit eine Energie, die so groß ist wie die Energielücke ELücke , auf einen Atomplatz konzentriert, ist proportional zu e−ELücke /κT , wobei T die Temperatur und κ die Boltzmann-Konstante ist (siehe Band II, Kapitel 15).2 Nahe dem absoluten Nullpunkt gibt es dafür keine signifikante Wahrscheinlichkeit, aber mit steigender Temperatur gibt es eine wachsende Wahrscheinlichkeit für die Erzeugung solcher Paare. Bei jeder endlichen Temperatur sollte die Paarerzeugung mit konstanter Rate für immer weitergehen, wobei immer mehr positive und negative Ladungsträger entstehen. Natürlich geschieht dies nicht, weil sich nach einer Weile Elektronen und Löcher zufällig finden – das Elektron fällt in das Loch und die frei werdende Energie wird an das Gitter abgegeben. Wir sagen, dass sich Elektron und Loch „vernichten“. Es gibt eine gewisse Wahrscheinlichkeit pro Sekunde, dass ein Loch auf ein Elektron trifft und die beiden sich gegenseitig vernichten. Wenn die Anzahl der Elektronen pro Volumeneinheit Nn ist (n kennzeichnet negative Ladungsträger) und die der positiven Ladungsträger N p , dann ist die Wahrscheinlichkeit, dass sich in einer Zeiteinheit ein Elektron und ein Loch gegenseitig finden und vernichten, proportional zu dem Produkt Nn N p . Im Gleichgewicht muss diese Rate gleich der Paarerzeugungsrate sein. Sie sehen, dass im Gleichgewicht das Produkt von Nn und N p gegeben ist durch eine Konstante mal dem Boltzmann-Faktor: Nn N p = Konstante × e−ELücke /κT .
(14.4)
Wir sprechen zwar von einer Konstante, aber tatsächlich ist der Faktor nur nahezu konstant. Eine ausführlichere Theorie betrachtet die Details, wie sich Löcher und Elektronen gegenseitig „finden“, und zeigt, dass die „Konstante“ eine schwache Temperaturabhängigkeit hat; die wesentliche Temperaturabhängigkeit steckt aber im Boltzmann-Faktor. Betrachten wir als Beispiel einen reinen Stoff, der ursprünglich neutral ist. Bei einer endlichen Temperatur würden Sie erwarten, dass die Zahl der positiven und negativen Ladungsträger gleich ist, also Nn = N p . Dann sollten sich beide mit der Temperatur jeweils wie e−ELücke /2κT 2
Anmerkung des Übersetzers: Hier und im Folgenden wird für die Boltzmann-Konstante das Symbol κ (Kappa) verwendet, um sie von der Wellenzahl k zu unterscheiden.
14.2 Unreine Halbleiter
283
ändern. Die Änderung vieler Eigenschaften von Halbleitern – etwa der Leitfähigkeit – ist hauptsächlich durch den Boltzmann-Faktor bestimmt, da sich alle anderen Faktoren sehr viel langsamer mit der Temperatur ändern. Die Energielücke ist für Germanium etwa 0,72 eV und für Silizium 1,1 eV. Bei Raumtemperatur beträgt κT etwa 1/40 Elektronenvolt. Bei dieser Temperatur gibt es genügend Löcher und Elektronen, um eine signifikante Leitfähigkeit zu erreichen, während zum Beispiel bei 30 K – einem Zehntel der Raumtemperatur – die Leitfähigkeit verschwindend klein ist. Die Energielücke von Diamant beträgt 6 oder 7 eV, und Diamant ist bei Raumtemperatur ein guter Isolator.
14.2
Unreine Halbleiter
Bisher haben wir zwei Methoden erwähnt, wie zusätzliche Elektronen in ein ansonsten perfektes Kristallgitter gebracht werden können. Die eine Methode bestand darin, Elektronen aus einer äußeren Quelle zu injizieren. Bei der anderen wird ein gebundenes Elektron von einem neutralen Atom abgezogen, wobei gleichzeitig ein Elektron und ein Loch erzeugt werden. Es gibt jedoch noch eine weitere Möglichkeit, um Elektronen in das Leitungsband eines Kristalls zu bringen. Stellen wir uns einen Germaniumkristall vor, in dem ein Germaniumatom durch ein Arsenatom ersetzt worden ist. Die Germaniumatome sind vierwertig, und die Kristallstruktur ist durch die vier Valenzelektronen bestimmt. Arsen dagegen ist fünfwertig. Es stellt sich heraus, dass ein einzelnes Arsenatom in einem Germaniumgitter sitzen kann (weil es ungefähr die richtige Größe hat), wobei es sich aber wie ein vierwertiges Atom verhalten muss. Vier seiner Valenzelektronen werden benutzt, um die Kristallbindungen einzugehen, und ein Elektron bleibt übrig. Dieses zusätzliche Elektron ist sehr schwach gebunden – seine Bindungsenergie beträgt weniger als 1/100 Elektronenvolt. Bei Raumtemperatur kann das Elektron diese Energie leicht aus der Wärmeenergie des Kristalls aufnehmen und dann auf eigene Faust losziehen – es bewegt sich dann durch den Kristall wie ein freies Elektron. Ein Fremdatom wie das Arsenatom wird Donator genannt, weil es einen negativen Ladungsträger an den Kristall abgeben kann. Wenn ein Germaniumkristall aus einer Schmelze gezogen wird, zu der eine sehr kleine Menge Arsen hinzugefügt wurde, sind die Arsen-Donatoren über den gesamten Kristall verteilt, und der Kristall hat eine gewisse Dichte eingebauter negativer Ladungsträger. Sie denken vielleicht, dass diese Ladungsträger hinweggefegt werden, sobald ein schwaches elektrisches Feld quer zum Kristall angelegt wird. Dies geschieht jedoch nicht, da die zurückgebliebenen Rümpfe der Arsenatome im Kristallkörper alle eine positive Ladung haben. Wenn der Kristallkörper neutral bleiben soll, dann muss die mittlere Dichte der negativen Leitungselektronen gleich der Dichte der Donatoren sein. Wenn Sie zwei Elektroden an die Enden eines solchen Kristalls legen und sie mit einer Batterie verbinden, wird zwar ein Strom fließen. Sobald aber die Leitungselektronen an einem Ende hinausgefegt werden, müssen neue Leitungselektronen von der Elektrode am anderen Ende zugeführt werden, sodass die mittlere Dichte der Leitungselektronen in etwa gleich der Dichte der Donatoren bleibt. Da die Donatoren positiv geladen sind, sind sie bestrebt, einige der Leitungselektronen einzufangen, wenn diese durch das Innere des Kristalls diffundieren. Ein Donator kann daher wie eine Falle wirken, ähnlich wie jene, die wir im letzten Abschnitt besprochen haben. Wenn aber die Einfangenergie hinreichend klein ist – wie beim Arsen –, wird die Zahl der Ladungsträger, die in einem Zeitintervall eingefangen werden, klein im Verhältnis zu ihrer Gesamtzahl sein.
284
14 Halbleiter
Für ein vollständiges Verständnis des Verhaltens von Halbleitern muss man natürlich dieses Einfangen berücksichtigen. Im weiteren Verlauf unserer Diskussion wollen wir jedoch annehmen, dass die Einfangenergie hinreichend klein und die Temperatur hinreichend hoch ist, sodass alle Donatoren ihre überschüssigen Elektronen abgegeben haben. Das ist natürlich nur eine Näherung. Es ist auch möglich, in einen Germaniumkristall einige Fremdatome einzubauen, die dreiwertig sind, etwa Aluminium. Das Aluminiumatom versucht, sich wie ein vierwertiges Objekt zu verhalten, indem es sich ein zusätzliches Elektron stiehlt. Es kann ein Elektron von einem benachbarten Germaniumatom stehlen und als negativ geladenes Atom verbleiben, mit einer effektiven Wertigkeit von vier. Wenn es ein Elektron von einem Germaniumatom stiehlt, hinterlässt es natürlich dort ein Loch; und dieses Loch kann im Kristall herumwandern wie ein positiver Ladungsträger. Ein Fremdatom, das auf diese Art ein Loch erzeugen kann, heißt Akzeptor, weil es ein Elektron „akzeptiert“. Wenn ein Germanium- oder Siliziumkristall aus einer Schmelze gezogen wird, die mit einer geringen Menge von Aluminium verunreinigt wurde, dann sind in den Kristall mit einer gewisse Dichte Löcher eingebaut, die sich wie positive Ladungsträger verhalten können. Wenn zu einem Halbleiter eine Donator- oder Akzeptorverunreinigung hinzugefügt wurde, sagt man, das Material wurde „dotiert“. Wenn sich ein Germaniumkristall mit eingebauten Donatorfremdatomen auf Raumtemperatur befindet, werden sowohl Leitungselektronen durch die thermisch angeregte Erzeugung von Elektron-Loch-Paaren beigesteuert als auch durch die Donatoren. Die Elektronen aus beiden Quellen sind natürlich gleichwertig, und es ist die Gesamtzahl Nn , die bei den zum Gleichgewicht führenden statistischen Prozessen zählt. Wenn die Temperatur nicht zu niedrig ist, ist die Zahl der negativen Ladungsträger, die durch die Donator-Fremdatome beigesteuert werden, etwa gleich der Zahl der vorhandenen Fremdatome. Im Gleichgewicht muss Gleichung (14.4) noch Gültigkeit haben; bei einer gegebenen Temperatur liegt das Produkt Nn N p fest. Dies bedeutet, dass sich durch Hinzufügen einiger Donator-Fremdatome (wodurch Nn wächst) die Anzahl N p der positiven Ladungsträger gerade um so viel verringern muss, dass Nn N p unverändert bleibt. Wenn die Konzentration der Fremdatome hoch genug ist, ist die Anzahl Nn der negativen Ladungsträger durch die Zahl der Donatoren bestimmt und fast unabhängig von der Temperatur – alle Änderungen im Exponentialfaktor werden durch die Änderung von N p ausgeglichen, obwohl diese Zahl viel kleiner als Nn ist. Ein ansonsten reiner Kristall mit einer geringen Konzentration von Donator-Fremdatomen wird deshalb überwiegend negative Ladungsträger haben. Ein solches Material wird Halbleiter vom „n-Typ“ genannt. Wenn Fremdatome vom Akzeptortyp zu einem Kristallgitter hinzugefügt werden, werden einige Löcher herumwandern und einige der freien Elektronen, die durch die Wärmebewegung erzeugt worden sind, vernichten. Dieser Prozess wird solange ablaufen, bis Gleichung (14.4) erfüllt ist. Unter Gleichgewichtsbedingungen wird die Zahl der positiven Ladungsträger anwachsen und die Zahl der negativen Ladungsträger abnehmen, wobei das Produkt konstant bleibt. Ein Stoff mit einem Überschuss an positiven Ladungsträgern heißt Halbleiter vom „p-Typ“. Wenn wir zwei Elektroden an einen Halbleiterkristall anlegen und sie mit einer Spannungsquelle verbinden, entsteht ein elektrisches Feld innerhalb des Kristalls. Das elektrische Feld versetzt die positiven und negativen Ladungsträger in Bewegung, und es fließt ein elektrischer Strom. Überlegen wir zuerst, was in einem Material vom n-Typ vor sich geht, in dem ein großer Überschuss an negativen Ladungsträgern vorliegt. Bei einem solchen Material können wir die
14.2 Unreine Halbleiter
285
Löcher vernachlässigen; sie werden sehr wenig zum Strom beitragen, weil sie so wenige sind. Durch einen idealen Kristall würden sich die Ladungsträger ungehindert bewegen. In einem realen Kristall – besonders in einem Kristall mit einigen Verunreinigungen – bewegen sich die Elektronen jedoch bei endlicher Temperatur nicht vollkommen frei. Sie sind fortwährend an Kollisionen beteiligt, wodurch sie aus ihren ursprünglichen Bahnen geworfen werden, das heißt, sie ändern ihren Impuls. Diese Kollisionen sind genau die Streuungen, über die wir im vorigen Kapitel gesprochen haben; sie treten an jeder Unregelmäßigkeit im Kristallgitter auf. In einem Material vom n-Typ sind die Hauptursachen der Streuung gerade die Donatoren, die die Ladungsträger erzeugen. Da die Leitungselektronen in der Nähe der Donatoren eine etwas andere Energie haben, werden die Wahrscheinlichkeitswellen von diesem Punkt gestreut. Sogar in einem vollkommen reinen Kristall gibt es (bei jeder endlichen Temperatur) infolge der Wärmeschwingungen Unregelmäßigkeiten im Gitter. Vom klassischen Standpunkt aus können wir sagen, dass die Atome nicht genau in einem regelmäßigen Gitter angeordnet sind, sondern in jedem Augenblick infolge ihrer Wärmeschwingungen etwas von ihrem regelmäßigen Gitterplatz entfernt sind. Die Energie E0 , die nach der in Kapitel 13 beschriebenen Theorie zu jedem Gitterpunkt gehört, ändert sich etwas von Ort zu Ort, sodass die Wellen der Wahrscheinlichkeitsamplitude nicht vollkommen durchgelassen werden, sondern auf unregelmäßige Art gestreut werden. Bei sehr hohen Temperaturen kann diese Streuung selbst bei sehr reinen Materialien bedeutsam werden, aber bei den meisten dotierten Materialien, die in elektronischen Bauelementen benutzt werden, tragen die Fremdatome das meiste zu dieser Streuung bei. Wir wollen nun die elektrische Leitfähigkeit eines solchen Materials abschätzen. Wenn man ein elektrisches Feld an einen Halbleiter vom n-Typ anlegt, wird jeder negative Ladungsträger in diesem Feld beschleunigt; er gewinnt solange an Geschwindigkeit, bis er an einem der Donatoren gestreut wird. Das bedeutet, dass die Ladungsträger, die sich gewöhnlich auf zufällige Art entsprechend ihrer thermischen Energie umherbewegen, eine mittlere Driftgeschwindigkeit entlang den Linien des elektrischen Feldes annehmen und einen Strom durch den Kristall entstehen lassen. Die Driftgeschwindigkeit ist im Allgemeinen recht klein im Vergleich zu den typischen thermischen Geschwindigkeiten. Deshalb können wir den Strom abschätzen, indem wir annehmen, dass die mittlere Zeit zwischen zwei Streuungen eine Konstante ist. Nehmen wir an, der negative Ladungsträger hat eine effektive elektrische Ladung qn . In einem elektrischen Feld E ist die auf den Ladungsträger wirkende Kraft qn E. In Abschnitt 18.3 von Band II haben wir die mittlere Driftgeschwindigkeit unter diesen Umständen berechnet und gesehen, dass sie durch Fτ/m gegeben ist, wobei F die Kraft auf die Ladung, τ die mittlere freie Zeitspanne zwischen zwei Zusammenstößen und m die Masse ist. Wir sollten für die Masse m die effektive Masse, die wir im vorigen Kapitel berechnet haben, benutzen. Da wir nur eine Überschlagsrechnung machen wollen, nehmen wir an, dass die effektive Masse in allen Richtungen gleich ist. Wir bezeichnen diese Masse mit mn . Mit dieser Näherung wird die mittlere Driftgeschwindigkeit uDrift =
qn Eτn . mn
(14.5)
Bei Kenntnis der Driftgeschwindigkeit können wir den Strom angeben. Die elektrische Stromdichte j ist die Anzahl Nn der Ladungsträger pro Volumeneinheit multipliziert mit der mittleren Driftgeschwindigkeit und der Ladung jedes Ladungsträgers. Die Stromdichte ist daher j = Nn uDrift qn =
Nn q2n τn E. mn
(14.6)
286
14 Halbleiter
Wir sehen, dass die Stromdichte proportional zum elektrischen Feld ist. Ein Halbleitermaterial genügt also dem ohmschen Gesetz. Der Proportionalitätsfaktor zwischen j und E, die Leitfähigkeit σ, ist σ=
Nn q2n τn . mn
(14.7)
Bei einem Material vom n-Typ ist die Leitfähigkeit relativ unabhängig von der Temperatur. Erstens ist die Anzahl der vorherrschenden Ladungsträger Nn vor allem durch die Dichte der Donatoren im Kristall bestimmt (solange die Temperatur nicht so niedrig ist, dass zu viele der Ladungsträger eingefangen werden). Zweitens wird die Zeitspanne zwischen zwei Stößen τn hauptsächlich durch die Dichte der Fremdatome bestimmt, die natürlich unabhängig von der Temperatur ist. Wir können dieselben Argumente auf ein Material vom p-Typ anwenden, indem wir nur die Werte der in (14.7) enthaltenen Parameter ändern. Wenn zu einer bestimmten Zeit etwa gleich viele negative und positive Ladungsträger vorliegen, müssen wir die Beiträge beider Ladungsträgerarten addieren. Die Gesamtleitfähigkeit ist dann gegeben durch σ=
2 Nn q2n τn N p q p τ p + . mn mp
(14.8)
Bei einem sehr reinen Material werden N p und Nn fast gleich sein. Sie sind kleiner als in einem dotierten Material, sodass die Leitfähigkeit geringer ist. Auch werden sie sich stark mit der Temperatur ändern (wie e−ELücke /2κT , wie wir gesehen haben), sodass sich die Leitfähigkeit äußerst stark mit der Temperatur ändern kann.
14.3
Der Hall-Effekt
Es ist sicherlich eine sonderbare Vorstellung, dass es in einer Substanz, in der die einzigen relativ freien Objekte Elektronen sind, einen elektrischen Strom geben soll, der durch Löcher getragen wird, die sich wie positive Teilchen verhalten. Wir möchten daher einen Versuch beschreiben, der recht deutlich zeigt, dass in diesem Fall das Vorzeichen des Trägers des elektrischen Stromes ganz bestimmt positiv ist. Wir betrachten einen Block aus einem halbleitenden Material – es könnte auch ein Metall sein –, und wir legen ein elektrisches Feld an, sodass ein Strom in eine bestimmte Richtung fließt, sagen wir in die horizontale Richtung (siehe Abbildung 14.6). Weiterhin nehmen wir an, dass ein magnetisches Feld an den Block angelegt ist, welches rechtwinklig zum Strom verläuft, sagen wir in die Zeichenebene der Abbildung hinein. Die sich bewegenden Ladungsträger werden eine magnetische Kraft q(u× B) spüren. Und da die mittlere Driftgeschwindigkeit entweder nach rechts oder links weist – was vom Vorzeichen der Ladungsträger abhängt – wird die mittlere magnetische Kraft auf die Ladungsträger entweder nach oben oder nach unten gerichtet sein. Nein, das ist nicht richtig! Bei den Richtungen, die wir für den Strom und das magnetische Feld angenommen haben, wird die magnetische Kraft auf die bewegten Ladungen immer nach oben gerichtet sein. Positive Ladungen, die sich in die Richtung von j (nach rechts) bewegen, werden eine Kraft nach oben spüren. Wenn der Strom aber von negativen Ladungen getragen wird, werden sie sich
14.3 Der Hall-Effekt
287 −
+ +(−)
I
B j
Abb. 14.6: Der Hall-Effekt kommt durch die magnetischen Kräfte auf die Ladungsträger zustande.
−(+)
nach links bewegen (wenn der Leitungsstrom dasselbe Vorzeichen hat), und sie werden ebenfalls eine Kraft nach oben spüren. Bei stationären Verhältnissen gibt es jedoch keine Aufwärtsbewegung der Ladungsträger, weil der Strom nur von links nach rechts fließen kann. Vielmehr fließen einige der Ladungen anfangs nach oben und erzeugen eine Oberflächenladungsdichte entlang der oberen Grenzfläche des Halbleiters – wobei eine Oberflächenladungsdichte vom gleichen Betrag und mit entgegengesetztem Vorzeichen an der unteren Grenzfläche des Kristalls zurückbleibt. Die Ladungen häufen sich an der oberen und an der unteren Grenzfläche, bis die elektrostatischen Kräfte, die sie auf die bewegten Ladungen ausüben, im Durchschnitt genau die magnetische Kraft aufheben, sodass der homogene Strom horizontal fließt. Die Ladungen an den beiden Grenzflächen erzeugen jedoch eine Potentialdifferenz in vertikaler Kristallrichtung, die mit einem hochohmigen Voltmeter gemessen werden kann (siehe Abbildung 14.7). Das Vorzeichen der vom Voltmeter registrierten Potentialdifferenz hängt nun vom Vorzeichen der für den Strom verantwortlichen Ladungsträger ab. Röhrenvoltmeter −
0
+
I
Abb. 14.7: Messung des Hall-Effekts.
Als man solche Experimente erstmals durchführte, nahm man an, dass das Vorzeichen der Potentialdifferenz negativ sein würde, wie man es für negative Leitungselektronen erwartet. Man war daher recht erstaunt, als man bei manchen Materialien das entgegengesetzte Vorzeichen der Potentialdifferenz fand. Es schien, als wäre der Stromträger ein Teilchen mit positiver Ladung. Aufgrund unserer Diskussion der dotierten Halbleiter ist es verständlich, dass ein Halbleiter vom n-Typ das Vorzeichen der Potentialdifferenz erzeugen sollte, das negativen Ladungsträgern eigen ist, während ein Halbleiter vom p-Typ die umgekehrte Potentialdifferenz liefern sollte, da der Strom durch die positiv geladenen Löcher getragen wird. Die ursprüngliche Entdeckung des anomalen Vorzeichens der Potentialdifferenz beim HallEffekt wurde in einem Metall gemacht und nicht in einem Halbleiter. Man hatte angenommen, dass in Metallen die Stromleitung immer durch Elektronen zustande kommt, doch wie sich herausstellte, hat die Potentialdifferenz bei Beryllium das falsche Vorzeichen. Man versteht jetzt, dass es sowohl in Metallen als auch in Halbleitern unter gewissen Umständen möglich ist,
288
14 Halbleiter
dass die für die Stromleitung verantwortlichen „Objekte“ Löcher sind. Obwohl es letzten Endes natürlich die Elektronen im Kristall sind, die die Bewegung ausführen, ist nichtsdestoweniger die Beziehung zwischen Impuls und Energie und die Reaktion auf äußere Felder genau so, wie man es für einen elektrischen Strom, der durch positive Teilchen getragen wird, erwarten würde. Wir wollen versuchen, den Betrag der Potentialdifferenz, die man beim Hall-Effekt erwartet, quantitativ abzuschätzen. Wenn das Voltmeter in Abbildung 14.7 einen vernachlässigbaren Strom aufnimmt, dann müssen sich die Ladungen im Halbleiter von links nach rechts bewegen, und die vertikale magnetische Kraft muss genau durch ein vertikales elektrisches Feld aufgehoben werden, das wir Etr nennen wollen („tr“ für transversal). Wenn dieses elektrische Feld die magnetische Kraft aufheben soll, muss gelten Etr = − uDrift × B .
(14.9)
Mit der durch (14.6) gegebenen Beziehung zwischen der Driftgeschwindigkeit und der elektrischen Stromdichte erhalten wir Etr = −
1 jB . qN
Die Potentialdifferenz zwischen der oberen und der unteren Grenzfläche des Kristalls ist natürlich gleich der elektrischen Feldstärke multipliziert mit der Höhe des Kristalls. Die elektrische Feldstärke Etr im Kristall ist proportional zur Stromdichte und zur magnetischen Feldstärke. Die Proportionalitätskonstante 1/qN wird Hall-Konstante genannt und gewöhnlich mit dem Symbol RH abgekürzt. Die Hall-Konstante hängt nur von der Ladungsträgerdichte ab – vorausgesetzt, dass die Ladungsträger eines bestimmten Vorzeichens klar dominieren. Die Messung des Hall-Effekts ist daher eine geeignete Methode zur experimentellen Bestimmung der Ladungsträgerdichte in einem Halbleiter.
14.4
Halbleiter-Übergänge
Wir möchten jetzt besprechen, was geschieht, wenn wir zwei Germanium- oder Siliziumstücke mit unterschiedlichen inneren Eigenschaften (verschiedenen Dotierungsarten oder Dotierungsmengen) zusammenfügen, um einen „Übergang“ herzustellen. Beginnen wir mit dem so genannten p-n-Übergang, bei dem wir auf der einen Seite der Grenzschicht Germanium vom p-Typ und auf der anderen Seite Germanium vom n-Typ verwenden (siehe Abbildung 14.8).
Material vom p-Typ
Material vom n-Typ
Abb. 14.8: Ein p-n-Übergang.
In der Praxis ist es nicht möglich, zwei Kristallstücke zusammenzufügen und sie in vollständigen Kontakt im atomaren Maßstab zu halten. Stattdessen stellt man Übergänge aus einem einzigen Kristall her, der in zwei separaten Bereichen modifiziert worden ist. Eine Methode besteht darin, eine geeignete Dotierungsverunreinigung erst dann zur „Schmelze“ hinzuzufügen,
14.4 Halbleiter-Übergänge
(a)
p-Typ
289
n-Typ
V (b)
x
Np
N Nn
(c) x
Abb. 14.9: Elektrisches Potential und Ladungsträgerdichten in einem Halbleiter-Übergang ohne Vorspannung.
wenn schon die Hälfte des Kristalls gewachsen ist. Eine andere Methode besteht darin, ein wenig von dem Verunreinigungselement auf die Oberfläche zu streichen und dann den Kristall zu erhitzen, wodurch einige Fremdatome in den Kristall diffundieren. Auf diese Art hergestellte Übergänge haben zwar keine scharfe Begrenzung, doch es ist möglich, die Grenzschicht auf etwa 10−4 cm zu beschränken. Wir wollen hier von der idealen Situation ausgehen, dass die beiden Kristallgebiete mit verschiedenen Eigenschaften an einer scharfen Grenze zusammentreffen. Auf der n-leitenden Seite des p-n-Übergangs gibt es freie Elektronen, die sich umherbewegen können, sowie die ortsfesten Donatoren, die die elektrische Ladung der Elektronen ausgleichen. Auf der p-leitenden Seite gibt es freie Löcher, die sich umherbewegen, und eine gleiche Anzahl negativer Akzeptoren, die die positive Ladung ausgleichen. Tatsächlich beschreibt das die Situation, bevor wir die beiden Materialien in Kontakt bringen. Sobald sie miteinander verbunden sind, ändern sich die Verhältnisse in der Nähe der Kontaktfläche. Wenn die Elektronen aus dem n-leitenden Material an der Kontaktfläche ankommen, werden sie nicht reflektiert, wie es an einer freien Oberfläche geschehen würde, sondern sie können direkt in das p-leitende Material eindringen. Einige Elektronen des n-leitenden Materials werden daher bestrebt sein, hinüber in das p-leitende Material zu diffundieren, wo es weniger Elektronen gibt. Dies kann nicht für immer so weitergehen, weil der Verlust von Elektronen auf der n-Seite dort die positive Gesamtladung erhöht, bis sich schließlich eine elektrische Spannung einstellt, die die Diffusion der Elektronen in die p-Seite hemmt. Entsprechend können die positiven Ladungsträger des p-leitenden Materials zunächst durch die Übergangszone in das n-leitende Material diffundieren. Dadurch hinterlassen sie einen Überschuss an negativer Ladung. Im Gleichgewicht muss der gesamte Diffusionsstrom null sein. Dies wird von den elektrischen Feldern herbeigeführt, die so angeordnet sind, dass sie die positiven Ladungsträger zurück zum p-leitenden Material ziehen.
290
14 Halbleiter
Die zwei Diffusionsprozesse, die wir beschrieben haben, laufen gleichzeitig ab, und Sie werden bemerken, dass beide in die Richtung ablaufen, die das n-leitende Material im positiven und das p-leitende Material im negativen Sinne auflädt. Wegen der beschränkten Leitfähigkeit des Halbleitermaterials wird die Potentialänderung von der p-Seite zur n-Seite in einem relativ schmalen Bereich nahe der Grenzschicht auftreten. Der größte Teil jedes Materialblocks wird ein gleichförmiges Potential haben. Wir definieren die x-Achse senkrecht zur Grenzfläche. Dann wird sich das elektrische Potential mit x ändern, wie in Abbildung 14.9 (b) gezeigt. Wir haben in Teil (c) der Abbildung auch die zu erwartende Änderung der Dichte Nn der n-Ladungsträger und der Dichte N p der p-Ladungsträger gezeigt. In großer Entfernung von der Übergangszone sollten die Dichten N p und Nn der Ladungsträger genau die Gleichgewichtsdichten sein, die wir für die einzelnen Materialblöcke bei derselben Temperatur erwarten würden. (Wir haben die Abbildung für einen Übergang gezeichnet, bei dem das p-leitende Material höher dotiert ist als das n-leitende Material.) Wegen des Potentialgradienten am Übergang müssen die positiven Ladungsträger einen Potentialberg überwinden, um auf die n-leitende Seite zu gelangen. Dies bedeutet, dass es unter Gleichgewichtsbedingungen im n-leitenden Material weniger positive Ladungsträger gibt als im p-leitenden Material. Gemäß den Gesetzen der statistischen Mechanik erwarten wir, dass das Verhältnis der Ladungsträger vom p-Typ auf beiden Seiten durch die folgende Gleichung gegeben ist: N p (n-Seite) = e−q p V/κT . N p (p-Seite)
(14.10)
Das Produkt q p V im Zähler der Exponentialfunktion ist die Energie, die erforderlich ist, um eine Ladung q p durch eine Potentialdifferenz V zu befördern. Die entsprechende Gleichung für die Dichten der Ladungsträger vom n-Typ lautet: Nn (n-Seite) = e−qn V/κT . Nn (p-Seite)
(14.11)
Wenn wir die Gleichgewichtsdichten in beiden Materialien kennen, können wir die beiden obigen Gleichungen benutzen, um die Potentialdifferenz quer zur Übergangszone zu bestimmen. Damit (14.10) und (14.11) denselben Wert für die Potentialdifferenz V ergeben, muss das Produkt N p Nn für die p-Seite dasselbe sein wie für die n-Seite. (Beachten Sie, dass qn = −q p ist.) Wir haben jedoch zuvor gesehen, dass dieses Produkt nur von der Temperatur und der Abstandsenergie ELücke des Kristalls abhängt. Vorausgesetzt, beide Seiten des Kristalls befinden sich auf derselben Temperatur, dann sind die beiden Gleichungen mit demselben Wert der Potentialdifferenz vereinbar. Da es eine Potentialdifferenz von der einen Seite des Übergangs zur anderen gibt, sieht das ungefähr wie eine Batterie aus. Vielleicht erhalten wir ja einen elektrischen Strom, wenn wir die n-leitende Seite mit der p-leitenden Seite durch einen Draht verbinden. Das wäre schön, weil dann der Strom für immer fließen würde, ohne irgendwelches Material zu verbrauchen, und wir hätten eine unerschöpfliche Energiequelle. Das würde freilich das zweite Gesetz der Thermodynamik verletzen! Nein, es gibt keinen Strom, wenn Sie die p-Seite mit der n-Seite durch einen Draht verbinden. Der Grund dafür ist leicht zu erkennen. Stellen wir uns einen Draht vor, der aus einem undotierten Material hergestellt ist. Wenn wir diesen Draht mit der n-leitenden Seite verbinden, erhalten wir einen Übergang. Quer durch diesen Übergang wird es
14.4 Halbleiter-Übergänge
291
eine Potentialdifferenz geben. Nehmen wir an, dass sie genau halb so groß ist wie die Potentialdifferenz zwischen dem p-leitenden Material und dem n-leitenden Material. Wenn wir unseren undotierten Draht mit der p-leitenden Seite des Übergangs verbinden, dann gibt es an diesem Übergang auch eine Potentialdifferenz – wieder halb so groß wie die Potentialdifferenz quer zum p-n-Übergang. Durch die Folge der Übergänge gleichen sich die Potentialdifferenzen aus, sodass in dem Kreis kein Gesamtstrom fließt. Ganz gleich, welche Art von Draht Sie benutzen, um die beiden Seiten des n-p-Übergangs zu verbinden, Sie erzeugen immer zwei neue Übergänge, und solange sich alle Übergänge auf derselben Temperatur befinden, werden sich alle Potentialsprünge an den Übergängen gegeneinander aufheben, und es wird in dem Kreis kein Strom fließen. Wenn jedoch einige Übergänge auf anderen Temperaturen sind als die übrigen, dann stellt sich heraus, dass Ströme fließen werden. Einige der Übergänge werden durch diesen Strom erwärmt, und andere werden gekühlt, und die thermische Energie wird in elektrische Energie umgewandelt. Dieser Effekt ist verantwortlich für die Funktionsweise von Thermoelementen, die zur Messung von Temperaturen benutzt werden, sowie von thermoelektrischen Generatoren. Dieser Effekt wird auch bei Kühlboxen genutzt. Wenn wir die Potentialdifferenz zwischen den beiden Seiten eines p-n-Übergangs nicht messen können, wie können wir dann sicher sein, dass der in Abbildung 14.9 gezeigte Potentialgradient tatsächlich existiert? Eine Nachweismethode besteht darin, den Übergang mit Licht zu bestrahlen. Wenn die Photonen absorbiert werden, können sie ein Elektron-Loch-Paar erzeugen. In dem starken elektrischen Feld am Übergang (es ist gleich dem Anstieg der Potentialkurve von Abbildung 14.9) wird das Loch in das p-leitende Gebiet und das Elektron in das n-leitende Gebiet getrieben. Wenn die beiden Seiten des Übergangs jetzt durch einen äußeren Stromkreis verbunden werden, werden diese zusätzlichen Ladungen einen Strom erzeugen. Die Energie des Lichts wird am Übergang in elektrische Energie umgewandelt. Dieses Prinzip wird in Solarzellen ausgenutzt. Bei unserer Diskussion der Wirkungsweise eines Halbleiter-Übergangs haben wir angenommen, dass sich die Löcher und die Elektronen mehr oder weniger unabhängig verhalten – wenn man davon absieht, dass sie irgendwie in das richtige statistische Gleichgewicht kommen müssen. Bei der Beschreibung des Stroms, der durch das auf den Übergang treffende Licht erzeugt wird, haben wir angenommen, dass ein Elektron bzw. ein Loch, das in der Übergangszone erzeugt wird, in den Hauptkörper des Kristalls eindringt, bevor es durch einen Ladungsträger entgegengesetzter Polarität vernichtet wird. In der unmittelbaren Nachbarschaft der Grenzfläche, wo die Dichte der Ladungsträger ungefähr gleich ist, ist der Effekt der Elektron-LochVernichtung (oder, wie man häufig sagt, „Rekombination“) ein bedeutender Effekt, und er muss bei einer ausführlichen Untersuchung von Halbleiterübergängen durchaus berücksichtigt werden. Wir haben angenommen, dass ein Loch oder ein Elektron, das in der Übergangszone erzeugt wird, eine gute Chance hat, in den Hauptkörper des Kristalls einzudringen, bevor es rekombiniert. Die typische Zeit, die ein Elektron oder ein Loch braucht, um einen Partner entgegengesetzter Ladung zu finden und sich mit ihm zu rekombinieren, liegt bei typischen Halbleitermaterialien im Bereich von 10−3 bis 10−7 Sekunden. Diese Zeit ist viel länger als die mittlere freie Zeit τ zwischen zwei Zusammenstößen bzw. Streuungen im Kristall, die wir bei der Untersuchung der Leitfähigkeit angenommen haben. Bei einem typischen p-n-Übergang ist die Zeit, die ein in der Übergangszone gebildetes Elektron oder Loch braucht, um in den Hauptkörper des Kristalls geschwemmt zu werden, viel kürzer als die Rekombinationszeit. Die meisten Paare werden daher zu einem äußeren Strom beitragen.
292
14.5
14 Halbleiter
Gleichrichtung an einem Halbleiter-Übergang
Als nächstes wollen wir zeigen, wie es kommt, dass sich ein p-n-Übergang wie ein Gleichrichter verhalten kann. Wenn wir eine Spannung quer zur Übergangszone anlegen, wird ein großer Strom fließen, wenn die Spannung in der einen Richtung gepolt ist, während ein sehr kleiner Strom fließt, wenn sie in entgegengesetzter Richtung angelegt wird. Wenn eine Wechselspannung quer zum Übergang angelegt wird, fließt der resultierende Strom nur in eine Richtung – der Strom ist „gleichgerichtet“. Betrachten wir noch einmal, was im Gleichgewichtszustand geschieht, der durch die Diagramme der Abbildung 14.9 dargestellt ist. Im p-leitenden Material gibt es eine hohe Konzentration N p von positiven Ladungsträgern. Die Ladungsträger diffundieren, und pro Zeiteinheit nähert sich eine gewisse Anzahl von ihnen dem Übergang. Dieser Strom von positiven Ladungsträgern ist proportional zu N p . Die meisten von ihnen werden jedoch durch den hohen Potentialberg am Übergang zurückgeworfen und nur der Anteil e−qV/κT kommt hindurch. Es gibt einen zweiten Strom positiver Ladungsträger, der sich dem Übergang von der anderen Seite her nähert. Dieser Strom ist proportional zur Dichte der positiven Ladungsträger im n-leitenden Gebiet, jedoch ist hier die Dichte der Ladungsträger viel geringer als auf der p-leitenden Seite. Wenn sich die positiven Ladungsträger dem Übergang von der n-leitenden Seite her nähern, finden sie einen Berg mit negativem Gefälle vor und gleiten sofort hinab zur p-leitenden Seite des Übergangs. Wir bezeichnen diesen Strom mit I0 . Im Gleichgewicht sind die Ströme aus beiden Richtungen gleich. Wir erwarten dann, dass die folgende Beziehung gilt: I0 ∼ N p (n-Seite) = N p (p-Seite)e−qV/κT .
(14.12)
Sie werden bemerken, dass dies dieselbe Gleichung ist wie (14.10). Wir haben sie nur auf andere Art hergeleitet. Nehmen wir nun jedoch an, dass wir das Potential auf der n-Seite des Übergangs um einen Betrag ΔV erniedrigen – was wir bewerkstelligen können, indem wir eine äußere Potentialdifferenz an den Übergang anlegen. Dann ist die Potentialdifferenz quer zum Übergang nicht mehr V, sondern V − ΔV. Der Strom positiver Ladungsträger von der p-Seite zur n-Seite wird jetzt diese geringere Potentialdifferenz in seinem Exponentialfaktor haben. Wenn wir diesen Strom mit I1 bezeichnen, erhalten wir I1 ∼ N p (p-Seite)e−q(V−ΔV)/κT . Dieser Strom ist um den Faktor eqΔV/κT größer als I0 , d. h., die Beziehung zwischen I1 und I0 ist I1 = I0 e+qΔV/κT .
(14.13)
Der Strom von der p-Seite wächst exponentiell mit der von außen angelegten Spannung ΔV. Der Strom positiver Ladungsträger von der n-Seite bleibt jedoch konstant, solange ΔV nicht zu groß ist. Wenn sich die positiven Ladungsträger dem Übergang nähern, werden sie noch immer ein abfallendes Potential vorfinden und auf die p-Seite hinabfallen. (Wenn ΔV größer als die natürliche Potentialdifferenz V ist, ändern sich natürlich die Verhältnisse, doch den Fall so hoher Spannungen betrachten wir nicht.) Der Gesamtstrom I von positiven Ladungsträgern, der durch den Übergang fließt, ist die Differenz zwischen den Strömen von beiden Seiten: I = I0 (e+qΔV/κT − 1) .
(14.14)
14.5 Gleichrichtung an einem Halbleiter-Übergang
293
I/I0 6 5 4 3 2 1 | −4
| −3
| −2
| −1
0
qΔV/κT | | 1 2
−1 −2
Abb. 14.10: Der Strom durch einen Übergang als Funktion der anliegenden Spannung.
Der Gesamtstrom I der Löcher fließt in den n-leitenden Bereich. Dort diffundieren die Löcher in den Körper des n-Gebietes, wo sie schließlich von der Überzahl an Ladungsträgern vom nTyp – den Elektronen – vernichtet werden. Die Elektronen, die bei dieser Vernichtung verloren gehen, werden durch einen Elektronenstrom aus dem äußeren Kontakt des n-leitenden Materials ausgeglichen. Wenn ΔV null ist, dann ist der Gesamtstrom in (14.14) null. Bei positivem ΔV wächst der Strom schnell mit der angelegten Spannung. Bei negativem ΔV wechselt der Strom das Vorzeichen. Der Exponentialausdruck wird aber bald vernachlässigbar, und der negative Strom übersteigt nie I0 – das bei unseren Annahmen ziemlich klein ist. Dieser Rückstrom I0 ist durch die geringe Dichte der Minderheits-Ladungsträger auf der n-Seite des Übergangs begrenzt. Wenn Sie dieselben Überlegungen für den Strom von negativen Ladungsträgern anstellen, der zuerst ohne Potentialdifferenz und dann mit einer kleinen von außen angelegten Potentialdifferenz ΔV durch den Übergang fließt, erhalten Sie wieder eine Gleichung wie (14.14) für den resultierenden Elektronenstrom. Da der Gesamtstrom die Summe der von den beiden Ladungsträgern beigesteuerten Ströme ist, gilt (14.14) auch für den Gesamtstrom, vorausgesetzt, wir bezeichnen mit I0 den maximalen Strom, der bei umgekehrter Spannung fließen kann. Die Strom-Spannungs-Charakteristik von (14.14) ist in Abbildung 14.10 skizziert. Sie zeigt das typische Verhalten von Festkörperdioden. Es sei erwähnt, dass (14.14) nur für kleine Spannungen gilt. Bei Spannungen, die mit der natürlichen Potentialdifferenz V vergleichbar oder größer als diese sind, kommen andere Effekte zum Tragen, und der Strom genügt nicht mehr der einfachen Gleichung. Sie erinnern sich vielleicht, dass wir die hier hergeleitete Gleichung (14.14) auch schon gefunden hatten, als wir in Kapitel 21 Gleichrichter“ – die Sperrklinke – behandelt hatten. Wir erhalten in den beiden Situationen dieselben Gleichungen, weil die grundlegenden physikalischen Prozesse analog sind.
294
14 Halbleiter
14.6
Der Transistor
Die vielleicht wichtigste Anwendung der Halbleiter ist der Transistor. Der Transistor besteht aus zwei dicht benachbarten Halbleiterübergängen. Seine Funktionsweise beruht zum Teil auf demselben Prinzip, das wir gerade für die Halbleiterdiode beschrieben haben – dem gleichrichtenden Übergang. Betrachten wir einen kleinen Germaniumkörper mit drei getrennten Gebieten, einem p-leitenden Gebiet, einem n-leitenden Gebiet und einem weiteren p-leitenden Gebiet (siehe Abbildung 14.11). Diese Anordnung heißt p-n-p-Transistor. Beide Übergänge des Transistors verhalten sich fast genauso, wie wir es im vorigen Abschnitt beschrieben haben. Insbesondere gibt es einen Potentialgradienten an jedem Übergang, und zwar jeweils mit einem gewissen Potentialgefälle vom n-leitenden Gebiet zu den p-leitenden Gebieten. Wenn die beiden p-leitenden Gebiete die gleichen Dotierungseigenschaften haben, ist die Potentialänderung beim Durchgang durch den Kristall so wie es die Kurve von Abbildung 14.11 zeigt. p
n
p
V
Abb. 14.11: Der Potentialverlauf in einem Transistor ohne anliegende Spannungen.
Nun stellen wir uns vor, dass wir jedes der drei Gebiete mit äußeren Spannungsquellen verbinden (siehe Abbildung 14.12, oben). Wir wollen alle Spannungen auf den Pol beziehen, der mit dem linken p-Gebiet verbunden ist. Dieser befindet sich daher definitionsgemäß auf dem Potential null. Diesen Pol nennen wir Emitter. Das n-leitende Gebiet wird Basis genannt und mit einem schwach negativen Potential verbunden. Das rechte p-leitende Gebiet heißt Kollektor und ist mit einem etwas größeren negativen Potential verbunden. Unter diesen Umständen verläuft die Potentialänderung quer zum Kristall wie in der Kurve von Abbildung 14.12. Wir wollen zuerst sehen, was mit den positiven Ladungsträgern geschieht, da es in erster Linie ihr Verhalten ist, das die Funktionsweise des p-n-p-Transistors bestimmt. Da der Emitter auf einem relativ höheren positiven Potential ist als die Basis, fließt ein Strom positiver Ladungsträger aus dem Emittergebiet in das Basisgebiet. Es handelt sich um einen relativ starken Strom, da ein Übergang vorliegt, der mit einer „Vorwärtsspannung“ arbeitet. Dies entspricht dem rechten Teil der Kurve in Abbildung 14.10. Unter diesen Bedingungen werden positive Ladungsträger bzw. Löcher vom p-leitenden Gebiet in das n-leitende Gebiet „emittiert“. Sie denken vielleicht, dass dieser Strom aus dem n-leitenden Gebiet durch den Basisanschluss b fließt. Nun kommt jedoch das Geheimnis des Transistors. Das n-leitende Gebiet gestaltet man sehr dünn – gewöhnlich nur 10−3 cm oder weniger, viel schmaler als die Querschnittsabmessung des Germaniumkörpers. Das bedeutet, dass die Löcher beim Eintritt in das n-leitende Gebiet eine sehr hohe Wahrscheinlichkeit haben, quer hindurch zur nächsten Übergangszone zu diffundieren, bevor sie von den Elektronen im n-leitenden Gebiet vernichtet werden können. Wenn sie an die rechte Grenze des n-leitenden Gebiets kommen, finden sie dort einen steilen
14.6 Der Transistor Ve = 0 e Ie
295 Vc Vb c Ic
Vb < 0 b Ib p
n
p
V Vb
Vc Abb. 14.12: Der Potentialverlauf in einem arbeitenden Transistor.
Potentialabhang vor und fallen sofort in das rechte p-leitende Gebiet. Diese Seite des Kristalls heißt Kollektor, weil sie die Löcher einsammelt, nachdem diese durch das n-leitende Gebiet diffundiert sind. In einem typischen Transistor wird nahezu der gesamte Löcherstrom, der den Emitter verlässt und in die Basis eintritt – bis auf einen Anteil von einem Prozent – im Kollektorgebiet gesammelt, und nur der kleine Rest trägt zum resultierenden Basisstrom bei. Die Summe von Basis- und Kollektorstrom ist natürlich gleich dem Emitterstrom. Nun stellen Sie sich vor, was geschieht, wenn wir das Potential Vb am Basispol etwas verändern. Da wir uns an einer relativ steilen Stelle der Kurve von Abbildung 14.10 befinden, wird eine kleine Änderung des Basispotentials Vb eine recht große Änderung des Emitterstroms Ie bewirken. Da die Kollektorspannung Vc viel stärker negativ ist als die Basisspannung, werden diese kleinen Änderungen des Basispotentials den steilen Potentialabhang zwischen Basis und Kollektor nicht nennenswert beeinflussen. Die meisten positiven Ladungsträger, die jetzt verstärkt in das n-Gebiet emittiert werden, werden noch immer vom Kollektor eingesammelt. Folglich wird es bei einer Änderung des Potentials der Basiselektrode eine entsprechende Änderung des Kollektorstroms Ic geben. Der wesentliche Punkt ist jedoch, dass der Basisstrom Ib immer nur gering ist gegenüber dem Kollektorstrom. Der Transistor ist also ein Verstärker: Ein kleiner Strom Ib , der in die Basiselektrode eingeführt wird, führt zu einem großen Strom – etwa 100-mal stärker – an der Kollektorelektrode. Was ist mit den Elektronen, den negativen Ladungsträgern, die wir bisher vernachlässigt haben? Zunächst einmal ist zu sagen, dass wir keinen nennenswerten Elektronenstrom zwischen Basis und Kollektor erwarten. Bei einer hohen negativen Spannung am Kollektor müssten die Elektronen in der Basis einen sehr hohen Potentialberg überwinden, und die Wahrscheinlichkeit dafür ist sehr klein. Es gibt nur einen sehr kleinen Elektronenstrom zum Kollektor. Andererseits können die Elektronen in der Basis in das Emittergebiet eindringen. Sie erwarten vielleicht, dass der Elektronenstrom in dieser Richtung mit dem Löcherstrom vom Emitter zur Basis vergleichbar ist. Ein solcher Elektronenstrom wäre nicht nützlich, sondern im Gegenteil schädlich, weil er den Gesamtbasisstrom erhöht, der für einen gegebenen Löcherstrom zum Kollektor erforderlich ist. Der Transistor wird daher so entworfen, dass der Elektronenstrom
296
14 Halbleiter
zum Emitter minimal wird. Der Elektronenstrom ist proportional zu Nn (Basis), der Dichte negativer Ladungsträger im Basismaterial, während der Löcherstrom vom Emitter abhängig ist von N p (Emitter), der Dichte positiver Ladungsträger im Emittergebiet. Wenn wir das n-leitende Material verhältnismäßig schwach dotieren, kann Nn (Basis) viel kleiner als N p (Emitter) gemacht werden. (Dazu trägt auch das sehr schmale Basisgebiet in hohem Maße bei, weil das durch den Kollektor bewirkte „Heraussaugen“ der Löcher den durchschnittlichen Löcherstrom vom Emitter zur Basis bedeutend steigert, ohne den Elektronenstrom zu beeinflussen.) Das Endergebnis ist, dass der Elektronenstrom durch den Basis-Emitter-Übergang sehr viel kleiner als der Löcherstrom gemacht werden kann, sodass die Elektronen keine bedeutende Rolle für die Wirkungsweise des p-n-p-Transistors spielen. Die Ströme werden durch die Bewegung der Löcher dominiert, und der Transistor arbeitet wie beschrieben als Verstärker. Es ist möglich, einen Transistor auch durch Vertauschung des p-leitenden und des n-leitenden Materials in Abbildung 14.11 herzustellen. Das ergibt einen so genannten n-p-n-Transistor. Beim n-p-n-Transistor werden die Ströme hauptsächlich von Elektronen getragen, die vom Emitter zur Basis und von dort zum Kollektor fließen. Offensichtlich treffen alle Argumente, die wir für den p-n-p-Transistor angeführt haben, auch auf den n-p-n-Transistor zu, wenn die Potentiale der Elektroden mit entgegengesetzten Vorzeichen gewählt werden.
15
Die Näherung unabhängiger Teilchen
15.1
Spinwellen
In Kapitel 13 haben wir dargelegt, wie Elektronen oder andere „Teilchen“, etwa atomare Anregungen, durch ein Kristallgitter propagieren. Diese Theorie haben wir im vorangegangenen Kapitel auf Halbleiter angewendet. Doch als wir Prozesse betrachtet haben, an denen viele Elektronen beteiligt sind, haben wir die eventuell zwischen ihnen auftretenden Wechselwirkungen vernachlässigt und deshalb natürlich nur Näherungen erhalten. Auch in diesem Kapitel wollen wir die Wechselwirkung zwischen den Elektronen außer Acht lassen. Wir wollen die Gelegenheit nutzen, um Ihnen einige weitere Anwendungen der Theorie der Propagation von Teilchen zu zeigen. Da wir nach wie vor die Wechselwirkungen zwischen den Teilchen vernachlässigen wollen, gibt es in diesem Kapitel sehr wenig wirklich Neues, abgesehen von den neuen Anwendungsbeispielen. Das erste Beispiel, das wir betrachten werden, ist jedoch so beschaffen, dass es möglich ist, die richtigen Gleichungen exakt niederzuschreiben, auch wenn mehr als ein „Teilchen“ beteiligt ist. Davon ausgehend, werden wir erkennen, wohin die Näherung der Vernachlässigung von Wechselwirkungen führt. Wir wollen das Problem jedoch nicht sehr eingehend behandeln. Als erstes Beispiel betrachten wir eine „Spinwelle“ in einem ferromagnetischen Kristall. Die Theorie des Ferromagnetismus haben wir in Kapitel 7 von Band IV besprochen. Bei der Temperatur null sind alle Elektronenspins, die zum Magnetismus des Ferromagneten beitragen, parallel ausgerichtet. Es gibt eine Wechselwirkungsenergie zwischen den Spins, die dann am niedrigsten ist, wenn alle Spins „down“ sind. Bei jeder anderen Temperatur gibt es jedoch eine Wahrscheinlichkeit, dass einige der Spins umklappen. In Kapitel 7 von Band IV haben wir diese Wahrscheinlichkeit näherungsweise berechnet. Hier wollen wir die quantenmechanische Theorie beschreiben, damit Sie das Problem exakter lösen können. (Wir werden noch einige Idealisierungen vornehmen, indem wir annehmen, dass die Elektronen bei den Atomen lokalisiert sind und dass die Spins nur mit benachbarten Spins wechselwirken.) Wir betrachten ein Modell, in dem alle Elektronen eines Atoms, bis auf eins, paarweise mit entgegengesetzten Spins angeordnet sind, sodass der gesamte magnetische Effekt von einem Spin- 21 -Elektron pro Atom herrührt. Ferner nehmen wir an, dass sich diese Elektronen an den Atomplätzen im Gitter befinden. Das Modell entspricht ungefähr metallischem Nickel. Außerdem nehmen wir an, dass es eine Wechselwirkung zwischen den Spins von jeweils zwei benachbarten Elektronen gibt, die den Term E=− K σi · σ j (15.1) i, j
zur Energie des Systems liefert, wobei die σ’s die Spins bezeichnen und sich die Summierung über alle benachbarten Elektronenpaare erstreckt. Wir haben eine derartige Wechselwirkungs-
298
15 Die Näherung unabhängiger Teilchen
energie schon besprochen, als wir die Hyperfeinaufspaltung des Wasserstoffs betrachtet haben, deren Ursache die Wechselwirkung der magnetischen Momente von Elektron und Proton im Wasserstoffatom ist. Wir haben das damals ausgedrückt durch Aσe · σp . Für ein gegebenes Elektronenpaar, zum Beispiel die Elektronen bei Atom 4 und Atom 5, wäre nun der HamiltonOperator −Kσ4 ·σ5 . Wir erhalten einen Term für jedes Paar, und der Hamilton-Operator ist (wie Sie auch für klassische Energien erwarten würden) die Summe dieser Terme für jedes wechselwirkende Paar. Die Energie wird mit dem Faktor −K angegeben, sodass ein positives K dem Ferromagnetismus entspricht – das heißt, die niedrigste Energie ergibt sich, wenn benachbarte Spins parallel sind. In einem realen Kristall kann es weitere Terme geben, die Wechselwirkungen mit den übernächsten Nachbarn beschreiben, doch auf dieser Stufe brauchen wir solche Komplikationen nicht zu berücksichtigen. Mit dem Hamilton-Operator (15.1) haben wir im Rahmen unserer Näherung eine vollständige Beschreibung des Ferromagneten, und es sollten sich die Eigenschaften der Magnetisierung herleiten lassen. Wir sollten auch die aus der Magnetisierung herrührenden thermodynamischen Eigenschaften beschreiben können. Wenn wir alle Energieniveaus finden können, leiten sich die Eigenschaften des Kristalls bei der Temperatur T aus dem Prinzip ab, dass die Wahrscheinlichkeit, ein System in einem Zustand der Energie E zu finden, proportional zu e−E/κT ist. Dieses Problem wurde nie vollständig gelöst. Wir werden einige der Probleme an einem einfachen Beispiel aufzeigen, in dem alle Atome in einer Reihe – in einem eindimensionalen Gitter – angeordnet sind. Sie können die Überlegungen dann leicht auf drei Dimensionen erweitern. An jeder Atomstelle gibt es ein Elektron, das zwei mögliche Zustände haben kann, entweder Spin up oder Spin down, und das gesamte System wird durch die Angabe der einzelnen Spins beschrieben. Wir verwenden den Operator der Wechselwirkungsenergie als Hamilton-Operator des Systems. Wenn wir die Spinvektoren von (15.1) als Sigma-Operatoren – oder Sigma-Matrizen – interpretieren, schreiben wir für das lineare Gitter: A Hˆ = ˆn· σ − σ ˆ n+1 . (15.2) 2 n
In dieser Gleichung haben wir die Konstante als A/2 geschrieben, weil dann einige der späteren Gleichungen mit denen in Kapitel 13 übereinstimmen.
Welches ist nun der niedrigste Zustand dieses Systems? Der Zustand niedrigster Energie liegt dann vor, wenn alle Spins parallel sind – sagen wir, alle „up“.1 Wir können diesen Zustand als | . . . + + + + . . .� oder | gnd� für „Grund-“ oder niedrigsten Zustand schreiben. Es ist leicht, die Energie für diesen Zustand zu berechnen. Eine Methode besteht darin, dass man alle vektoriellen Sigmas durch σ ˆ x, σ ˆ y und σ ˆ z ausdrückt und sorgfältig berechnet, wie jeder Term des Hamilton-Operators auf den Grundzustand wirkt. Zum Schluss werden die Ergebnisse addiert. Wir können jedoch auch eine gute Abkürzung verwenden. Wir haben in Abschnitt 12.2 gesehen, dass σ ˆi · σ ˆ j mithilfe des Spinaustauschoperators folgendermaßen ausgedrückt werden kann: Spinaustausch σ ˆi· σ ˆ j = 2Pˆ i j −1 , (15.3) 1
Der Grundzustand ist hier in Wirklichkeit „entartet“; es gibt andere Zustände mit derselben Energie – zum Beispiel alle Spins „down“ oder alle in irgendeine andere Richtung. Schon ein schwaches äußeres Feld in z-Richtung wird all diesen Zuständen eine andere Energie geben, und der von uns gewählte Grundzustand wird der richtige sein.
15.1 Spinwellen
299
Spinaustausch wobei der Operator Pˆ i j die Spins des i-ten und des j-ten Elektrons austauscht. Mit dieser Substitution wird der Hamilton-Operator zu Spinaustausch (15.4) Hˆ = −A − 12 . Pˆ n,n+1 n
Es ist jetzt leicht auszurechnen, was mit verschiedenen Zuständen geschieht. Wenn zum Beispiel i und j beide up sind, dann bleibt beim Austausch der Spins alles unverändert. Wenn also Pˆ i j auf diesen Zustand angewendet wird, ergibt sich wieder derselbe Zustand, was einer Multiplikation mit +1 gleichkommt. Der Ausdruck (Pˆ i j − 12 ) wird zu 12 . (Von nun an wollen wir den beschreibenden oberen Index am Pˆ weglassen.) Im Grundzustand sind alle Spins up; wenn Sie daher ein spezielles Spinpaar vertauschen, erhalten Sie wieder den ursprünglichen Zustand. Der Grundzustand ist ein stationärer Zustand. Wenn Sie auf ihn den Hamilton-Operator anwenden, erhalten Sie wieder denselben Zustand, multipliziert mit einer Summe von Termen, −(A/2) für jedes Spinpaar. Das heißt, die Energie des Systems im Grundzustand ist −A/2 pro Atom.
Als Nächstes wollen wir die Energien von einigen der angeregten Zustände betrachten. Es wird günstig sein, sich bei der Angabe der Energien auf den Grundzustand zu beziehen, d. h. den Grundzustand als Energienullpunkt zu wählen. Wir können dies erreichen, indem wir die Energie A/2 zu jedem Term des Hamilton-Operators addieren. Das ändert nur das „ 12 “ in (15.4) in „1“ um. Unser neuer Hamilton-Operator ist Hˆ = −A (15.5) Pˆ n,n+1 − 1 . n
Mit diesem Hamilton-Operator ist die Energie des niedrigsten Zustandes null; der Spinaustauschoperator ist einer Multiplikation mit der Einheit gleichwertig (beim Grundzustand), die sich gegen die 1 in jedem Term aufhebt. Um nun andere Zustände als den Grundzustand zu beschreiben, benötigen wir ein geeignetes System von Basiszuständen. Eine bequeme Methode ist eine Gruppierung der Zustände, je nachdem, ob das erste Elektron den Spin down hat oder das zweite Elektron usw. Es gibt natürliche viele Zustände mit genau einem Spin down. Der down-Spin könnte bei Atom 4 oder bei Atom 5 oder bei Atom 6 oder . . . sein. Wir können tatsächlich einfach diese Zustände als unsere Basiszustände wählen. Wir könnten sie folgendermaßen schreiben: | 4 � , | 5 � , | 6 � , . . . Es wird jedoch später bequemer sein, das „besondere Atom“ – das mit dem Elektron mit Spin down – durch seine Koordinate x zu kennzeichnen. Das heißt, wir definieren den Zustand | x5 � als einen Zustand, bei dem alle Elektronen den Spin up haben, bis auf das eine Elektron beim Atom am Ort x5 , das den Spin down hat (siehe Abbildung 15.1). Allgemein ist | xn � der Zustand mit einem einzigen down-Spin, der sich bei der Koordinate xn des n-ten Atoms befindet. b
−3 −2 −1
0
1
3
2
x5
4
5
6
7
Abb. 15.1: Der Basiszustand | x5 � einer linearen Anordnung der Spins. Alle Spins sind up, bis auf den einen bei x5 , der down ist.
300
15 Die Näherung unabhängiger Teilchen
Welche Wirkung hat der Hamilton-Operator (15.5) auf den Zustand | x5 �? Sagen wir, ein Term des Hamilton-Operators sei −A(Pˆ 7,8 − 1). Der Operator Pˆ 7,8 tauscht die zwei Spins der benachbarten Atome 7, 8 aus. Aber im Zustand | x5 � sind diese beiden Spins up und nichts geschieht; Pˆ 7,8 ist gleichbedeutend mit einer Multiplikation mit 1: Pˆ 7,8 | x5 � = | x5 � . Daraus folgt
Pˆ 7,8 − 1 | x5 � = 0 .
Folglich ergeben alle Terme des Hamilton-Operators null – bis auf jene natürlich, die das Atom 5 betreffen. Auf den Zustand | x5 � angewendet, tauscht Pˆ 4,5 den Spin von Atom 4 (up) und Atom 5 (down) aus. Es ergibt sich ein Zustand mit allen Spins up bis auf das Atom bei x4 . Das heißt Pˆ 4,5 | x5 � = | x4 � . Analog dazu ergibt sich Pˆ 5,6 | x5 � = | x6 � .
Daher sind die einzigen verbleibenden Terme des Hamilton-Operators −A(Pˆ 4,5 − 1) und −A(Pˆ 5,6 − 1). Auf | x5 � angewendet, liefern sie −A | x4 � + A | x5 � bzw. −A | x6 �+ A | x5 �. Das Ergebnis ist (15.6) Hˆ | x5 � = −A Pˆ n,n+1 − 1 | x5 � = −A{| x6 � + | x4 � − 2 | x5 �} . n
Wenn der Hamilton-Operator auf den Zustand | x5 � angewendet wird, ergibt er eine Amplitude, in den Zuständen | x4 � und | x6 � zu sein. Das bedeutet einfach, dass es eine gewisse Amplitude gibt, dass der down-Spin zum benachbarten Atom überspringt. Wenn wir mit einem Spin down beginnen, wird es daher wegen der Wechselwirkung zwischen den Spins eine Wahrscheinlichkeit geben, dass zu einer späteren Zeit ein anderer Spin stattdessen down ist. Angewendet auf den allgemeinen Zustand | xn �, ergibt der Hamilton-Operator Hˆ | xn � = −A {| xn+1 �+ | xn−1 � − 2 | xn �} .
(15.7)
Beachten Sie insbesondere, dass bei einem vollständigen System von Zuständen mit nur einem down-Spin die Zustände nur untereinander gemischt werden. Der Hamilton-Operator wird diese Zustände niemals mit Zuständen mischen, die mehr als ein down-Spins haben. Solange Sie nur Spins vertauschen, werden Sie niemals die Gesamtzahl der down-Spins ändern. Es wird bequem sein, die Matrixschreibweise für den Hamilton-Operator zu benutzen, sagen wir Hn,m ≡ � xn | Hˆ | xm �. In dieser Notation ist (15.7) gleichbedeutend mit Hn,n = 2A , Hn,n+1 = Hn,n−1 = −A , Hn,m = 0 ,
für |n − m| > 1 .
(15.8)
15.2 Zwei-Spin-Wellen
301
Welches sind jetzt die Energieniveaus für Zustände mit einem Spin down? Wie gewöhnlich sei Cn die Amplitude, dass ein Zustand | ψ � im Zustand | xn � ist. Wenn | ψ � ein Zustand mit bestimmter Energie sein soll, müssen alle Cn zeitlich auf dieselbe Art variieren, nämlich: Cn = an e−iEt/ .
(15.9)
Wir können diesen Lösungsansatz in unsere gewohnte Hamilton-Gleichung i
dCn = Hnm Cm dt m
(15.10)
einsetzen, wobei wir die Beziehungen (15.8) für die Matrixelemente benutzen. Wir erhalten eine unendliche Zahl von Gleichungen, die alle in der Form Ean = 2Aan − Aan−1 − Aan+1
(15.11)
geschrieben werden können. Wir haben wieder genau dasselbe Problem, mit dem wir uns bereits in Kapitel 13 beschäftigt haben, nur dass dort, wo E0 stand, jetzt 2A steht. Die Lösungen entsprechen den Amplituden Cn (den Amplituden für Spin down), die sich im Gitter fortpflanzen mit einer Fortpflanzungskonstanten k und einer Energie E = 2A(1 − cos kb) ,
(15.12)
wobei b die Gitterkonstante ist. Die Lösungen mit bestimmter Energie entsprechen „Wellen“ des Spins down – die „Spinwellen“ genannt werden. Für jede Wellenlänge gibt es eine zugehörige Energie. Bei großen Wellenlängen (kleines k) variiert diese Energie mit k wie E = Ab2 k2 .
(15.13)
Genau wie vorher können wir ein lokalisiertes Wellenpaket betrachten (das jedoch nur große Wellenlängen enthält), das einem Elektron mit Spin down in einem Teil des Gitters entspricht. Dieser Spin down verhält sich wie ein „Teilchen“. Weil seine Energie durch (15.13) mit k verknüpft ist, hat das „Teilchen“ eine effektive Masse meff =
2 . 2Ab2
(15.14)
Diese „Teilchen“ werden auch „Magnonen“ genannt.
15.2
Zwei-Spin-Wellen
Nun möchten wir besprechen, was geschieht, wenn es zwei down-Spins gibt. Wieder wählen wir ein System von Basiszuständen aus. Wir wollen Zustände wählen, bei denen es down-Spins an zwei Atomplätzen gibt (siehe Abbildung 15.2). Wir können einen solchen Zustand durch Angabe der x-Koordinaten für die beiden Plätze mit down-Spins kennzeichnen. Der Zustand in der Abbildung wäre dann | x2 , x5 �. Ganz allgemein
302
−3 −2 −1
15 Die Näherung unabhängiger Teilchen
0
1
2
3
4
5
6
7
Abb. 15.2: Ein Zustand mit zwei down-Spins.
sind die Basiszustände | xn , xm � – ein zweifach unendliches System! In dieser Darstellung ist der Zustand | x4 , x9 � genau derselbe Zustand wie | x9 , x4 �, denn beide Ausdrücke besagen, dass es je einen down-Spin bei 4 und 9 gibt; die Reihenfolge ist egal. Außerdem hat ein Zustand wie | x4 , x4 � keine Bedeutung, denn so etwas gibt es nicht. Wir können einen beliebigen Zustand | ψ � beschreiben durch Angabe der Amplituden, in jedem der Basiszustände zu sein. Folglich bedeutet Cm,n = � xm , xn | ψ � jetzt die Amplitude für ein System im Zustand | ψ �, in einem Zustand zu sein, in dem sowohl das m-te als auch das n-te Atom einen down-Spin hat. Die jetzt auftretenden Schwierigkeiten sind nicht konzeptioneller Art – sie sind nur Komplikationen in der Buchführung. (Eine der Schwierigkeiten der Quantenmechanik ist diese Buchführung. Mit mehr und mehr down-Spins wird die Notation immer mühsamer, mit vielen Indizes, und die Gleichungen sehen immer sehr abschreckend aus; die Überlegungen müssen aber nicht unbedingt komplizierter sein als im einfachsten Fall.) Die Bewegungsgleichungen des Spinsystems sind die Differentialgleichungen für die Cn,m . Sie lauten i
dCm,n = Hmn,i jCi, j . dt i, j
(15.15)
Angenommen, wir möchten die stationären Zustände finden. Wie gewöhnlich sind dann die Ableitungen nach der Zeit E mal die Amplituden, und die Cm,n können durch die Koeffizienten am,n ersetzt werden. Als Nächstes müssen wir die Wirkung von H auf einen Zustand mit den down-Spins m und n sorgfältig berechnen. Es ist nicht schwer zu berechnen. Nehmen wir für einen Moment an, dass m und n weit genug voneinander entfernt sind, sodass wir uns nicht um die naheliegenden Schwierigkeiten zu kümmern brauchen. Die Austauschoperation verschiebt den down-Spin an der Stelle xn entweder zum Atom (n + 1) oder (n − 1), und es gibt daher eine Amplitude, dass der neue Zustand aus dem Basiszustand | xm , xn+1 � resultiert, sowie eine Amplitude, dass er aus dem Basiszustand | xm , xn−1 � resultiert. Es kann sich aber auch der andere Spin geändert haben; es gibt daher eine gewisse Amplitude, dass das neue Cm,n von Cm+1,n oder von Cm−1,n herrührt. Diese Effekte sollten alle gleich sein. Das Endergebnis der Hamilton-Gleichung für Cm,n ist Eam,n = −A(am+1,n + am−1,n + am,n+1 + am,n−1 ) + 4Aam,n .
(15.16)
Diese Gleichung ist nur in zwei Situationen falsch. Wenn m = n ist, gibt es überhaupt keine Gleichung, und wenn m = n ± 1 ist, dann fehlen zwei Terme in (15.16). Wir werden diese Ausnahmen unberücksichtigt lassen. Wir ignorieren einfach die Tatsache, dass einige wenige dieser Gleichungen leicht modifiziert sind. Schließlich nehmen wir ja an, dass der Kristall unendlich ausgedehnt ist und wir eine unendliche Zahl von Gleichungen haben; wenn wir einige davon nicht berücksichtigen, wird das nicht viel ausmachen. Für eine erste grobe Näherung wollen wir daher die wenigen modifizierten Gleichungen vergessen. Wir nehmen also an, dass (15.16) für alle m und n gilt, auch für nebeneinander liegende m und n. Dies ist der wesentliche Teil unserer Näherung.
15.2 Zwei-Spin-Wellen
303
Damit ist die Lösung nicht schwer zu finden. Wir erhalten sofort Cm,n = am,n e−iEt/
(15.17)
am,n = (konst.) eik1 xm eik2 xn ,
(15.18)
E = 4A − 2A cos k1 b − 2A cos k2 b .
(15.19)
mit wobei Überlegen wir kurz, was geschehen würde, wenn wir zwei unabhängige einzelne Spinwellen hätten (wie im vorigen Abschnitt), entsprechend k = k1 und k = k2 . Nach (15.12) hätten sie Energien von und
�(k1 ) = (2A − 2A cos k1 b) �(k2 ) = (2A − 2A cos k2 b) .
Beachten Sie, dass die Energie E in (15.19) einfach die Summe ist: E = � (k1 ) + � (k2 ) .
(15.20)
Mit anderen Worten, wir können unsere Lösungen folgendermaßen betrachten. Es gibt zwei „Teilchen“ – das heißt, zwei Spinwellen. Die eine hat einen Impuls, der durch k1 , und die andere einen, der durch k2 beschrieben ist, und die Energie des Systems ist die Summe der Energien der beiden Objekte. Die beiden Teilchen verhalten sich vollkommen unabhängig. Mehr ist da nicht zu tun. Natürlich haben wir einige Näherungen gemacht, aber wir möchten die Genauigkeit unserer Lösung an dieser Stelle nicht diskutieren. Es ist sicher eine vernünftige Annahme, dass in einem Kristall mit Milliarden von Atomen – und daher mit Milliarden von Termen in den HamiltonGleichungen – die Modifizierung von ein paar Termen keinen großen Fehler darstellt. Wenn wir so viele down-Spins hätten, dass es für sie eine nennenswerte Dichte gäbe, dann müssten wir uns sicherlich um die Korrekturen kümmern. (Es ist recht interessant, dass eine exakte Lösung angegeben werden kann, wenn es nur die beiden down-Spins gibt. Das Ergebnis ist nicht besonders wichtig. Aber es ist interessant, dass für diesen Fall die Gleichungen exakt lösbar sind. Die Lösung ist am,n = exp ikc (xm + xn ) sin(k |xm − xn |) (15.21) mit der Energie
E = 4A − 2A cos k1 b − 2A cos k2 b
und mit den Wellenzahlen kc und k, die mit k1 und k2 verknüpft sind durch k1 = kc − k ,
k2 = kc + k .
(15.22)
Diese Lösung schließt die „Wechselwirkung“ der beiden Spins ein. Sie beschreibt die Tatsache, dass es beim Zusammenkommen der Spins eine gewisse Wahrscheinlichkeit für Streuung gibt. Die Spins verhalten sich sehr ähnlich wie Teilchen mit einer Wechselwirkung. Die ausführliche Theorie ihrer Streuung geht aber über das hinaus, was wir hier besprechen wollen.)
304
15.3
15 Die Näherung unabhängiger Teilchen
Unabhängige Teilchen
Im vorigen Abschnitt haben wir mit (15.15) eine Hamilton-Gleichung für ein Zwei-TeilchenSystem aufgeschrieben. Unter Verwendung einer Näherung, die der Vernachlässigung jeglicher „Wechselwirkung“ der beiden Teilchen gleichkommt, haben wir dann die durch (15.17) und (15.18) beschriebenen stationären Zustände erhalten. Jeder dieser Zustände ist einfach das Produkt von zwei Ein-Teilchen-Zuständen. Die Lösung, die wir für am,n in (15.18) angegeben haben, ist jedoch in Wirklichkeit nicht befriedigend. Wir hatten betont, dass der Zustand | x9 , x4 � kein anderer Zustand als | x4 , x9 � ist – es kommt nicht auf die Reihenfolge von xm und xn an. Ganz allgemein darf sich der algebraische Ausdruck für die Amplitude Cm,n nicht ändern, wenn wir die Werte von xm und xn vertauschen, da dies den Zustand nicht verändert. In jedem Fall sollte er die Amplitude darstellen, einen down-Spin bei xm und einen bei xn zu finden. Beachten Sie aber, dass (15.18) nicht symmetrisch in xm und xn ist – da k1 und k2 im Allgemeinen verschieden sein können. Der Fehler liegt darin, dass wir nicht dafür gesorgt haben, dass unsere Lösung von Gleichung (15.15) diese Zusatzbedingung erfüllt. Glücklicherweise ist es leicht, das zu ergänzen. Beachten Sie zunächst, dass am,n = Keik2 xm eik1 xn
(15.23)
eine Lösung der Hamilton-Gleichung ist, die genauso gut wie (15.18) ist. Sie hat sogar dieselbe Energie, die wir für (15.18) erhalten hatten. Auch jede Linearkombination von (15.18) und (15.23) ist eine gute Lösung und hat die durch (15.19) gegebene Energie. Die Lösung, die wir hätten wählen sollen – wegen unserer Symmetrieforderung –, ist einfach die Summe von (15.18) und (15.23): am,n = K eik1 xm eik2 xn + eik2 xm eik1 xn .
(15.24)
Bei vorgegebenem k1 und k2 ist die Amplitude Cm,n jetzt unabhängig von der Reihenfolge von xm und xn . Unsere Interpretation der Lösung (15.24) durch die „Magnonen“ muss ebenfalls geändert werden. Wir können nicht mehr sagen, dass dies ein Teilchen mit der Wellenzahl k1 und ein zweites Teilchen mit der Wellenzahl k2 darstellt. Die Amplitude (15.24) stellt einen Zustand mit zwei Teilchen (Magnonen) dar. Der Zustand ist charakterisiert durch die beiden Wellenzahlen k1 und k2 . Unsere Lösung beschreibt einen zusammengesetzten Zustand aus einem Teilchen mit dem Impuls p1 = k1 und einem anderen Teilchen mit dem Impuls p2 = k2 . Wir können aber bei diesem Zustand nicht sagen, welches Teilchen welches ist. Diese Diskussion sollte Sie an Kapitel 4 und unsere Geschichte von den identischen Teilchen erinnern. Wir haben eben gezeigt, dass die Teilchen der Spinwellen – die Magnonen – sich wie identische Bose-Teilchen verhalten. Alle Amplituden müssen in den Koordinaten der beiden Teilchen symmetrisch sein – was dasselbe ist wie die Forderung, dass wir bei einer „Vertauschung der beiden Teilchen“ wieder dieselbe Amplitude mit demselben Vorzeichen erhalten. Aber Sie überlegen vielleicht, warum wir beschlossen haben, die beiden Terme in (15.24) zu addieren. Warum nicht subtrahieren? Bei einem Minuszeichen würde eine Vertauschung von xm und xn das Vorzeichen von am,n ändern, was aber nichts ausmacht. Aber ein Vertauschen von xm und xn ändert gar nichts – alle Elektronen des Kristalls sind genau da, wo sie vorher waren,
15.4 Das Benzolmolekül
305
sodass es also auch für das Vorzeichen der Amplitude keinen Grund gibt, sich zu ändern. Die Magnonen verhalten sich wie Bose-Teilchen.2 Diese Diskussion hat zwei Hauptziele verfolgt: Erstens wollten wir Ihnen etwas über Spinwellen erzählen und zweitens einen Zustand vorzuführen, dessen Amplitude ein Produkt von zwei Amplituden und dessen Energie die Summe der den beiden Amplituden entsprechenden Energien ist. Bei unabhängigen Teilchen ist die Amplitude immer das Produkt und die Energie die Summe. Sie können leicht einsehen, warum die Energie die Summe ist. Die Energie ist der Koeffizient von t in einem imaginären Exponentialausdruck – sie ist proportional zur Frequenz. Wenn zwei Objekte etwas tun, eins mit der Amplitude e−iE1 t/ und das andere mit der Amplitude e−iE2 t/ , und wenn die Amplitude, dass die beiden Resultate gemeinsam eintreten, das Produkt der Amplituden für jedes einzelne ist, dann gibt es eine einzige Frequenz in dem Produkt, die die Summe der beiden Frequenzen ist. Die dem Amplitudenprodukt entsprechende Energie ist somit die Summe der beiden Energien. Wir haben eine verwickelte Argumentation geführt, um etwas Einfaches zu sagen. Wenn Sie die Wechselwirkung zwischen den Teilchen nicht berücksichtigen, können Sie jedes Teilchen für sich betrachten. Die Teilchen können individuell in vielen verschiedenen Zuständen, die sie allein hätten, existieren, und jedes wird die Energie beitragen, die es hätte, wenn es allein wäre. Sie müssen jedoch bedenken, dass sie sich, wenn es identische Teilchen sind, in Abhängigkeit von dem Problem entweder wie Bose- oder wie Fermi-Teilchen verhalten. Zwei dem Kristall hinzugefügte zusätzliche Elektronen zum Beispiel müssen sich wie Fermi-Teilchen verhalten. Wenn die Plätze der beiden Elektronen vertauscht werden, muss die Amplitude das Vorzeichen ändern. In der (15.24) entsprechenden Gleichung müsste dann ein Minuszeichen zwischen den beiden rechten Termen stehen. Folglich können zwei Fermi-Teilchen nicht in genau demselben Zustand sein – mit gleichen Spins und gleichen k’s. Die Amplitude für diesen Zustand ist null.
15.4
Das Benzolmolekül
Obwohl die Quantenmechanik die Grundgesetze liefert, die die Molekülstrukturen bestimmen, können diese Gesetze nur auf die einfachsten Verbindungen exakt angewendet werden. Die Chemiker haben daher verschiedene Näherungsmethoden zur Berechnung einiger Eigenschaften der komplizierten Moleküle ausgearbeitet. Wir möchten Ihnen jetzt zeigen, wie die Näherung unabhängiger Teilchen in der organischen Chemie benutzt wird. Wir beginnen mit dem Benzolmolekül. In Kapitel 10 haben wir das Benzolmolekül von einem anderen Standpunkt aus diskutiert. Dort haben wir das Molekül näherungsweise als Zweizustandssystem behandelt, mit den zwei in Abbildung 15.3 gezeigten Basiszuständen. Es gibt einen Ring von sechs Kohlenstoffatomen, an die jeweils ein Wasserstoffatom gebunden ist. Bei dem gebräuchlichen Bild der Valenzbindungen ist es notwendig, abwechselnd Doppelbindungen und Einfachbindungen zwischen den Kohlenstoffatomen anzunehmen, wofür es im niedrigsten Energiezustand die beiden Möglichkeiten gibt, die in der Abbildung gezeigt sind. Es gibt noch andere, energetisch höhere Zustände. In 2
Im Allgemeinen können sich die Quasiteilchen von der Art, die wir hier besprechen, entweder wie Bose-Teilchen oder wie Fermi-Teilchen verhalten, und wie bei freien Teilchen sind die Teilchen mit ganzzahligem Spin Bosonen und jene mit halbzahligem Spin Fermionen. Das „Magnon“ steht für ein umgeklapptes Spin-up-Elektron. Die Änderung des Spins ist eins. Das Magnon hat einen ganzzahligen Spin und ist somit ein Boson.
306
15 Die Näherung unabhängiger Teilchen H
H C
|1�
H
C C
C C
C H
H
H
H C
C |2�
H
H
C
C C
C H
H
H Abb. 15.3: Die zwei Basiszustände für das Benzolmolekül, die in Kapitel 10 benutzt wurden.
Kapitel 10 haben wir einfach nur die zwei Zustände genommen und alles andere vernachlässigt. Wir haben herausgefunden, dass die Grundzustandsenergie des Moleküls nicht gleich der Energie von einem der Zustände in der Abbildung ist, sondern um einen Betrag niedriger, der zur Amplitude für einen Übergang von einem dieser Zustände in den anderen proportional ist. Jetzt werden wir das Molekül von einem ganz anderen Standpunkt aus betrachten, wobei wir eine andere Art von Näherung benutzen. Die zwei Standpunkte werden uns verschiedene Resultate liefern, doch wenn wir beide Näherungen verbessern, sollten sie zu einer gültigen Beschreibung des Benzols führen. Wenn wir uns jedoch nicht um eine Verbesserung bemühen, was normalerweise der Fall sein wird, dann sollten Sie nicht überrascht sein, wenn die beiden Beschreibungen nicht genau übereinstimmen. Wir werden zumindest zeigen, dass auch von dem neuen Standpunkt aus die niedrigste Energie des Benzolmoleküls niedriger als die der beiden Strukturen in Abbildung 15.3 ist. Wir möchten jetzt das folgende Bild benutzen. Wir stellen uns die sechs Kohlenstoffatome eines Benzolmoleküls nur durch Einfachbindungen verknüpft vor (siehe Abbildung 15.4). Wir haben sechs Elektronen entfernt – da jede Bindung für ein Elektronenpaar steht –, sodass wir ein sechsfach ionisiertes Benzolmolekül erhalten. Wir wollen jetzt überlegen, was geschieht, wenn wir die sechs Elektronen eins nach dem anderen zurückbringen, wobei wir uns vorstellen, dass jedes Elektron frei um den Ring laufen kann. Wir nehmen auch an, dass alle in Abbildung 15.4 gezeigten Bindungen abgesättigt sind und wir sie nicht weiter beachten müssen. H
H C
H
C
C 6+ C C H
H
C H
Abb. 15.4: Ein Benzolring, aus dem sechs Elektronen entfernt sind.
15.4 Das Benzolmolekül
307
H
H C
C
H
H
Abb. 15.5: Das Äthylenmolekül.
Was geschieht, wenn wir das erste Elektron zurück in das Molekülion bringen? Es könnte sich natürlich an irgendeinem der sechs Plätze auf dem Ring befinden, was sechs Basiszuständen entspricht. Es würde auch eine gewisse Amplitude A haben, von einem Platz zum nächsten zu gehen. Wenn wir die stationären Zustände untersuchen, gäbe es bestimmte mögliche Energieniveaus. Das gilt nur für ein Elektron. Als Nächstes fügen wir ein zweites Elektron hinzu. Und jetzt machen wir die verrückteste Näherung, die Sie sich denken können – das, was das eine Elektron tut, wird von dem, was das andere tut, nicht beeinflusst. Natürlich gibt es in Wirklichkeit eine Wechselwirkung; sie stoßen einander durch die Coulomb-Kraft ab, und wenn sie beide an demselben Platz sind, müssen sie eine Energie haben, die recht verschieden vom Zweifachen der Energie ist, die nur eines dort hätte. Sicherlich ist die Näherung unabhängiger Teilchen nicht gerechtfertigt, wenn es nur sechs Plätze gibt – besonders dann nicht, wenn wir sechs Elektronen hineinbringen wollen. Nichtsdestoweniger konnten die Chemiker viel lernen, indem sie diese Näherungsmethode durchführten. Bevor wir das Benzolmolekül ausführlich behandeln, wollen wir ein einfacheres Beispiel betrachten – das Äthylenmolekül, das aus nur zwei Kohlenstoffatomen mit zwei Wasserstoffatomen auf jeder Seite besteht (siehe Abbildung 15.5). Dieses Molekül hat eine „Extrabindung“, die zwei Elektronen zwischen den zwei Kohlenstoffatomen zur Folge hat. Nun entferne man eins dieser Elektronen – was erhalten wir? Wir können es als Zweizustandssystem ansehen – das verbleibende Elektron kann bei dem einen oder dem anderen Kohlenstoffatom sein. Die möglichen Energien für das einzelne Elektron sind entweder E0 − A oder E0 + A (siehe Abbildung 15.6). E E0 + A
E0
E0 − A
Abb. 15.6: Die möglichen Energieniveaus für ein „Extraelektron“ im Äthylenmolekül.
Nun füge man das zweite Elektron hinzu. Gut, bei zwei Elektronen können wir das erste in den niedrigeren und das zweite in den höheren Zustand bringen. Nicht ganz, wir haben etwas vergessen. Jeder Zustand existiert in Wirklichkeit doppelt. Wenn wir gesagt haben, es gäbe einen möglichen Zustand mit der Energie (E0 − A), dann gibt es in Wirklichkeit zwei. Zwei Elektronen können in denselben Zustand gehen, wenn das eine den Spin up und das andere den Spin down hat. (Mehr können aufgrund des Ausschließungsprinzips nicht hinein.) Es gibt daher
308
15 Die Näherung unabhängiger Teilchen
in Wirklichkeit zwei mögliche Zustände mit der Energie (E0 − A). Wir können ein Diagramm wie in Abbildung 15.7 zeichnen, das sowohl die Energieniveaus als auch ihre Besetzung angibt. Im Zustand niedrigster Energie sind beide Elektronen mit entgegengesetzten Spins im untersten Zustand. Die Energie der Extrabindung im Äthylenmolekül ist daher 2(E0 − A), wenn wir die Wechselwirkung zwischen den beiden Elektronen vernachlässigen. E
E0 + A
E0
E0 − A
Abb. 15.7: In der zusätzlichen Bindung des Äthylenmoleküls können zwei Elektronen (eins mit Spin up und eins mit Spin down) das niedrigste Energieniveau besetzen.
Kehren wir zum Benzol zurück. Jeder der beiden Zustände von Abbildung 15.3 hat drei Doppelbindungen. Jede dieser Doppelbindungen ist genau wie die Bindung im Äthylen und trägt 2(E0 − A) zur Energie bei, wenn E0 jetzt die Energie ist, um ein Elektron an einen Platz im Benzol zu bringen, und A die Amplitude für einen Sprung zum nächsten Platz. Daher sollte die Energie ungefähr 6(E0 − A) sein. Aber als wir früher das Benzol untersucht hatten, haben wir festgestellt, dass die Energie niedriger ist als die Energie der Struktur mit drei Extrabindungen. Wir wollen sehen, ob sich die Energie für Benzol auch von unserem neuen Standpunkt aus niedriger als drei Bindungen ergibt. Wir beginnen mit dem sechsfach ionisierten Benzolring und fügen das erste Elektron hinzu. Wir haben jetzt ein Sechszustandssystem. Ein solches System haben wir bisher noch nicht gelöst, aber wir wissen, was wir zu tun haben. Wir können sechs Gleichungen in den sechs Amplituden aufschreiben usw. Aber wir wollen etwas Arbeit sparen – indem wir uns klarmachen, dass wir das Problem schon gelöst haben, als wir das Problem eines Elektrons in einer unendlichen Reihe von Atomen behandelt haben. Natürlich ist das Benzol keine unendliche Reihe, es hat nur sechs kreisförmig angeordnete Atomplätze. Aber stellen Sie sich vor, dass wir den Kreis zu einer Geraden öffnen und die Atome längs der Geraden von 1 bis 6 numerieren. Bei einer unendlichen Reihe wäre der nächste Platz 7, aber wenn wir festlegen, dass dieser Platz identisch mit Nummer 1 ist, erhalten wir dieselbe Situation wie beim Benzolring. Mit anderen Worten, wir können die Lösung für eine unendliche Reihe verwenden mit der zusätzlichen Forderung, dass die Lösung periodisch sein muss mit einem sechs Atome langen Zyklus. Nach Kapitel 13 hat das Elektron auf einer Reihe Zustände mit definierter Energie, wenn die Amplitude an jedem Platz eikxn = eikbn ist. Für jedes k ist die Energie E = E0 − 2A cos kb .
(15.25)
Wir möchten jetzt aber nur solche Lösungen benutzen, die sich alle 6 Atome wiederholen. Behandeln wir zuerst den allgemeinen Fall eines Ringes aus N Atomen. Wenn die Lösung eine
15.4 Das Benzolmolekül
309
Periode von N Atomabständen haben soll, muss eikbN = 1 sein: kbN muss ein Vielfaches von 2π sein. Unsere Bedingung lautet also kbN = 2πs ,
(15.26)
wobei s eine beliebige ganze Zahl ist. Wir haben früher gesehen, dass es keinen Sinn hat, k-Werte außerhalb des Bereiches ±π/b zu nehmen. Das bedeutet, dass wir alle möglichen Zustände erhalten, wenn wir die Werte von s aus dem Bereich ±N/2 nehmen. Wir finden dann, dass es bei einem N-atomigen Ring N Zustände mit bestimmter Energie gibt3 , und dass sie Wellenzahlen k s haben, die gegeben sind durch ks =
2π s. Nb
(15.27)
Jeder Zustand hat die Energie (15.25). Wir erhalten ein Linienspektrum der möglichen Energieniveaus. Das Spektrum für Benzol (N = 6) ist in Abbildung 15.8 (b) gezeigt. (Die Zahlen in Klammern bezeichnen die Anzahl der verschiedenen Zustände gleicher Energie.) E s=3 s= − 2
2A
E0 + 2A s=2
(1)
E0 + A
(2)
E0
s= − 1
s=1 s=0
(a)
E0 − A
(2)
E0 − 2A
(1)
2π/6 (b)
Abb. 15.8: Die Energieniveaus in einem Ring mit sechs Elektronenplätzen (wie zum Beispiel beim Benzolring).
Es gibt eine hübsche Methode, sich die sechs Energieniveaus zu veranschaulichen, wie wir in Teil (a) der Abbildung gezeigt haben. Stellen Sie sich einen Kreis vor, dessen Mittelpunkt auf dem Niveau E0 liegt und dessen Radius 2A beträgt. Wir beginnen unten und teilen sechs gleiche Bögen ab (bei Winkeln von k s b = 2πs/N oder 2πs/6 für Benzol, vom untersten Punkt aus gemessen), dann sind die vertikalen Höhen der Punkte auf dem Kreis die Lösungen von Gleichung (15.25). Die sechs Punkte stellen die sechs möglichen Zustände dar. Das niedrigste Energieniveau liegt bei (E0 − 2A); es gibt zwei Zustände mit der Energie (E0 − A) usw.4 Dies sind die möglichen Zustände für ein Elektron. Wenn wir mehr als ein Elektron unterbringen müssen, können zwei – mit entgegengesetzten Spins – in jeden Zustand gehen. Beim Benzolmolekül müssen wir sechs Elektronen in diesen Zuständen unterbringen. Beim Grundzustand werden sie in die niedrigsten Energiezustände gehen – zwei bei s = 0, zwei 3 4
Sie denken vielleicht, dass es, wenn N eine gerade Zahl ist, N + 1 Zustände gibt. Das ist aber nicht so, weil S = ±N/2 denselben Zustand ergibt. Wenn es zwei Zustände (mit verschiedenen Amplitudenverteilungen) mit derselben Energie gibt, sagen wir, dass die beiden Zustände „entartet“ sind. Beachten Sie, dass vier Elektronen die Energie E0 − A haben können.
310
15 Die Näherung unabhängiger Teilchen
bei s = +1 und zwei bei s = −1. In der Näherung unabhängiger Teilchen ist die Energie des Grundzustandes EGrund = 2(E0 − 2A) + 4(E0 − A) = 6E0 − 8A .
(15.28)
Die Energie ist tatsächlich geringer als die der drei einzelnen Doppelbindungen, und zwar um den Betrag 2A. Durch den Vergleich der Energie des Benzols mit der Energie des Äthylens ist es möglich, A zu bestimmen. A ergibt sich zu 0,8 Elektronenvolt oder, in den Einheiten der Chemiker, 18 Kilokalorien pro Mol. Wir können diese Analyse zur Berechnung oder zum Verständnis anderer Eigenschaften des Benzols benutzen. Unter Verwendung von Abbildung 15.8 können wir zum Beispiel die Anregung des Benzols durch Licht diskutieren. Was würde geschehen, wenn wir versuchen, eins der Elektronen anzuregen? Es kann dann in einen leeren höheren Zustand übergehen. Die niedrigste Anregungsenergie entspricht einem Übergang vom höchsten gefüllten Niveau zum niedrigsten leeren Niveau. Das erfordert die Energie 2A. Benzol absorbiert Licht der Frequenz ν, wenn hν = 2A ist. Es gibt auch Absorption von Photonen mit der Energie 3A und 4A. Selbstverständlich ist das Absorptionsspektrum von Benzol gemessen worden und das Bild der Spektrallinien ist mehr oder weniger richtig, nur dass der niedrigste Übergang im ultravioletten Bereich auftritt. Um den Messwerten zu genügen, müsste man einen Wert von A zwischen 1,4 und 2,4 Elektronenvolt wählen. Das heißt, der numerische Wert von A ist zwei- bis dreimal so groß wie aus der chemischen Bindungsenergie vorhergesagt wird. Der Chemiker führt in solchen Situationen eine Analyse vieler ähnlicher Moleküle durch, aus der er einige empirische Regeln ableitet. Er lernt zum Beispiel: Zur Berechnung der Bindungsenergie nehme man einen bestimmten Wert von A, aber um das Absorptionsspektrum angenähert richtig zu erhalten, verwende man einen anderen Wert von A. Das hört sich für Sie vielleicht etwas absurd an. Vom Standpunkt des Physikers, der versucht, die Natur aus den Grundprinzipien heraus zu verstehen, ist es tatsächlich nicht sehr befriedigend. Aber die Problemstellung der Chemiker ist eine andere. Sie versuchen, vorausschauend zu ergründen, was mit Molekülen geschehen wird, die noch nicht synthetisiert wurden oder die noch nicht vollkommen verstanden sind. Was sie brauchen, sind Erfahrungsregeln; es ist dabei unerheblich, woher sie kommen. Sie wenden daher die Theorie auf eine ganz andere Art an als Physiker. Sie benutzen Gleichungen, die einen Schimmer Wahrheit enthalten, aber dann müssen sie die darin vorkommenden Konstanten ändern – und empirische Korrekturen vornehmen. Im Falle von Benzol liegt der Hauptgrund für die Abweichungen in unserer Annahme, dass die Elektronen unabhängig sind – die Theorie, von der wir ausgegangen sind, ist eigentlich nicht gerechtfertigt. Nichtsdestoweniger enthält sie einen Schimmer Wahrheit, weil die Ergebnisse in die richtige Richtung zu gehen scheinen. Mit solchen Gleichungen und einigen empirischen Regeln – und verschiedenen Ausnahmen – bahnt sich der Forscher in der organischen Chemie seinen Weg durch das Gestrüpp komplizierter Situationen, zu deren Studium er sich entschlossen hat. (Vergessen Sie nicht, dass Physiker nur deshalb von den Grundlagen ausgehend rechnen können, weil sie sich nur einfache Probleme aussuchen. Niemals lösen sie Probleme mit 42 oder auch nur mit 6 Elektronen. Nur das Wasserstoff- und das Heliumatom konnten sie bisher mit akzeptabler Genauigkeit berechnen.)
15.5 Weitere organische Verbindungen
15.5
311
Weitere organische Verbindungen
Wir wollen sehen, wie unsere Überlegungen benutzt werden können, um andere Moleküle zu untersuchen. Wir beginnen mit dem Molekül Butadien (1,3), das in Abbildung 15.9 in der üblichen Valenzbindungsdarstellung gezeichnet ist. H
C
C
C
C
H
H Abb. 15.9: Die Valenzbindungsdarstellung des Butadien-(1,3)-Moleküls.
H
Wir können dasselbe Spiel mit den zusätzlichen vier Elektronen wiederholen, die den beiden Doppelbindungen entsprechen. Wenn wir vier Elektronen entfernen, erhalten wir vier Kohlenstoffatome in einer Reihe. Sie wissen schon, wie eine Reihe zu behandeln ist. Sie sagen: „Oh nein, ich weiß nur, wie eine unendliche Reihe zu behandeln ist.“ Aber die Lösungen für die unendliche Reihe enthalten auch die Lösungen für eine endliche Reihe. Sei N die Anzahl der Atome in der Reihe und nummerieren wir sie von 1 bis N (siehe Abbildung 15.10).
−1
0
1
2
3
4
5 · · · N−1 N
N+1
Abb. 15.10: Eine Reihe von N Molekülen.
Wenn Sie die Gleichungen für die Amplitude bei Platz 1 hinschreiben, erhalten Sie keinen Term, der etwas von Platz 0 liefert. Analog dazu unterscheidet sich die Gleichung für Platz N von derjenigen, die wir für eine unendliche Reihe erhielten, weil nichts da ist, das etwas von Platz N + 1 lieferte. Nehmen Sie aber an, dass wir eine Lösung für die unendliche Reihe mit der folgenden Eigenschaft erhalten können: Die Amplitude für die Anwesenheit bei Atom 0 ist null und die Amplitude für die Anwesenheit bei Atom (N + 1) ist auch null. Dann ist das System der Gleichungen für alle Plätze von 1 bis N in der endlichen Reihe auch befriedigt. Sie denken vielleicht, es existiert keine solche Lösung für die unendliche Reihe, weil unsere Lösungen alle wie eikxn aussahen, was überall denselben absoluten Wert der Amplitude liefert. Sie werden sich aber erinnern, dass die Energie nur von dem absoluten Betrag von k abhängt, sodass eine zweite Lösung, die für dieselbe Energie genauso gerechtfertigt ist, e−ikxn ist. Und dasselbe gilt für jede Überlagerung dieser beiden Lösungen. Wenn wir sie voneinander subtrahieren, können wir die Lösung sin kxn erhalten, die der Forderung genügt, dass bei x = 0 die Amplitude null ist. Sie entspricht immer noch der Energie (E0 − 2A cos kb). Durch eine geeignete Wahl des Betrages von k können wir auch bei xN+1 die Amplitude zu null machen. Dies verlangt, dass (N + 1)kb ein Vielfaches von π ist oder anders ausgedrückt, dass kb =
π s (N + 1)
(15.29)
gilt, wobei s eine ganze Zahl zwischen 1 und N ist. (Wir verwenden nur positive Werte für k, weil jede Lösung sowohl +k als auch −k enthält; eine Änderung des Vorzeichens von k ergibt wieder denselben Zustand.) Beim Butadien-Molekül mit N = 4 gibt es daher vier Zustände mit kb = π/5 ,
2π/5 ,
3π/5 und 4π/5 .
(15.30)
312
15 Die Näherung unabhängiger Teilchen
Wir können diese Energieniveaus unter Verwendung eines Kreisdiagramms darstellen, das dem für Benzol ähnelt. Diesmal benutzen wir einen Halbkreis, der in fünf gleiche Teile geteilt ist (siehe Abbildung 15.11). Der unterste Punkt entspricht s = 0, was überhaupt keinen Zustand ergibt. Dasselbe gilt für den obersten Punkt, der s = N + 1 entspricht. Die übrigen vier Punkte liefern uns die vier erlaubten Energien. Es gibt vier stationäre Zustände, was wir auch erwarten, wenn wir von vier Basiszuständen ausgehen. In dem Kreisdiagramm betragen die Winkelintervalle π/5 oder 36 Grad. Die niedrigste Energie ergibt sich als (E0 − 1,618A). (Ah, welche Wunder die Mathematik bereithält: der goldene Schnitt5 liefert uns nach dieser Theorie den niedrigsten Energiezustand des Butadien-Moleküls!) Es
E0 + 1,618A
2A
E0 + 0,618A E0 E0 − 0,618A E0 − 1,618A
36◦
Abb. 15.11: Die Energieniveaus von Butadien.
Nun können wir die Energie des Butadien-Moleküls berechnen, wenn wir vier Elektronen hineinbringen. Mit den vier Elektronen füllen wir die niedrigsten beiden Niveaus auf, jedes mit zwei Elektronen mit entgegengesetzten Spins. Die Gesamtenergie ist E = 2(E0 − 1,618A) + 2(E0 − 0,618A) = 4(E0 − A) − 0,472A .
(15.31)
Dieses Ergebnis scheint vernünftig. Die Energie ist wieder ein wenig niedriger als für zwei einfache Doppelbindungen, doch ist die Bindung nicht so stark wie im Benzol. Jedenfalls ist dies die Methode, nach der Chemiker organische Moleküle analysieren. Der Chemiker kann nicht nur die Energien, sondern auch die Wahrscheinlichkeitsamplituden benutzen. Wenn er die Amplituden für jeden Zustand kennt und weiß, welche Zustände besetzt sind, kann er die Wahrscheinlichkeit dafür angeben, ein Elektron an einer bestimmten Stelle im Molekül zu finden. Jene Plätze, an denen sich die Elektronen am ehesten aufhalten, sind für chemische Anlagerungsreaktionen geeignet, die erfordern, dass ein Elektron mit einer anderen Gruppe von Atomen geteilt wird. Die anderen Plätze werden eher bei solchen Anlagerungsreaktionen eine Rolle spielen, die die Tendenz haben, ein zusätzliches Elektron an das System abzugeben. Solche Überlegungen geben uns auch einen Einblick in ein so kompliziertes Molekül wie Chlorophyll, von dem eine Variante in Abbildung 15.12 gezeigt ist. Beachten Sie, dass die Doppel5
Der goldene Schnitt ist das Verhältnis der Seiten eines Rechtecks, das in ein Quadrat und ein ähnliches Rechteck geteilt werden kann.
15.5 Weitere organische Verbindungen CH3
CH2
CH
313
H3 C
C 2 H5 N
N Mg N
N H3 C
CH2
C
CH2
COOCH3
COOC20 H39
C
O
Abb. 15.12: Ein Chlorophyllmolekül.
und Einfachbindungen, die wir mit dicken Strichen gezeichnet haben, einen langen geschlossenen Ring mit zwanzig Intervallen bilden. Die zusätzlichen Elektronen der Doppelbindungen können um diesen Ring herumlaufen. Wenn wir die Methode der unabhängigen Teilchen verwenden, erhalten wir ein ganzes System von Energieniveaus. Es gibt starke Absorptionslinien aufgrund der Übergänge zwischen diesen Niveaus, die im sichtbaren Bereich des Spektrums liegen und die diesem Molekül seine kräftige Farbe verleihen. Auf dieselbe Art können komplizierte Moleküle untersucht werden, etwa der Farbstoff Xanthophyll, der die Blätter rot färbt. Ein anderes Konzept betrifft ebenfalls die Anwendung dieser Theorie in der organischen Chemie. Es handelt sich um das wahrscheinlich erfolgreichste oder zumindest in gewissem Sinne um das genaueste Konzept. Es hängt mit der Frage zusammen, unter welchen Verhältnissen man eine besonders starke chemische Bindung erhält. Die Antwort auf diese Frage ist sehr interessant. Nehmen wir zuerst das Beispiel Benzol und betrachten wir die Folge von Ereignissen, die eintreten, wenn wir von dem sechsfach ionisierten Molekül ausgehen und immer mehr Elektronen hinzufügen. Wir würden dann an verschiedene Benzol-Ionen – negative oder positive – denken. Angenommen, wir tragen die Energie des Ions (bzw. des neutralen Moleküls) als Funktion der Elektronenanzahl auf. Wenn wir E0 = 0 setzen (da wir es nicht besser wissen), erhalten wir die in Abbildung 15.13 gezeigte Kurve. Bei den ersten beiden hinzugefügten Elektronen bildet die Funktion eine gerade Linie. Für jede folgende Gruppe von Elektronen nimmt die Steigung zu und es gibt einen Knick der Steigung zwischen den Elektronengruppen. Die Steigung ändert sich immer dann, wenn man einen Satz von Niveaus, die alle dieselbe Energie haben, aufgefüllt hat und man beim nächsten Elektron zum nächsthöheren Niveausystem übergehen muss. Die tatsächlichen Energien des Benzol-Ions weichen wegen der Wechselwirkung der Elektronen und wegen der elektrostatischen Energie, die wir vernachlässigt haben, stark von der Kurve in Abbildung 15.13 ab. Die erforderlichen Korrekturen fallen jedoch für alle n im Wesentlichen gleichmäßig aus. Selbst wenn wir alle diese Korrekturen berücksichtigen würden, würde die sich ergebende Energiekurve immer noch bei solchen Werten von n einen Knick haben, die gerade ein Energieniveau auffüllen.
314
15 Die Näherung unabhängiger Teilchen
Egesamt 0
2
6
4
8
10
12
−8A
n
Abb. 15.13: Die Summe aller Elektronenenergien, wenn die niedrigsten Zustände in Abbildung 15.8 von n Elektronen besetzt sind, wobei wir E0 = 0 setzen.
Betrachten wir nun eine glatte Kurve, die die Punkte approximiert (siehe Abbildung 15.14). Wir können sagen, dass die Punkte oberhalb dieser Kurve eine „höher als normale“ Energie haben und dass die Punkte unterhalb der Kurve eine „niedriger als normale“ Energie haben. Im Allgemeinen erwarten wir, dass die Konfigurationen mit einer „niedriger als normalen“ Energie eine über dem Durchschnitt liegende Stabilität haben – chemisch gesprochen. Beachten Sie, dass die Konfigurationen, die unterhalb der Kurve liegen, immer am Ende der geradlinigen Abschnitte von Abbildung (15.13) auftreten – nämlich immer dann, wenn es genug Elektronen gibt, um eine so genannte „Energieschale“ aufzufüllen. Dies ist die sehr genaue Vorhersage der Theorie: Moleküle – oder Ionen – sind besonders stabil (im Vergleich zu ähnlichen Konfigurationen), wenn die in das Molekül aufgenommenen Elektronen gerade eine Energieschale auffüllen. E 0
2
4
6
8
10
12 n Abb. 15.14: Die Punkte von Abbildung 15.13 mit einer glatten Kurve. Moleküle mit n = 2, 6, 10 sind stabiler als die anderen.
Diese Theorie hat einige mysteriöse chemische Befunde erklärt bzw. vorhergesagt. Als ein sehr einfaches Beispiel betrachten wir einen Dreierring. Es ist fast unglaublich, dass die Chemiker einen Dreierring herstellen und ihn stabil halten können, doch es ist durchgeführt worden. Der Energiekreis für drei Elektronen ist in Abbildung 15.15 dargestellt. Wenn Sie jetzt zwei Elektronen in den niedrigeren Zustand bringen, dann haben Sie nur zwei der drei erforderlichen Elektronen „verbaut“. Das dritte Elektron muss auf ein viel höheres Niveau gebracht werden. E E0 + A E0
E0 − 2A
(2)
(1)
Abb. 15.15: Energiediagramm für einen Dreierring.
15.6 Andere Anwendungen der Näherung
315
Nach unseren Ausführungen sollte dieses Molekül nicht besonders stabil sein, während die Struktur mit zwei Elektronen stabil sein sollte. Es stellt sich tatsächlich heraus, dass das neutrale Molekül von Triphenylzyklopropenyl sehr schwierig herzustellen ist, das in Abbildung 15.16 gezeigte positive Ion dagegen relativ leicht. Der Dreierring ist niemals wirklich einfach herzustellen, weil immer eine starke Spannung auftritt, wenn die Bindungen in einem organischen Molekül ein gleichseitiges Dreieck bilden. Um überhaupt eine stabile Verbindung herzustellen, muss die Struktur auf irgendeine Art stabilisiert werden. Jedenfalls kann das positive Ion hergestellt werden, indem man drei Benzolringe an den Ecken hinzufügt. (Warum diese zusätzlichen Benzolringe erforderlich sind, ist nicht genau bekannt.)
+
Abb. 15.16: Das Triphenyl-Zyklopropanyl-Kation.
Auf ähnliche Art kann auch der fünfseitige Ring analysiert werden. Wenn Sie das Energiediagramm zeichnen, können Sie qualitativ sehen, dass die Struktur mit sechs Elektronen besonders stabil sein sollte, sodass ein solches Molekül als negatives Ion am stabilsten sein sollte. Nun ist der Fünferring gut bekannt und leicht herzustellen, und er verhält sich immer wie ein negatives Ion. Ähnlich können Sie leicht verifizieren, dass ein Ring von 4 oder 8 Seiten nicht sehr interessant ist, dass aber ein Ring von 14 oder 10 – wie ein Ring von 6 Seiten – besonders stabil als neutrales Objekt sein sollte.
15.6
Andere Anwendungen der Näherung
Es gibt zwei ähnliche Situationen, die wir nur kurz beschreiben wollen. Wenn wir den Aufbau eines Atoms betrachten, können wir der Meinung sein, dass die Elektronen aufeinanderfolgende Schalen füllen. Die Schrödinger-Theorie der Elektronenbewegung kann nur für ein einzelnes Elektron, das sich in einem „Zentralfeld“ – einem Feld, das sich nur mit dem Abstand von einem gegebenen Punkt ändert – bewegt, leicht berechnet werden. Wie können wir dann wissen, was in einem Atom vor sich geht, das 22 Elektronen hat? Eine Methode besteht in der Anwendung einer Art Näherung unabhängiger Teilchen. Zuerst berechnen Sie, was mit einem Elektron geschieht. Sie erhalten eine Anzahl von Energieniveaus. Sie bringen ein Elektron in den niedrigsten Energiezustand. Sie können bei einem groben Modell weiterhin die Elektronenwechselwirkungen vernachlässigen und aufeinanderfolgende Schalen auffüllen. Es gibt aber eine Methode, mit der Sie bessere Resultate erhalten, nämlich indem Sie – zumindest näherungsweise – den Effekt der vom Elektron mitgeführten elektrischen Ladung berücksichtigen. Jedes Mal, wenn Sie ein Elektron hinzufügen, berechnen Sie seine Amplitude, an verschiedenen Plätzen zu sein, und benutzen dann diese Amplitude, um eine Art kugelsymme-
316
15 Die Näherung unabhängiger Teilchen
trische Ladungsverteilung abzuschätzen. Sie benutzen das Feld dieser Verteilung – gemeinsam mit dem Feld des positiven Kerns und aller bereits hinzugefügten Elektronen –, um die für das nächste Elektron zur Verfügung stehenden Zustände zu berechnen. Auf diese Art können Sie einigermaßen richtige Abschätzungen für die Energien des neutralen Atoms und verschiedener ionisierter Zustände erhalten. Sie stellen fest, dass es Energieschalen gibt, genauso wie wir sie bei den Elektronen in einem Ringmolekül gesehen haben. Bei einer teilweise gefüllten Schale wird das Atom die Neigung zeigen, ein oder mehrere zusätzliche Elektronen aufzunehmen oder einige Elektronen abzugeben, um in den stabilsten Zustand einer gefüllten Schale zu gelangen. Diese Theorie erklärt die grundlegenden chemischen Eigenschaften, die im Periodensystem der Elemente sichtbar werden. Die Edelgase sind jene Elemente, bei denen eine Schale gerade aufgefüllt ist, und es ist besonders schwierig, sie zu einer Reaktion zu bewegen. (Einige von ihnen reagieren natürlich – mit Fluor und Sauerstoff zum Beispiel, aber solche Verbindungen sind sehr schwach gebunden; die so genannten Edelgase sind also nur fast „edel“.) Ein Atom, das ein Elektron mehr oder ein Elektron weniger als ein Edelgas hat, wird leicht ein Elektron verlieren bzw. gewinnen, um in den besonders stabilen Zustand (von niedriger Energie) zu gelangen, der sich bei einer vollkommen gefüllten Schale ergibt – das sind die sehr aktiven chemischen Elemente mit der Wertigkeit +1 oder −1.
Eine andere Situation findet man in der Kernphysik vor. In Atomkernen haben die Protonen und Neutronen untereinander recht starke Wechselwirkungen. Dennoch kann auch hier das Modell unabhängiger Teilchen benutzt werden, um die Kernstruktur zu analysieren. Man entdeckte zuerst experimentell, dass Kerne dann besonders stabil sind, wenn die Anzahl ihrer Neutronen ganz bestimmte Werte annimmt – nämlich 2, 8, 20, 28, 50, 82. Kerne, die Protonen in dieser Anzahl enthalten, sind auch besonders stabil. Da es anfangs für diese Zahlen keine Erklärung gab, wurden sie die „magischen Zahlen“ der Kernphysik genannt. Es ist gut bekannt, dass Neutronen und Protonen miteinander stark wechselwirken. Man war daher recht überrascht, als man entdeckte, dass ein Modell unabhängiger Teilchen eine Schalenstruktur vorhersagte, die die ersten paar magischen Zahlen ergab. In dem Modell wird angenommen, dass sich jedes Nukleon (Proton oder Neutron) in einem Zentralpotential bewegt, das durch die mittleren Effekte aller anderen Nukleonen erzeugt wird. Für die höheren magischen Zahlen ergab dieses Modell jedoch nicht die richtigen Werte. Dann wurde von Maria Goeppert-Mayer und unabhängig davon von Jensen und seinen Mitarbeitern entdeckt, dass man, wenn man weiterhin vom Modell unabhängiger Teilchen ausgeht und lediglich eine Korrektur für die so genannte „Spinbahnwechselwirkung“ hinzufügt, ein verbessertes Modell erhält, das alle magischen Zahlen liefert. (Die Spinbahnwechselwirkung führt dazu, dass die Energie eines Nukleons niedriger ist, wenn sein Spin dieselbe Richtung wie sein Bahndrehimpuls hat.) Die Theorie ergibt sogar noch mehr – ihr Bild der so genannten „Schalenstruktur“ des Kerns erlaubt es, gewisse charakteristische Eigenschaften der Kerne und der Kernreaktionen vorherzusagen.
Die Näherung unabhängiger Teilchen hat sich in vielen Forschungsgebieten als nützlich erwiesen – von der Festkörperphysik über die Chemie und die Biologie bis hin zur Kernphysik. Sie ist oft nur eine grobe Näherung, doch sie kann ein Verständnis dafür vermitteln, warum es besonders stabile Zustände gibt – durch die Annahme der Schalen. Da sie jedoch alle Verwicklungen der Wechselwirkung zwischen den einzelnen Teilchen außer Acht lässt, dürfen wir nicht überrascht sein, dass sie häufig nicht in der Lage ist, viele wichtige Einzelheiten richtig anzugeben.
16
Die Ortsabhängigkeit der Amplituden
16.1
Amplituden auf einer Linie
Wir wollen nun untersuchen, wie die Wahrscheinlichkeitsamplituden der Quantenmechanik im Raum variieren. Vielleicht hatten Sie in früheren Kapiteln manchmal das Gefühl, dass etwas unberücksichtigt blieb. Beispielsweise hatten wir das Ammoniakmolekül einfach durch zwei Basiszustände beschrieben: der eine Basiszustand betraf die Anordnung, in der das Stickstoffatom „über“ der Ebene der drei Wasserstoffatome liegt, und der andere die Anordnung, in der das Stickstoffatom „unter“ der Ebene der drei Wasserstoffatome liegt. Warum haben wir gerade diese zwei Zustände gewählt? Warum ist es nicht möglich, dass sich das Stickstoffatom zwei Ångström über der Ebene der drei Wasserstoffatome befindet, oder auch drei Ångström oder vier Ångström über der Ebene? Sicher, es gibt viele Plätze, die das Stickstoffatom besetzen könnte. Als wir das Wasserstoffmolekül-Ion behandelt haben, bei dem es nur ein Elektron gibt, das sich die beiden Protonen teilen, hatten wir ebenfalls zwei Basiszustände angenommen: einen mit dem Elektron in der Nähe von Proton eins und den anderen mit dem Elektron in der Nähe von Proton zwei. Offensichtlich haben wir viele Details unberücksichtigt gelassen. Das Elektron ist natürlich nicht genau beim Proton zwei, sondern nur in dessen Nähe. Es könnte irgendwo über dem Proton, irgendwo unter dem Proton, irgendwo links vom Proton oder irgendwo rechts vom Proton sein. Wir haben es absichtlich vermieden, diese Details zu betrachten, da wir nur an den Grundzügen des Problems interessiert sind. Wir haben daher angenommen, dass das Elektron, wenn es sich in der Umgebung von Proton eins befindet, einen bestimmten, wohldefinierten Zustand annimmt. In diesem Zustand hätte zwar die Wahrscheinlichkeit, das Elektron zu finden, eine wohldefinierte Verteilung um das Proton, doch diese Details haben uns bisher nicht interessiert. Wir können es auch anders auffassen. Bei der Diskussion des Wasserstoffmolekül-Ions haben wir eine Näherung verwendet, indem wir die Situation lediglich durch zwei Basiszustände beschrieben haben. In Wirklichkeit gibt es sehr viele von diesen Zuständen. Ein Elektron kann sich bei einem Proton im niedrigsten oder Grundzustand befinden, es gibt aber auch viele angeregte Zustände. Bei jedem angeregten Zustand ist die Verteilung des Elektrons um das Proton anders. Wir haben diese angeregten Zustände vernachlässigt und uns nur für Zustände niedriger Energie interessiert. Es sind aber gerade diese anderen angeregten Zustände, die die Möglichkeit für verschiedene Verteilungen des Elektrons um das Proton ergeben. Wenn wir das Wasserstoffmolekül-Ion ausführlich beschreiben wollen, müssen wir auch diese anderen möglichen Basiszustände berücksichtigen. Wir können dies auf verschiedene Weise tun. Eine Möglichkeit besteht darin, Zustände zu betrachten, bei denen die räumliche Position des Elektrons sorgfältiger beschrieben wird.
318
16 Die Ortsabhängigkeit der Amplituden
Wir sind jetzt in der Lage, eine kompliziertere Betrachtung durchzuführen, bei der wir die Position des Elektrons genauer beschreiben können, und zwar durch die Wahrscheinlichkeitsamplitude, es in einer gegebenen Situation an einem bestimmten Ort zu finden. Diese vollständigere Theorie liefert eine Untermauerung der Näherungen, die wir in den früheren Diskussionen verwendet haben. In gewissem Sinne können unsere früheren Gleichungen als eine Art Näherung aus der vollständigeren Theorie abgeleitet werden. Sie fragen sich vielleicht, warum wir nicht gleich mit der vollständigeren Theorie begonnen und die Näherungen erst im weiteren Verlauf eingeführt haben. Wir glauben, dass es Ihnen leichter fallen wird, ein Verständnis der grundlegenden Maschinerie der Quantenmechanik zu gewinnen, wenn Sie mit den Zweizustandsnäherungen beginnen und allmählich zu der vollständigeren Theorie vordringen, als wenn Sie sich dem Thema auf dem anderen Weg nähern. Aus diesem Grund ist unsere Herangehensweise an das Thema umgekehrt zu dem, was Sie in vielen Büchern finden werden. Wenn wir uns in das Thema dieses Kapitels vertiefen, werden Sie bemerken, dass wir mit einer Regel brechen, der wir vorher immer gefolgt sind. Bei jedem Thema haben wir versucht, eine mehr oder weniger vollständige Beschreibung der Physik zu geben und möglichst viel von dem aufzuzeigen, was aus diesen Konzepten folgt. Wir haben versucht, die allgemeinen Konsequenzen einer Theorie sowie einige Details zu beschreiben, sodass Sie sehen konnten, wohin die Theorie führen würde. Wir werden diese Regel jetzt aufgeben. Wir beschreiben, wie man mit Wahrscheinlichkeitsamplituden im Raum umgeht und betrachten Differentialgleichungen für diese Wahrscheinlichkeitsamplituden. Wir werden keine Zeit haben, in die Tiefe zu gehen und viele der offensichtlichen Folgerungen aus der Theorie zu besprechen. Wir werden nicht einmal so weit kommen, dass wir diese Theorie mit einigen der Näherungen, die wir früher benutzt haben, in Beziehung bringen können – zum Beispiel mit dem Wasserstoffmolekül oder dem Ammoniakmolekül. Fürs erste müssen wir unsere Diskussion unvollendet und offen lassen. Wir nähern uns dem Ende unserer Vorlesung und müssen uns damit begnügen, eine Einführung in die allgemeinen Konzepte zu geben. Auf andere Methoden, an das Thema Quantenmechanik heranzugehen, sowie auf die Verbindungen mit unserer bisherigen Beschreibung können wir nur hinweisen. Wir hoffen, Ihnen das nötige Rüstzeug zu geben, damit Sie allein fortfahren und durch ein Literaturstudium viele Folgerungen aus den beschriebenen Gleichungen nachvollziehen können. Wir müssen schließlich noch etwas für die Zukunft übriglassen. Schauen wir uns noch einmal an, was wir über die Bewegung eines Elektrons entlang einer Reihe von Atomen herausgefunden haben. Wenn ein Elektron eine Amplitude hat, von einem Atom zum nächsten zu springen, dann gibt es Zustände bestimmter Energie, bei denen die Wahrscheinlichkeitsamplitude, das Elektron zu finden, in Form einer propagierenden Welle über das Gitter verteilt ist. Bei großen Wellenlängen, d. h. kleinen Wellenzahlen k, ist die Energie des Zustands proportional zum Quadrat der Wellenzahl. Bei einem Kristallgitter mit dem Gitterabstand b, bei dem für das Elektron die Amplitude pro Zeiteinheit, von einem Atom zum nächsten zu springen, iA/ ist, ist die Energie des Zustands mit k (für kleine kb) verknüpft durch E = Ak2 b2
(16.1)
(siehe Abschnitt 13.2). Wir haben auch gesehen, dass Gruppen von solchen Wellen mit ähnlichen Energien ein Wellenpaket bilden, das sich wie ein klassisches Teilchen mit der Masse meff =
2Ab2
(16.2)
16.1 Amplituden auf einer Linie
319
verhält. Da sich die Wellen der Wahrscheinlichkeitsamplitude in einem Kristall wie ein Teilchen verhalten, kann man ebenso gut erwarten, dass die allgemeine quantenmechanische Beschreibung eines Teilchens dieselbe Art von Wellenverhalten zeigt, die wir beim Gitter beobachtet haben. Betrachten wir ein lineares Gitter und stellen wir uns dabei vor, dass der Gitterabstand b immer kleiner gemacht wird. Im Grenzfall kann das Elektron überall auf der Linie sein. Wir würden dann zu einer kontinuierlichen Verteilung der Wahrscheinlichkeitsamplituden übergehen. Wir betrachten die Amplitude, das Elektron an einer bestimmten Stelle auf der Linie zu finden. Dies wäre eine Methode, die Bewegung eines Elektrons im Vakuum zu beschreiben. Mit anderen Worten, wenn wir uns den Raum als eine unendliche Menge von dicht beieinanderliegenden Punkten vorstellen und wenn wir die Gleichungen aufstellen können, die die Amplituden an einem Punkt mit den Amplitude an benachbarten Punkten verknüpfen, dann erhalten wir die quantenmechanischen Gesetze für die Bewegung eines Elektrons im Raum. Beginnen wir damit, an einige allgemeine Prinzipien der Quantenmechanik zu erinnern. Betrachten wir ein Teilchen, das in einem quantenmechanischen System in verschiedenen Zuständen existieren kann. Jede Situation, in der ein Elektron angetroffen werden kann, nennen wir einen „Zustand“, und wir beschreiben ihn durch einen Zustandsvektor | φ �. Jede andere Lage würde durch einen anderen Zustandsvektor | ψ � beschrieben. Dann führen wir den Begriff des Basiszustandes ein. Wir sagen, dass es ein System von Zuständen, | 1 �, | 2 �, | 3 �, | 4 � usw., gibt, die die folgenden Eigenschaften haben. Erstens sind alle diese Zustände voneinander verschieden und orthogonal. Damit meinen wir, dass für zwei beliebige Basiszustände | i � und | j � die Amplitude � i | j �, dass ein Elektron, von dem man weiß, dass es sich im Zustand | i � befindet, auch im Zustand | j � ist, gleich null ist – natürlich nur, sofern | i � und | j � nicht denselben Zustand bezeichnen. Dies stellen wir symbolisch dar durch � i | j � = δi j .
(16.3)
Sie werden sich erinnern, dass δi j = 0 ist, wenn i und j verschieden sind, und dass δi j = 1 ist, wenn i gleich j ist. Zweitens müssen die Basiszustände | i � ein vollständiges System bilden, sodass jeder beliebige Zustand durch sie beschrieben werden kann. Das heißt, jeder beliebige Zustand | φ � kann vollständig durch Angabe aller Amplituden � i | φ �, dass ein Teilchen im Zustand | φ � auch im Zustand | i � gefunden wird, beschrieben werden. Somit ist der Zustandsvektor | φ � gleich der Summe der Basiszustände, von denen jeder mit einem Koeffizienten multipliziert wird, der die Amplitude dafür angibt, dass der Zustand | φ � auch im Zustand | i � ist: |φ� = |i��i|φ� . (16.4) i
Wenn wir zwei beliebige Zustände | φ � und | ψ � betrachten, kann die Amplitude, dass der Zustand | ψ � auch im Zustand | φ � ist, gefunden werden, indem wir zuerst den Zustand | ψ � auf die Basiszustände projizieren und dann von jedem Basiszustand auf den Zustand | φ � projizieren. Wir schreiben das folgendermaßen: �φ|ψ� = �φ|i��i|ψ� . (16.5) i
Die Summation muss natürlich über das gesamte System der Basiszustände | i � erstreckt werden.
320
16 Die Ortsabhängigkeit der Amplituden
In Kapitel 13 hatten wir berechnet, was mit einem Elektron geschieht, das in eine lineare Anordnung von Atomen gebracht wird. Dort hatten wir ein System von Basiszuständen gewählt, in denen das Elektron bei einem der aufgereihten Atome lokalisiert ist. Der Basiszustand | n � stellt den Zustand dar, in dem das Elektron bei Atom Nummer n lokalisiert ist. Später hatten wir es vorgezogen, die Basiszustände durch die Koordinate xn des Atoms anstatt durch die Nummer n des Atoms in der Reihe zu kennzeichnen. Der Zustand | xn � ist einfach eine andere Notation für den Zustand | n �. Dann wird, den allgemeinen Regeln folgend, jeder Zustand | ψ � durch Angabe der Amplituden beschrieben, dass ein Elektron im Zustand | ψ � auch in einem der Zustände | xn � ist. Der Bequemlichkeit halber haben wir das Symbol Cn für diese Amplituden verwendet: C n = � xn | ψ � .
(16.6)
Da die Basiszustände mit einem Ort in der Reihe verbunden sind, können wir die Amplitude Cn als Funktion der Koordinate x betrachten und sie als C(xn ) schreiben. Die Amplituden C(xn ) variieren im Allgemeinen mit der Zeit und sind daher auch Funktionen von t. Wir werden uns im Allgemeinen nicht die Mühe machen, diese Abhängigkeit explizit anzuzeigen. In Kapitel 13 haben wir dann den Ansatz gemacht, dass sich die Amplituden C(xn ) gemäß der Hamilton-Gleichung (13.3) zeitlich ändern. In unserer neuen Notation lautet diese Gleichung i
∂C(xn ) = E0C(xn ) − AC(xn + b) − AC(xn − b) . ∂t
(16.7)
Die beiden letzten Terme auf der rechten Seite stellen den Vorgang dar, dass ein Elektron vom Atom (n + 1) oder vom Atom (n − 1) zum Atom n springt. Wir hatten festgestellt, dass diese Gleichung Lösungen hat, die den Zuständen mit bestimmter Energie entsprechen, die wir geschrieben haben als C(xn ) = e−iEt/ eikxn .
(16.8)
Bei den niederenergetischen Zuständen sind die Wellenlängen groß (k ist klein) und die Energie ist mit k verknüpft durch E = (E0 − 2A) + Ak2 b2 .
(16.9)
Wenn wir unseren Energienullpunkt so wählen, dass (E0 − 2A) = 0 wird, ist die Energie durch Ak2 b2 gegeben. Wir fragen nun, was geschieht, wenn wir den Gitterabstand b gegen null gehen lassen und dabei die Wellenzahl k festhalten. Wenn dies alles wäre, was geschehen kann, würde der letzte Term in (16.9) einfach gegen null gehen, und es gäbe gar keine Physik. Aber nehmen wir an, dass sich A und b gemeinsam ändern, sodass, wenn b gegen null geht, das Produkt Ab2 konstant bleibt.1 Unter Verwendung von (16.2) können wir Ab2 als die Konstante 2 /2meff schreiben. Dann bliebe (16.9) unverändert, aber was passiert mit der Differentialgleichung (16.7)? Zuerst wollen wir Gleichung (16.7) noch einmal schreiben als i 1
∂C(xn ) = (E0 − 2A)C(xn ) + A [2C(xn ) − C(xn + b) − C(xn − b)] . ∂t
(16.10)
Sie können sich vorstellen, dass beim Aneinanderrücken der Punkte xn die Amplitude A für einen Sprung von xn±1 nach xn anwächst.
16.1 Amplituden auf einer Linie
321
Bei unserer Wahl des Energiepunktes fällt der erste Term heraus. Als Nächstes können wir an eine kontinuierliche Funktion C(x) denken, die glatt durch die eigentlichen Werte C(xn ) bei jedem xn geht. Wenn der Abstand b gegen null geht, rücken die Punkte xn immer dichter zusammen, und die Größe in den Klammern ist (wenn wir die Änderung von C(x) schön glatt halten) genau proportional zur zweiten Ableitung von C(x). Wir können – wie Sie aus einer Taylor-Entwicklung der Terme C(x + b) und C(x − b) ersehen können – die folgende Näherung verwenden: 2C(x) − C(x + b) − C(x − b) ≈ −b2
∂2C(x) . ∂x2
(16.11)
Wenn wir in (16.10) b gegen null gehen lassen und dabei b2 A gleich 2 /2meff halten, geht die Gleichung über in i
2 ∂2C(x) ∂C(x) =− . ∂t 2meff ∂x2
(16.12)
Wir erhalten eine Gleichung, die besagt, dass die zeitliche Änderungsrate von C(x) – der Amplitude, das Elektron bei x zu finden – proportional ist zur zweiten Ableitung der Amplitude nach dem Ort. Die richtige quantenmechanische Gleichung für die Bewegung eines Elektrons im Vakuum wurde zuerst von Schrödinger entdeckt. Für die Bewegung entlang einer Linie hat sie genau die Form von (16.12), wenn wir meff durch m, die Masse des Elektrons im Vakuum, ersetzen. Für die geradlinige Bewegung im Vakuum lautet die Schrödinger-Gleichung i
2 ∂2C(x) ∂C(x) =− . ∂t 2m ∂x2
(16.13)
Wir beabsichtigen nicht, Sie zu dem Gedanken zu verleiten, wir hätten hier die SchrödingerGleichung hergeleitet, sondern wir wollen Ihnen nur eine Möglichkeit zeigen, wie man sie betrachten kann. Als Schrödinger sie zuerst hinschrieb, gab er eine Art Herleitung, die auf einigen heuristischen Argumenten und einigen brillanten, intuitiven Annahmen beruhte. Einige von ihm benutzte Argumente waren sogar falsch, aber das spielt keine Rolle. Das einzig Wichtige ist, dass die endgültige Gleichung eine richtige Beschreibung der Natur liefert. Mit unserer Diskussion wollen wir Ihnen zeigen, dass die richtige, grundlegende quantenmechanische Gleichung (16.13) dieselbe Form hat, die Sie im speziellen Fall für ein Elektron erhalten, das sich entlang einer Reihe von Atomen bewegt. Dies bedeutet, dass wir die Differentialgleichung (16.13) als Beschreibung der Diffusion einer Wahrscheinlichkeitsamplitude von einem Punkt zum nächsten entlang der Reihe ansehen können. Das heißt, wenn ein Elektron eine gewisse Amplitude hat, an einem Punkt zu sein, dann wird es eine kurze Zeit später eine Amplitude haben, an benachbarten Punkten zu sein. Tatsächlich hat die Gleichung eine gewisse Ähnlichkeit mit den Diffusionsgleichungen, die wir in Band II betrachtet haben. Aber es gibt einen wichtigen Unterschied: Der imaginäre Koeffizient vor der zeitlichen Ableitung macht das Verhalten vollständig verschieden von der gewöhnlichen Diffusion, wie man sie bei einem Gas beobachtet, das sich in einem dünnen Rohr ausbreitet. Gewöhnliche Diffusion liefert reelle Exponentiallösungen, während die Lösungen von Gleichung (16.13) komplexe Wellen sind.
322
16.2
16 Die Ortsabhängigkeit der Amplituden
Die Wellenfunktion
Da Sie nun eine Vorstellung davon haben, wie sich die Dinge verhalten, möchten wir zum Ausgangspunkt zurückkehren und das Problem untersuchen, wie man die Bewegung eines Elektrons entlang einer Geraden beschreibt, ohne dabei Zustände zu betrachten, die mit Atomen in einem Gitter verknüpft sind. Wir möchten zum Anfang zurückgehen und sehen, welche Konzepte wir benutzen müssen, wenn wir die Bewegung eines freien Teilchens im Raum beschreiben wollen. Da wir an dem Verhalten eines Teilchens in einem eindimensionalen Kontinuum interessiert sind, werden wir uns mit einer unendlichen Anzahl von möglichen Zuständen befassen. Wie Sie sehen werden, bedürfen die Konzepte, die wir zur Behandlung einer endlichen Anzahl von Zuständen entwickelt haben, einiger technischer Änderungen. Wir beginnen damit, dass wir mit dem Zustandsvektor | x � einen Zustand bezeichnen, in dem sich ein Teilchen genau bei der Koordinate x befindet. Für jeden Wert x längs der Geraden – zum Beispiel 1,73 oder 9,67 oder 10,00 – gibt es den entsprechenden Zustand. Wir wollen diese Zustände | x � als Basiszustände verwenden, und wenn wir alle Punkte auf der Geraden berücksichtigen, erhalten wir ein vollständiges System für die Bewegung in einer Dimension. Nehmen wir jetzt an, wir betrachten einen anderen Zustand, sagen wir | ψ �, in dem ein Elektron irgendwie entlang der Geraden verteilt ist. Eine Möglichkeit, diesen Zustand zu beschreiben, besteht darin, für jeden Basiszustand | x � die Amplitude dafür anzugeben, dass sich das Elektron in diesem Zustand befindet. Wir müssen ein unendliches System von Amplituden angeben, für jeden x-Wert eine. Wir schreiben diese Amplituden als � x | ψ �. Jede von diesen Amplituden ist eine komplexe Zahl, und da es für jeden Wert von x eine solche komplexe Zahl gibt, ist die Amplitude � x | ψ � eine Funktion von x. Wir wollen sie deshalb als C(x) schreiben: C(x) ≡ �x | ψ� .
(16.14)
Wir haben schon solche Amplituden betrachtet, die sich auf kontinuierliche Art mit den Koordinaten ändern, als wir in Kapitel 7 über die zeitliche Änderung der Amplitude sprachen. Wir haben dort zum Beispiel gezeigt, dass man von einem Teilchen mit bestimmtem Impuls erwarten muss, dass seine Amplitude auf eine bestimmte Art räumlich variiert. Wenn ein Teilchen einen bestimmten Impuls p und eine entsprechende bestimmte Energie E hat, dann hat die Amplitude, es an irgendeinem Ort x zu finden, etwa die Form �x | ψ� = C(x) ∝ e+ipx/ .
(16.15)
Diese Gleichung drückt ein wichtiges allgemeines Prinzip der Quantenmechanik aus, welches die den verschiedenen Orten im Raum entsprechenden Basiszustände mit einem anderen System von Basiszuständen verbindet – mit allen Zuständen mit definiertem Impuls. Die Zustände mit definiertem Impuls sind für manche Probleme geeigneter als die Zustände in x. Jedes System von Basiszuständen ist natürlich gleichermaßen annehmbar zur Beschreibung einer quantenmechanischen Situation. Wir wollen später auf den Zusammenhang zwischen diesen Basissystemen zurückkommen. Jetzt wollen wir bei unserer Beschreibung durch die Zustände | x � bleiben. Bevor wir fortfahren, möchten wir eine kleine Änderung an unserer Notation vornehmen, die hoffentlich nicht allzu verwirrend ist. Die durch (16.14) definierte Funktion C(x) wird natürlich eine Form haben, die von dem betrachteten Zustand | ψ � abhängt. Wir sollten dies irgendwie kenntlich machen. Wir könnten das C zum Beispiel durch einen Index spezifizieren, also Cψ (x).
16.2 Die Wellenfunktion
323
Obwohl dies eine durchaus befriedigende Notation ist, ist sie etwas schwerfällig und entspricht nicht der, die Sie in den meisten Büchern finden werden. Meistens lässt man den Buchstaben C weg und benutzt das Symbol ψ zur Definition der Funktion: ψ(x) ≡ Cψ (x) = � x | ψ � .
(16.16)
Dies ist die allgemein übliche Schreibweise. Beachten Sie jedoch, dass wir jetzt das ψ auf zwei verschiedene Arten benutzen. In (16.14) ist ψ eine Bezeichnung für einen speziellen physikalischen Zustand des Elektrons. Auf der linken Seite von (16.16) dagegen wird das Symbol ψ benutzt, um eine mathematische Funktion von x zu definieren, die gleich der Amplitude ist, mit jedem Punkt x längs der Geraden verknüpft zu sein. Wir hoffen, es wird nicht allzu verwirrend sein, wenn Sie sich erst einmal an diesen Gedanken gewöhnt haben. Übrigens wird die Funktion ψ(x) gewöhnlich „die Wellenfunktion“ genannt – weil sie überwiegend die Form einer komplexen Welle in ihren Variablen hat. Da wir ψ(x) als die Amplitude definiert haben, dass ein Elektron im Zustand ψ am Ort x gefunden wird, müssen wir das Absolutquadrat von ψ als die Wahrscheinlichkeit interpretieren, das Elektron am Ort x zu finden. Allerdings ist die Wahrscheinlichkeit, ein Teilchen genau an einem Ort zu finden, null. Das Elektron wird im Allgemeinen über ein gewisses Gebiet auf der Geraden „verschmiert“ sein, und da es in jedem kleinen Teilstück der Geraden unendlich viele Punkte gibt, kann die Wahrscheinlichkeit, dass es sich bei einem von ihnen befindet, keine endliche Zahl sein. Wir können die Wahrscheinlichkeit, ein Elektron zu finden, nur durch eine Wahrscheinlichkeitsverteilung2 beschreiben, die die relative Wahrscheinlichkeit dafür angibt, das Elektron an vielen dicht beieinander liegenden Orten entlang der Geraden zu finden. Wir bezeichnen die Wahrscheinlichkeit (englisch: probability), das Elektron in einem kleinen Intervall Δx um x zu finden, mit prob(x, Δx). Wenn wir in jeder physikalischen Situation zu einem hinreichend kleinen Maßstab übergehen, wird sich die Wahrscheinlichkeit von Ort zu Ort stetig ändern, und die Wahrscheinlichkeit, das Elektron im Intervall Δx zu finden, ist proportional zu Δx. Wir können unsere Definition abändern, um dies zu berücksichtigen. Wir können uns vorstellen, dass die Amplitude � x | ψ � eine Art „Amplitudendichte“ für alle Basiszustände | x � in einem kleinen Gebiet darstellt. Da die Wahrscheinlichkeit, das Elektron in einem kleinen Intervall Δx um x zu finden, proportional zum Intervall Δx ist, wählen wir unsere Definition von � x | ψ � so, dass folgende Beziehung gilt: prob(x, Δx) = | � x | ψ � |2 Δx . Die Amplitude � x | ψ � ist also proportional zur Amplitude, dass ein Elektron im Zustand | ψ � im Basiszustand | x � gefunden wird, und die Proportionalitätskonstante ist so gewählt, dass das Absolutquadrat der Amplitude � x | ψ � die Wahrscheinlichkeitsdichte ergibt, ein Elektron in irgendeinem kleinen Gebiet zu finden. Wir können auch schreiben prob(x, Δx) = |ψ(x)|2 Δx .
(16.17)
Wir müssen jetzt einige unserer früheren Gleichungen modifizieren, um sie an diese neue Definition der Wahrscheinlichkeitsamplitude anzupassen. Angenommen, wir betrachten ein Elektron im Zustand | ψ � und möchten die Amplitude wissen, es in einem anderen Zustand | φ � zu 2
Eine Diskussion der Wahrscheinlichkeitsverteilungen finden Sie in Band I, Abschnitt 6.4.
324
16 Die Ortsabhängigkeit der Amplituden
finden, der anderen Ausbreitungsverhältnissen des Elektrons entsprechen kann. Für die Behandlung eines endlichen Systems diskreter Zustände hätten wir (16.5) benutzt. Vor der Änderung unserer Amplitudendefinition hätten wir geschrieben: �φ|ψ� = �φ| x�� x|ψ� . (16.18) alle x
Wenn nun die beiden Amplituden auf die oben beschriebene Weise normiert sind, dann ist eine Summe aller Zustände in einer kleinen Umgebung von x gleichwertig mit einer Multiplikation mit Δx, und die Summe über alle Werte von x wird zu einem Integral. Mit unserer modifizierten Definition erhalten wir �φ|ψ� = � φ | x � � x | ψ � dx . (16.19) alle x
Die Amplitude � x | ψ � ist das, was wir jetzt ψ(x) nennen, und entsprechend wollen wir die Amplitude � x | φ � durch φ(x) darstellen. Wenn wir uns erinnern, dass � φ | x � das komplex Konjugierte von � x | φ � ist, können wir Gleichung (16.19) schreiben als (16.20) �φ|ψ� = φ∗ (x)ψ(x) dx . Mit unseren neuen Definitionen verläuft alles nach denselben Formeln wie vorher, wenn wir immer das Summenzeichen durch ein Integral über x ersetzen.
Wir sollten eine Einschränkung für das Gesagte erwähnen. Jedes geeignete System von Basiszuständen muss vollständig sein, wenn es für eine ausreichende Beschreibung des Geschehens verwendet werden soll. Bei der Bewegung eines Elektrons in einer Dimension genügt es nicht, nur die Basiszustände | x � anzugeben, weil das Elektron in jedem dieser Zustände einen Spin hat, der entweder up oder down ist. Eine Möglichkeit, ein vollständiges System zu erhalten, besteht darin, zwei Systeme von x-Zuständen zu verwenden, das eine für Spin up und das andere für Spin down. Wir wollen uns hier jedoch nicht mit solchen Komplikationen befassen.
16.3
Zustände mit bestimmtem Impuls
Wir betrachten ein Elektron in einem Zustand | ψ �, der durch die Wahrscheinlichkeitsamplitude � x | ψ � = ψ(x) beschrieben wird. Wir wissen, dass dies einen Zustand darstellt, in dem das Elektron mit einer gewissen Verteilung entlang der Geraden ausgebreitet ist. Die Wahrscheinlichkeit, das Elektron in einem kleinen Intervall dx um den Ort x zu finden, ist daher prob(x, dx) = |ψ(x)|2 dx .
Was können wir über den Impuls dieses Elektrons aussagen? Wir könnten fragen, wie groß die Wahrscheinlichkeit ist, dass dieses Elektron den Impuls p hat. Fangen wir mit einer Berechnung der Amplitude an, dass der Zustand | ψ � in einem anderen Zustand | mom p � ist, den wir als einen Zustand mit dem bestimmten Impuls (englisch: momentum) p annehmen. Diese Amplitude können wir finden, indem wir unsere Grundgleichung für die Zerlegung von Amplituden, Gleichung (16.19), benutzen. Für den Zustand | mom p � lautet sie +∞ � mom p | ψ � = � mom p | x � � x | ψ � dx . (16.21) x=−∞
16.3 Zustände mit bestimmtem Impuls
325
Die Wahrscheinlichkeit, dass das Elektron im Zustand | ψ � in einem Zustand mit dem Impuls p angetroffen wird, ist durch das Absolutquadrat dieser Amplitude gegeben. Wir haben jedoch wieder ein kleines Problem mit der Normierung. Im Allgemeinen können wir nur nach der Wahrscheinlichkeit fragen, das Elektron in einem kleinen Impulsbereich dp um den Impuls p zu finden. Die Wahrscheinlichkeit, dass der Impuls genau den Wert p hat, muss null sein (sofern der Zustand | ψ � nicht zufällig ein Zustand mit bestimmtem Impuls ist). Nur wenn wir nach der Wahrscheinlichkeit fragen, den Impuls in einem kleinen Bereich dp um den Impuls p zu finden, werden wir eine endliche Wahrscheinlichkeit erhalten. Es gibt mehrere Möglichkeiten, wie die Normierung erreicht werden kann. Wir werden eine davon auswählen, von der wir glauben, dass sie die bequemste ist, obwohl Ihnen das im Moment vielleicht gar nicht so vorkommt. Wir wählen unsere Normierung so, dass die Wahrscheinlichkeit mit der Amplitude verknüpft ist durch prob(p, dp) = | � mom p | ψ � |2
dp . 2π
(16.22)
Mit dieser Definition ist die Normierung der Amplitude � mom p | x � festgelegt. Die Amplitude � mom p | x � ist natürlich das komplex Konjugierte der Amplitude � x | mom p �, die gerade diejenige ist, die wir in (16.15) angegeben haben. Bei der von uns gewählten Normierung stellt sich heraus, dass die Proportionalitätskonstante vor der Exponentialfunktion gerade 1 ist. Es gilt nämlich � mom p | x � = � x | mom p �∗ = e−ipx/ . Gleichung (16.21) wird dann zu +∞ � mom p | ψ � = e−ipx/ �x | ψ� dx .
(16.23)
(16.24)
−∞
Zusammen mit (16.22) erlaubt uns diese Gleichung, die Impulsverteilung für jeden Zustand | ψ � zu berechnen.
Betrachten wir ein spezielles Beispiel, bei dem ein Elektron in einem gewissen Bereich um x = 0 lokalisiert ist. Angenommen, die Wellenfunktion hat die folgende Form: ψ(x) = Ke−x
2
/4σ2
(16.25)
.
Die Wahrscheinlichkeitsverteilung in x für diese Wellenfunktion ist das Absolutquadrat oder 2
2
prob(x, dx) = P(x) dx = K 2 e−x /2σ dx .
(16.26)
Die Wahrscheinlichkeitsdichte P(x) ist die in Abbildung 16.1 gezeigte Gauß-Kurve. Der größte Teil der Wahrscheinlichkeit ist zwischen x = +σ und x = −σ konzentriert. Wir sagen, dass σ die „Halbwertsbreite“ der Kurve ist. (Genauer gesagt ist σ gleich dem quadratischen Mittelwert der Koordinate x für eine Variable, die nach dieser Funktion verteilt ist.) Wir würden normalerweise die Konstante K so wählen, dass die Wahrscheinlichkeitsdichte P(x) nicht nur proportional ist zur Wahrscheinlichkeit pro Längeneinheit in x, das Elektron zu finden, sondern dass sie einen solchen Maßstab hat, dass P(x) Δx gleich der Wahrscheinlichkeitist, das Elektron +∞ in Δx um x zu finden. Die Konstante K, die das leistet, kann aus der Bedingung −∞ P(x) dx = 1
326
16 Die Ortsabhängigkeit der Amplituden σP(x) 0,4 0,3 0,2 0,1
0
−3σ −2σ −σ
σ
2σ
x
3σ
Abb. 16.1: Die Wahrscheinlichkeitsdichte für die durch (16.25) gegebene Wellenfunktion.
bestimmt werden, da die Wahrscheinlichkeit, das Elektron irgendwo zu finden, eins sein muss. √ +∞ 2 Wir erhalten K = (2πσ2 )−1/4 . (Wir haben die Tatsache benutzt, dass −∞ e−t dt = π ist; siehe Band II, Seite 217.) Nun wollen wir die Impulsverteilung berechnen. Bezeichnen wir die Amplitude, das Elektron mit dem Impuls p zu finden, mit φ(p): φ(p) ≡ � mom p | ψ � .
(16.27)
Wenn wir (16.25) in (16.24) einsetzen, erhalten wir +∞ 2 2 φ(p) = e−ipx/ · Ke−x /4σ dx .
(16.28)
−∞
Das Integral kann auch geschrieben werden als +∞ 2 2 2 2 2 2 e−(1/4σ )(x+2ipσ /) dx . Ke−p σ /
(16.29)
−∞
Wir können jetzt die Substitution u = x + 2ipσ2 / durchführen, und das Integral ist +∞ √ 2 2 e−u /4σ du = 2σ π .
(16.30)
−∞
(Die Mathematiker würden wahrscheinlich gegen den Weg protestieren, auf dem wir dahin gelangten, aber das Ergebnis ist nichtsdestoweniger richtig.) 2
φ(p) = (8πσ2 )1/4 e−p
σ2 /2
.
(16.31)
Wir erhalten das interessante Resultat, dass die Amplitudenfunktion in p genau dieselbe mathematische Form hat wie die Amplitudenfunktion in x; nur die Breite der Gauß-Verteilung ist anders. Wir können schreiben −1/4 2 2 φ(p) = η2 /2π2 e−p /4η (16.32)
wobei zwischen der Halbwertsbreite η der p-Verteilungsfunktion und der Halbwertsbreite σ der x-Verteilungsfunktion die Beziehung η=
. 2σ
(16.33)
16.4 Normierung der x-Zustände
327
besteht. Unser Ergebnis besagt: Wenn wir die Breite der Verteilung in x sehr klein machen, indem wir σ klein machen, wird η groß, und die Verteilung in p wird sehr ausgedehnt. Oder umgekehrt: Wenn wir eine schmale Verteilung in p haben, muss sie einer ausgedehnten Verteilung in x entsprechen. Wenn wir wollen, können wir η und σ als Maß für die Unbestimmtheit in der Festlegung des Impulses Δp bzw. des Ortes Δx des Elektrons in dem untersuchten Zustand ansehen. Damit wird (16.33) zu Δp Δx =
. 2
(16.34)
Interessanterweise ist es möglich zu beweisen, dass für jede andere Form der Verteilung in x oder in p das Produkt Δp Δx nicht kleiner sein kann als das, was wir hier gefunden haben. Die Gauß-Verteilung ergibt den kleinstmöglichen Wert für das Produkt der mittleren Schwankungen. Allgemein gilt Δp Δx ≥
. 2
(16.35)
Dies ist eine quantitative Formulierung des heisenbergschen Unbestimmtheitsprinzips, das wir bereits mehrfach qualitativ diskutiert haben. Wir haben gewöhnlich die approximative Aussage getroffen, dass der minimale Betrag des Produktes Δp Δx in der Größenordnung von liegt.
16.4
Normierung der x-Zustände
Wir kehren jetzt zu unseren modifizierten Grundgleichungen zurück, die erforderlich sind, wenn wir uns mit einem Kontinuum von Basiszuständen befassen. Wenn wir eine endliche Anzahl diskreter Zustände betrachten, dann muss das System der Basiszustände die Grundbedingungen � i | j � = δi j
(16.36)
erfüllen. Wenn ein Teilchen in einem Basiszustand ist, dann hat es die Amplitude null, sich in einem anderen Basiszustand zu befinden. Durch Wahl einer geeigneten Normierung haben wir die Amplitude � i | i � als 1 definiert. Diese beiden Bedingungen sind zur Bedingung (16.36) zusammengefasst. Wir wollen nun sehen, wie diese Beziehung modifiziert werden muss, wenn wir den Basiszustand | x � eines Teilchens auf einer Geraden benutzen. Wenn man weiß, dass sich das Teilchen im Basiszustand | x � befindet, was ist dann die Amplitude, dass es in einem anderen Basiszustand | x� � ist? Wenn x und x� zwei verschiedene Orte auf der Geraden sind, dann ist die Amplitude � x | x� � sicherlich null, was mit (16.36) im Einklang steht. Aber wenn x und x� gleich sind, wird die Amplitude � x | x� � wegen des alten Normierungsproblems nicht 1 sein. Um zu sehen, wie wir die Dinge wieder zusammenflicken müssen, greifen wir auf die Defintion (16.19) zurück und wenden sie auf den Spezialfall an, in dem der Zustand | φ � der Basiszustand | x� � ist. Wir erhalten dann � x� | ψ � = � x� | x � ψ(x) dx . (16.37) Nun ist die Amplitude � x | ψ � gerade das, was wir als Funktion ψ(x) bezeichnet haben. Entsprechend ist die Amplitude � x� | ψ � dieselbe Funktion der Variablen x� , nämlich ψ(x� ), da sie sich
328
16 Die Ortsabhängigkeit der Amplituden
auf denselben Zustand | ψ � bezieht. Wir können daher (16.37) folgendermaßen umschreiben: � x� | x � ψ(x) dx . (16.38) ψ(x� ) =
Diese Gleichung muss für jeden Zustand | ψ � und daher für jede beliebige Funktion ψ(x) gelten. Diese Gleichung muss also die Natur der Amplitude � x� | x � – die natürlich einfach eine von x und x� abhängige Funktion ist – vollständig bestimmen.
Unser Problem besteht jetzt darin, eine Funktion f (x, x� ) zu finden, die, wenn sie mit ψ(x) multipliziert und über alle x integriert wird, gerade die Größe ψ(x� ) ergibt. Es stellt sich heraus, dass es keine mathematische Funktion gibt, die dies tut! Zumindest ist es nicht das, was wir gewöhnlich unter einer „Funktion“ verstehen. Angenommen, wir wählen für x� die spezielle Zahl 0 und definieren die Amplitude � 0 | x � als eine Funktion von x, sagen wir als f (x). Dann lautet (16.38): ψ(0) = f (x) ψ(x) dx . (16.39)
Welche Funktion f (x) könnte diese Gleichung befriedigen? Da das Integral nicht davon abhängig sein darf, welche Werte ψ(x) für andere x-Werte außer null annimmt, muss f (x) offensichtlich für alle Werte x 0 null sein. Wenn aber f (x) überall null wäre, dann wäre das Integral auch null, und Gleichung (16.39) wäre nicht erfüllt. Wir haben also eine unmögliche Situation: Wir suchen eine Funktion, die bis auf einen Punkt überall null ist und trotzdem ein endliches Integral ergibt. Da wir keine Funktion finden können, die dies tut, besteht der einfachste Ausweg darin, dass wir einfach sagen, die Funktion f (x) sei durch Gleichung (16.39) definiert. Mit anderen Worten: f (x) ist die Funktion, die Gleichung (16.39) gültig macht. Die Funktion, die dies tut, wurde von Dirac eingeführt und trägt deshalb seinen Namen. Wir bezeichnen sie mit δ(x). Alles, was wir sagen, ist, dass die Funktion δ(x) die seltsame Eigenschaft hat, dass, wenn sie für f (x) in Gleichung (16.39) eingesetzt wird, das Integral sich den Wert auswählt, den ψ(x) für x = 0 annimmt; und da das Integral für alle Werte x 0 unabhängig von ψ(x) sein muss, muss die Funktion δ(x) überall null sein, außer bei x = 0. Zusammenfassend schreiben wir �0 | x� = δ(x) , wobei δ(x) definiert ist durch ψ(0) = δ(x) ψ(x) dx .
(16.40)
(16.41)
Beachten Sie, was geschieht, wenn wir in (16.41) die spezielle Funktion „1“ anstelle der Funktion ψ verwenden. Dann erhalten wir das Ergebnis 1= δ(x) dx . (16.42) Das heißt, die Funktion δ(x) hat die Eigenschaft, dass sie einerseits überall null ist, außer bei x = 0, aber andererseits ein endliches Integral hat, das gleich eins ist. Wir müssen uns vorstellen, dass die Funktion δ(x) an einem Punkt eine so phantastische Unendlichkeit hat, dass die Gesamtfläche gleich eins herauskommt.
16.4 Normierung der x-Zustände
329
f (x)
3
2
1
0
x
Abb. 16.2: Eine Folge von Funktionen, die alle die Einheitsfläche einschließen und mehr und mehr wie δ(x) aussehen.
Man kann sich die diracsche δ-Funktion als eine Folge von Rechtecken vorstellen (siehe Abbildung 16.2) oder als Folge irgendwelcher anderer spitzer Funktionen, die immer schmaler und höher werden und dabei die Einheitsfläche beibehalten. Das Integral dieser Funktion von −∞ bis +∞ ist immer 1. Wenn Sie sie mit irgendeiner Funktion ψ(x) multiplizieren und über das Produkt integrieren, erhalten Sie etwas, was ungefähr der Wert der Funktion bei x = 0 ist. Die Näherung wird immer besser, je schmaler die Rechtecke werden. Wenn Sie wollen, können Sie sich die δ-Funktion als Ergebnis eines derartigen Grenzübergangs vorstellen. Das einzig Wichtige ist jedoch, dass die δ-Funktion so definiert ist, dass Gleichung (16.41) für jede Funktion ψ(x) erfüllt ist. Das allein definiert die δ-Funktion. Ihre Eigenschaften sind dann so, wie wir sie beschrieben haben. Wenn wir das Argument der δ-Funktion von x in x−x� abändern, dann lauten die entsprechenden Beziehungen δ(x − x� ) = 0 , x� x , δ(x − x� ) ψ(x) dx = ψ(x� ) .
(16.43)
Gleichung (16.38) ist befriedigt, wenn wir dort δ(x − x� ) für die Amplitude � x� | x � einsetzen. Unser Ergebnis ist dann, dass für unsere Basiszustände in x die (16.36) entsprechende Bedingung lautet: �x� | x� = δ(x − x� ) .
(16.44)
330
16 Die Ortsabhängigkeit der Amplituden
Damit haben wir die notwendigen Modifikationen unserer Grundgleichungen vorgenommen, um ein Kontinuum von Basiszuständen behandeln zu können, das den Punkten auf einer Geraden entspricht. Die Erweiterung auf drei Dimensionen liegt unmittelbar auf der Hand. Zuerst ersetzen wir die Koordinate x durch den Vektor r. Dann werden die Integrale über x ersetzt durch Integrale über x, y und z. Mit anderen Worten, sie werden zu Volumenintegralen. Schließlich muss die eindimensionale δ-Funktion durch das Produkt von drei δ-Funktionen ersetzt werden, eine in x, eine in y und eine in z, also δ(x − x� ) δ(y − y� ) δ(z − z� ). Wenn wir alles zusammenstellen, erhalten wir das folgende Gleichungssystem für die Amplituden von Teilchen in drei Dimensionen: �φ|ψ� =
� φ | r � � r | ψ � d Vol ,
(16.45)
� r | ψ � = ψ( r) ,
(16.46)
� r | φ � = φ( r) , �φ|ψ� = φ∗ ( r) ψ( r)d Vol ,
(16.47)
� r� | r � = δ(x − x� )δ(y − y� )δ(z − z� ) .
(16.48) (16.49)
Was geschieht, wenn wir mehr als ein Teilchen betrachten? Wir werden den Fall zweier Teilchen behandeln, und Sie werden erkennen, was zu tun ist, wenn Sie sich mit einer größeren Anzahl von Teilchen beschäftigen wollen. Nehmen wir also an, es gäbe zwei Teilchen. Was sollen wir als Basiszustände benutzen? Ein vollkommen ausreichender Satz kann beschrieben werden, indem man sagt, dass Teilchen 1 bei r1 und Teilchen 2 bei r2 ist, was wir als | r1 , r2 � schreiben können. Beachten Sie, dass die Beschreibung des Ortes von nur einem Teilchen jetzt keinen Basiszustand mehr definiert. Jeder Basiszustand muss den Zustand des gesamten Systems festlegen. Sie dürfen nicht glauben, dass sich jedes Teilchen unabhängig vom anderen als dreidimensionale Welle bewegt. Jeder physikalische Zustand | ψ � muss beschrieben werden durch Angabe aller Amplituden � r1 , r2 | ψ �, die zwei Teilchen bei r1 bzw. r2 zu finden. Die verallgemeinerte Amplitude ist daher eine Funktion der zwei Koordinatensätze r1 und r2 . Sie sehen, dass eine solche Funktion keine Welle im Sinne einer Schwingung ist, die sich in drei Dimensionen ausbreitet. Auch ist sie im Allgemeinen nicht einfach ein Produkt von zwei einzelnen Wellen, von denen jede zu einem Teilchen gehört. Sie ist im Allgemeinen eine Art Welle in den sechs Dimensionen, die durch r1 und r2 definiert sind. Wenn in der Natur zwischen zwei Teilchen eine Wechselwirkung besteht, gibt es keine Möglichkeit zu beschreiben, was mit einem der Teilchen geschieht, indem man versucht eine Wellenfunktion für das Teilchen allein aufzuschreiben. Die berühmten Widersprüche, die wir in vorangegangenen Kapiteln behandelt haben – wo behauptet wurde, dass die Messungen, die an einem Teilchen durchgeführt wurden, auch eine Aussage darüber ermöglichen, was mit einem anderen Teilchen geschieht, oder dass die Messungen eine Interferenz zerstören können – haben allgemein vielerlei Schwierigkeiten verursacht, weil man versuchte, eher an die Wellenfunktion eines einzelnen Teilchens zu denken als an die richtige Wellenfunktion in den Koordinaten beider Teilchen. Eine vollständige und richtige Beschreibung beider Teilchen ist nur durch Funktionen aller sechs Koordinaten möglich.
16.5 Die Schrödinger-Gleichung
16.5
331
Die Schrödinger-Gleichung
Bisher haben wir uns nur damit befasst, wie wir Zustände mit einem Elektron beschreiben können, das sich irgendwo im Raum befindet. Nun müssen wir überlegen, wie wir bei unserer Beschreibung die in verschiedenen Situationen gültige Physik richtig berücksichtigen können. Wie zuvor müssen wir untersuchen, wie sich Zustände zeitlich ändern. Wenn ein Zustand | ψ � vorliegt, der einige Zeit später in einen anderen Zustand | ψ �� übergeht, können wir die Entwicklung für alle Zeiten beschreiben, indem wir die Wellenfunktion – die einfach die Amplitude � r | ψ � ist – sowohl als eine Funktion der Zeit als auch als eine Funktion der Koordinaten betrachten. Ein Teilchen in einer gegebenen Situation kann durch eine zeitlich veränderliche Wellenfunktion ψ(r, t) = ψ(x, y, z, t) beschrieben werden. Diese zeitlich veränderliche Wellenfunktion beschreibt die zeitliche Entwicklung aufeinanderfolgender Zustände. Diese so genannte „Ortsdarstellung“ – die die Projektion des Zustandes | ψ � auf die Basiszustände | r � angibt – wird vielleicht nicht immer die geeignetste sein, aber wir werden sie zuerst betrachten. In Kapitel 8 haben wir durch die Hamilton-Matrix Hi j beschrieben, wie sich Zustände mit der Zeit ändern. Die zeitliche Änderung der Amplituden ist demnach gegeben durch die Matrixgleichung i
dCi = Hi j C j . dt j
(16.50)
Diese Gleichung besagt, dass die zeitliche Änderung jeder Amplitude Ci proportional zu allen Amplituden C j ist, gewichtet mit den Koeffizienten Hi j . Welches Aussehen erwarten wir für die Gleichung (16.50), wenn wir das Kontinuum der Basiszustände | x � benutzen? Erinnern wir uns zuerst, dass (16.50) auch geschrieben werden kann als ∂ i � i | ψ � = � i | Hˆ | j � � j | ψ � . ∂t j Jetzt ist klar, was zu tun ist. Für die x-Darstellung erwarten wir ∂ � x | Hˆ | x� � � x� | ψ � dx� . i � x | ψ � = ∂t
(16.51)
Die Summe über die Basiszustände | j � wird durch ein Integral über x� ersetzt. Da � x | Hˆ | x� � eine Funktion von x und x� ist, können wir sie als H(x, x� ) schreiben – was den Hi j in (16.50) entspricht. Dann wird Gleichung (16.51) zu ∂ H(x, x� ) ψ(x� ) dx� mit H(x, x� ) ≡ � x | Hˆ | x� � . i ψ(x) = (16.52) ∂t Gemäß Gleichung (16.52) hängt die Änderungsgeschwindigkeit von ψ am Ort x von den ψWerten an allen anderen Orten x� ab. Die Größe iH(x, x� )/ ist die Amplitude pro Zeiteinheit, dass das Elektron von x� nach x springen wird. Tatsächlich stellt sich jedoch heraus, dass diese Amplitude null ist, außer an Punkten x� , die sehr nahe bei x liegen. Dies bedeutet, wie wir am Beispiel der Atomkette am Anfang des Kapitels gesehen haben, dass die rechte Seite von
332
16 Die Ortsabhängigkeit der Amplituden
Gleichung (16.52) vollständig ausgedrückt werden kann durch ψ und die Ableitungen von ψ nach x, die alle am Ort x ausgewertet werden. Für ein Teilchen, das sich ohne äußere Kräfte und ohne Störungen frei im Raum bewegt, lautet das korrekte physikalische Gesetz
H(x, x� ) ψ(x� ) dx� = −
2 ∂2 ψ(x) . 2m ∂x2
Woher haben wir das? Nirgendwoher. Es ist nicht möglich, dies aus irgendetwas Bekanntem herzuleiten. Es kam aus dem Geist Schrödingers, der es im Bemühen, eine Erklärung für die experimentellen Beobachtungen der realen Welt zu finden, postulierte. Sie können vielleicht einen Hinweis erhalten, warum es so sein sollte, wenn Sie an die Herleitung von Gleichung (16.12) denken, mit der die Propagation eines Elektrons in einem Kristall beschrieben werden kann. Natürlich sind freie Teilchen nicht sehr aufregend. Was geschieht, wenn Kräfte auf das Teilchen wirken? Nun, wenn die auf ein Teilchen wirkende Kraft durch ein skalares Potential V(x) beschrieben werden kann – was zwar für elektrische, aber nicht für magnetische Kräfte der Fall ist – und wenn wir uns auf niedrige Energien beschränken, sodass wir die Komplikationen, die bei relativistischen Bewegungen auftreten, nicht zu beachten brauchen, dann führt der Hamilton-Operator, der mit der realen Welt übereinstimmt, zu
H(x, x� ) ψ(x� ) dx� = −
2 ∂2 ψ(x) + V(x) ψ(x) . 2m ∂x2
(16.53)
Wieder können Sie einen Hinweis auf den Ursprung dieser Gleichung erhalten, wenn Sie an die Bewegung eines Elektrons in einem Kristall denken und überlegen, wie die Gleichungen geändert werden müssen, wenn sich die Energie des Elektrons langsam von einem Atomplatz zum nächsten ändert – wie es der Fall wäre, wenn ein elektrisches Feld quer zum Kristall anliegen würde. Dann würde der Term E0 in (16.7) langsam mit dem Ort variieren und dem neuen Term, den wir in (16.53) hinzugefügt haben, entsprechen. (Sie wundern sich vielleicht, warum wir von (16.52) direkt zu (16.53) übergegangen sind, anstatt einfach die richtige Funktion für H(x, x� ) = � x | Hˆ | x� � anzugeben. Das haben wir getan, weil H(x, x� ) nur durch seltsame algebraische Funktionen ausgedrückt werden kann, während sich das gesamte Integral auf der rechten Seite von (16.52) aus Termen aufbaut, die Ihnen geläufig sind. Für Neugierige sei hier erwähnt, dass H(x, x� ) geschrieben werden kann als H(x, x� ) = −
2 �� δ (x − x� ) + V(x) δ(x − x� ) , 2m
wobei δ�� die zweite Ableitung der Deltafunktion ist. Diese ziemlich seltsame Funktion kann durch einen etwas bequemeren algebraischen Differentialoperator ersetzt werden, der vollkommen gleichwertig ist: 2 ∂2 H(x, x� ) = − + V(x) δ(x − x� ) . 2m ∂x2
Wir werden diese Formen nicht benutzen, sondern direkt mit der Form in (16.53) arbeiten.)
16.5 Die Schrödinger-Gleichung
333
Wenn wir jetzt den durch (16.53) gegebenen Ausdruck für das Integral in (16.51) verwenden, erhalten wir die folgende Differentialgleichung für ψ(x) = �x | ψ�: i
2 ∂2 ∂ψ =− ψ(x) + V(x) ψ(x) . ∂t 2m ∂x2
(16.54)
Es ist ziemlich naheliegend, was wir anstelle von (16.54) benutzen sollten, wenn wir an dreidimensionalen Bewegungen interessiert sind. Wir müssen lediglich ∂2 /∂x2 ersetzen durch ∇2 =
∂2 ∂2 ∂2 + 2+ 2 2 ∂x ∂y ∂z
und V(x) durch V(x, y, z). Die Amplitude ψ(x, y, z) für ein Elektron, das sich in einem Potential V(x, y, z) bewegt, genügt der Differentialgleichung i
2 ∂ψ = − ∇2 ψ + Vψ . ∂t 2m
(16.55)
Sie wird Schrödinger-Gleichung genannt und war die erste Gleichung der Quantenmechanik überhaupt. Sie wurde von Schrödinger aufgeschrieben bevor irgendeine der anderen Quantengleichungen, die wir in diesem Buch beschrieben haben, entdeckt wurde. Obwohl wir das Thema auf einem ganz anderen Weg in Angriff genommen haben, ereignete sich der große historische Moment, der die Geburt der quantenmechanischen Beschreibung der Materie markiert, als Schrödinger im Jahre 1926 zum erstenmal seine Gleichung aufschrieb. Lange Zeit war die innere atomare Struktur der Materie ein großes Rätsel. Niemand verstand wirklich, was die Materie zusammenhält, warum es chemische Bindungen gibt und vor allem wieso Atome stabil sind. Obwohl Bohr in der Lage war, eine Beschreibung der inneren Bewegung eines Elektrons im Wasserstoffatom zu geben, die das beobachtete Spektrum des von diesem Atom emittierten Lichtes zu erklären schien, blieb der Grund, warum sich Elektronen auf diese Art bewegen, ein Geheimnis. Schrödingers Entdeckung der richtigen Bewegungsgleichungen für Elektronen im atomaren Maßstab lieferte eine Theorie, nach der atomare Phänomene quantitativ, genau und detailliert berechnet werden können. Im Prinzip lassen sich mit Schrödingers Gleichung alle atomaren Phänomene erklären, bis auf jene, bei denen Magnetismus und Relativität eine Rolle spielen. Sie erklärt die Energieniveaus eines Atoms und alle Eigenschaften der chemischen Bindung. Dies gilt jedoch nur im Prinzip – die Mathematik wird schnell zu kompliziert, um irgendwelche Probleme außer den einfachsten exakt zu lösen. Nur das Wasserstoff- und das Heliumatom sind mit großer Genauigkeit berechnet worden. Mit verschiedenen Näherungen, von denen einige ziemlich grob sind, können jedoch viele Eigenschaften komplizierterer Atome und der chemischen Bindung der Moleküle verstanden werden. Wir haben einige dieser Näherungen in früheren Kapiteln vorgestellt. So, wie wir sie aufgeschrieben haben, berücksichtigt die Schrödinger-Gleichung keine magnetischen Effekte. Man kann diese Effekte näherungsweise berücksichtigen, indem man weitere Terme zu der Gleichung hinzufügt. Wie wir jedoch in Band III gesehen haben, ist der Magnetismus seinem Wesen nach ein relativistischer Effekt, und die korrekte Beschreibung der Bewegung eines Elektrons in einem beliebigen elektromagnetischen Feld kann daher nur durch eine geeignete relativistische Gleichung erfolgen. Die korrekte relativistische Gleichung für die Bewegung eines Elektrons wurde von Dirac entdeckt, ein Jahr nachdem Schrödinger seine
334
16 Die Ortsabhängigkeit der Amplituden
Gleichung aufgestellt hatte, und sie hat eine ganz andere Gestalt. Wir werden sie hier nicht besprechen können. Bevor wir fortfahren und uns einige Folgerungen aus der Schrödinger-Gleichung ansehen, wollen wir zeigen, wie sie für ein System mit einer großen Anzahl von Teilchen aussieht. Wir werden diese Gleichung nicht anwenden, sondern wollen nur zeigen, dass die Wellenfunktion ψ nicht einfach eine gewöhnliche Welle im Raum ist, sondern eine Funktion von vielen Variablen. Wenn viele Teilchen vorhanden sind, dann lautet die Gleichung i
∂ψ(r1 , r2 , r3 , . . .) 2 ∂2 ψ ∂2 ψ ∂2 ψ = − + 2 + 2 + V( r1 , r2 , . . .) ψ . ∂t 2mi ∂x2i ∂yi ∂zi i
(16.56)
Die Potentialfunktion V entspricht dem, was klassisch die gesamte potentielle Energie aller Teilchen ist. Wenn keine äußeren Kräfte auf die Teilchen wirken, ist die Funktion V einfach die elektrostatische Wechselwirkungsenergie aller Teilchen. Das heißt, wenn das i-te Teilchen die Ladung Zi qe trägt, dann ist die Funktion V einfach3 V( r1 , r2 , r3 , . . .) =
Zi Z j e2 . r i j alle
(16.57)
Paare
16.6
Quantisierte Energieniveaus
In einem späteren Kapitel werden wir ausführlich eine Lösung der Schrödinger-Gleichung für ein spezielles Beispiel betrachten. Hier wollen wir nur zeigen, wie eine der bemerkenswertesten Konsequenzen der Schrödinger-Gleichung zustande kommt – nämlich die überraschende Tatsache, dass eine Differentialgleichung, die nur kontinuierliche Funktionen von kontinuierlichen Variablen im Raum enthält, Quanteneffekte, wie die diskreten Energieniveaus in einem Atom, hervorbringen kann. Man muss vor allem verstehen, wie es kommt, dass ein Elektron, das durch eine Art „Potentialtopf“ auf einen begrenzten Raumbereich eingeschränkt ist, notwendigerweise nur die eine oder andere Energie aus einem gewissen wohldefinierten System diskreter Energien haben kann. V(x)
E x1
x2
x
Abb. 16.3: Ein Potentialtopf für ein Teilchen, das sich entlang der x-Achse bewegt.
Betrachten wir ein Elektron in nur einer Dimension. Die potentielle Energie des Elektrons möge sich mit x in der durch die Kurve in Abbildung 16.3 beschriebenen Weise ändern. Wir wollen annehmen, dass dieses Potential statisch ist – es ändert sich nicht mit der Zeit. Wie wir es schon 3
Wir verwenden die Konvention der früheren Bände, nach der e2 ≡ q2e /4π�0 ist.
16.6 Quantisierte Energieniveaus
335
vorher häufig gemacht haben, suchen wir nach Lösungen, die den Zuständen mit bestimmter Energie, das heißt mit bestimmter Frequenz, entsprechen. Probieren wir eine Lösung der Form ψ = a(x) e−iEt/ .
(16.58)
Wenn wir diese Funktion in die Schrödinger-Gleichung einsetzen, sehen wir, dass die Funktion a(x) der folgenden Differentialgleichung genügen muss: d2 a(x) 2m = 2 [V(x) − E] a(x) . dx2
(16.59)
Diese Gleichung besagt, dass an jedem Ort x die zweite Ableitung von a(x) nach x proportional zu a(x) ist, wobei der Proportionalitätsfaktor durch die Größe 2m/2 (V − E) gegeben ist. Die zweite Ableitung von a(x) ist die Änderungsrate des Anstiegs von a(x). Wenn das Potential V größer als die Energie E des Teilchens ist, hat die Änderungsrate des Anstiegs von a(x) dasselbe Vorzeichen wie a(x). Das bedeutet, dass sich die Kurve a(x) konkav von der x-Achse weg krümmt. Sie hat also mehr oder weniger den Charakter der positiven oder negativen Exponentialfunktion e±x . Dies bedeutet, dass in dem Bereich links von x1 in Abbildung 16.3, wo V größer als die angenommene Energie E ist, die Funktion a(x) wie die eine oder andere der in Teil (a) von Abbildung 16.4 gezeigten Kurven aussehen muss.
a(x)
a(x)
x
V>E (a)
x
V
Abb. 16.4: Mögliche Formen der Wellenfunktion a(x) für V > E und für V < E.
Wenn das Potential V dagegen kleiner als die Energie E ist, dann hat die zweite Ableitung von a(x) nach x das entgegengesetzte Vorzeichen von a(x) selbst, und die Kurve von a(x) wird sich immer zur x-Achse hin krümmen, wie eines der in Teil (b) der Abbildung 16.4 gezeigten Kurvenstücken. Die Lösung in solch einem Gebiet hat Stück für Stück ungefähr die Form einer Sinuskurve. Nun wollen wir sehen, wie wir graphisch eine Lösung für die Funktion a(x) konstruieren können, die einem Teilchen mit der Energie Ea in dem in Abbildung 16.3 gezeigten Potential V entspricht. Da wir eine Situation beschreiben möchten, in der ein Teilchen im Innern des Potentialtopfes gebunden ist, suchen wir nach Lösungen, bei denen die Wellenamplitude sehr kleine Werte annimmt, wenn x ein Stück außerhalb des Potentialtopfes liegt. Wir können uns leicht eine Kurve wie die in Abbildung 16.5 vorstellen, die für große negative Werte von x gegen null
336
16 Die Ortsabhängigkeit der Amplituden
V
Ea x1
a(x)
x2
x
x Abb. 16.5: Eine Wellenfunktion für die Energie Ea , die für negative x gegen null geht.
strebt und die allmählich anwächst, wenn sie sich x1 nähert. Da V bei x1 gleich Ea ist, ist die Krümmung der Funktion in diesem Punkt null. Zwischen x1 und x2 ist die Größe V − Ea immer eine negative Zahl, sodass sich die Funktion a(x) immer zur Achse hin krümmt, und die Krümmung wird umso stärker, je größer die Differenz zwischen Ea und V ist. Wenn wir die Kurve in den Bereich zwischen x1 und x2 fortsetzen, wird sie mehr oder weniger wie in Abbildung 16.5 verlaufen. a(x)
x1
x2
x Abb. 16.6: Die Wellenfunktion a(x) von Abbildung 16.5 über x2 hinaus fortgesetzt.
Nun wollen wir die Kurve in das Gebiet rechts von x2 fortsetzen. Dort krümmt sie sich von der Achse weg und strebt gegen hohe positive Werte (siehe Abbildung 16.6). Bei der gewählten Energie Ea wird die Lösung für a(x) mit wachsendem x immer größer. Tatsächlich nimmt die Krümmung ständig zu (wenn das Potential weiterhin flach bleibt). Die Amplitude erreicht schnell riesige Beträge. Das bedeutet, dass das Teilchen nicht im Potentialtopf „gebunden“ ist. Es ist unendlich viel wahrscheinlicher, dass es außerhalb des Topfes gefunden wird als innerhalb. Bei der von uns konstruierten Lösung ist es wahrscheinlicher, das Elektron bei x = +∞ zu finden als irgendwo anders. Es ist uns nicht geglückt, eine Lösung für ein gebundenes Teilchen zu finden. Versuchen wir es mit einer anderen Energie, die etwas größer ist als Ea , etwa der Energie Eb in Abbildung 16.7. Wenn wir auf der linken Seite mit denselben Verhältnissen beginnen, erhalten wir die im unteren Teil von Abbildung 16.7 dargestellte Lösung.Zunächst sieht es so aus, als ob
16.6 Quantisierte Energieniveaus
337
V
Eb Ea x
a(x)
x Abb. 16.7: Die Wellenfunktion a(x) für eine Energie Eb , die größer als Ea ist.
sie besser werden würde, aber sie hört schließlich genauso schlecht wie die Lösung für Ea auf – nur dass jetzt a(x) immer stärker negativ wird, wenn wir zu großen Werten von x gehen. Vielleicht ist das der Schlüssel. Da die geringe Änderung der Energie von Ea nach Eb bewirkt, dass die Kurve von der einen Seite der Achse zur anderen umklappt, gibt es vielleicht eine Energie, die zwischen Ea und Eb liegt, bei der die Kurve für große Werte von x gegen null strebt. Die gibt es tatsächlich, und wir haben in Abbildung 16.8 skizziert, wie die Lösung aussehen könnte. a(x)
V < Ec
V > Ec
x1
V > Ec
x2
Abb. 16.8: Eine Wellenfunktion für die Energie Ec , die zwischen Ea und Eb liegt.
Beachten Sie, dass die skizzierte Lösung sehr speziell ist. Wenn wir die Energie nur etwas erhöhen oder vermindern, ähnelt die entstehende Kurve einer der beiden gestrichelten Kurven in Abbildung 16.8, und wir hätten nicht die richtigen Bedingungen für ein gebundenes Teilchen. Unser Ergebnis ist also, dass ein Teilchen nur dann in einem Potentialtopf gebunden sein kann, wenn es eine ganz bestimmte Energie hat. Bedeutet das, dass es für ein Teilchen, das in einem Potentialtopf gebunden ist, nur eine mögliche Energie gibt? Nein. Andere Energien sind auch möglich, doch keine Energien, die zu dicht bei Ec liegen. Beachten Sie, dass die Wellenfunktion in Abbildung 16.8 die x-Achse zwischen x1 und x2 viermal schneidet. Wenn wir eine etwas niedrigere Energie als Ec nehmen würden, könnten wir eine Lösung erhalten, die die Achse nur dreimal, nur zweimal, nur einmal oder überhaupt nicht schneidet. Die möglichen Lösungen sind in Abbildung 16.9 skizziert. (Es
338
16 Die Ortsabhängigkeit der Amplituden E
V
5 4 3 2 1 0
a(x)
x
E0
E1
E2
E3
E4 Abb. 16.9: Die Funktion a(x) für die fünf niedrigsten gebundenen Energiezustände.
kann auch andere Lösungen geben, die höheren Werten der Energie als den gezeigten entsprechen.) Unsere Schlussfolgerung ist, dass ein gebundenes Teilchen in einem Potentialtopf nur ganz spezielle Werte aus einem diskreten Energiespektrum annehmen kann. Sie sehen wie eine Differentialgleichung die Grundaussage der Quantenphysik beschreiben kann. Abschließend merken wir an, dass es keine diskreten Lösungen mehr gibt und jede mögliche Energie erlaubt ist, wenn die Energie E über dem Rand des Potentialtopfes liegt. Solche Lösungen entsprechen der Streuung freier Teilchen an einem Potentialtopf. Wir haben ein Beispiel für solche Lösungen gesehen, als wir die Effekte von Fremdatomen in einem Kristall betrachtet haben.
17
Symmetrien und Erhaltungssätze
Siehe auch: Band II, Kapitel 27, Die Symmetrie in physikalischen Gesetzen. Literaturhinweis: Angular Momentum in Quantum Mechanics: A. R. Edmonds, Princeton University Press, 1957. (Deutsche Übersetzung: Drehimpulse in der Quantenmechanik, Bibliographisches Institut, Mannheim 1964).
17.1
Symmetrie
In der klassischen Physik gibt es eine Reihe von Größen, die erhalten bleiben – wie der Impuls, die Energie und der Drehimpuls. Erhaltungssätze für die entsprechenden Größen gibt es auch in der Quantenmechanik. Das Schönste an der Quantenmechanik ist, dass die Erhaltungssätze in gewissem Sinne aus etwas anderem hergeleitet werden können, während sie in der klassischen Mechanik praktisch den Ausgangspunkt der Gesetze bilden. (Es gibt in der klassischen Mechanik Methoden, um etwas Analoges zu dem durchzuführen, was wir in der Quantenmechanik tun werden, doch dies ist mathematisch sehr anspruchsvoll.) In der Quantenmechanik sind die Erhaltungssätze jedoch sehr tief mit dem Prinzip der Überlagerung von Amplituden und mit der Symmetrie physikalischer Systeme unter verschiedenen Transformationen verbunden. Das ist das Thema dieses Kapitels. Obwohl wir diese Konzepte hauptsächlich auf die Erhaltung des Drehimpulses anwenden werden, ist es ein wesentliches Charakteristikum der Quantenmechanik, dass die Sätze über Erhaltungsgrößen immer mit den Symmetrien des Systems verknüpft sind. Wir beginnen daher mit der Frage nach den Symmetrien von Systemen. Ein sehr einfaches Beispiel ist das Wasserstoffmolekül-Ion – wir könnten ebenso gut das Ammoniakmolekül nehmen –, bei dem es zwei Zustände gibt. Beim Wasserstoffmolekül-Ion hatten wir den einen Basiszustand so gewählt, dass sich das Elektron in der Nähe von Proton 1 befindet, und den anderen so, dass es sich in der Nähe von Proton 2 befindet. Die beiden Zustände, die wir mit | 1 � und | 2 � bezeichnet haben, sind noch einmal in Abbildung 17.1 (a) gezeigt.
Wenn die zwei Kerne genau gleich sind, gibt es eine Symmetrie in diesem physikalischen System. Das heißt, wenn wir das System an der Ebene in der Mitte zwischen den beiden Protonen spiegeln, dann erhalten wir die Verhältnisse von Abbildung 17.1 (b). Da die Protonen identisch sind, überführt die Operation der Spiegelung | 1 � in | 2 � und | 2 � in | 1 �. Wir wollen die Spiegelungsoperation mit Pˆ bezeichnen und schreiben Pˆ | 1 � = | 2 � ,
Pˆ | 2 � = | 1 � .
(17.1)
340
17 Symmetrien und Erhaltungssätze P
(a) |1�
(b)
e p
p
Pˆ | 1 �
e
p
p
e |2�
p
p
e Pˆ | 2 �
p
p
P Abb. 17.1: Wenn die Zustände | 1 � und | 2 � an der Ebene P-P gespiegelt werden, geht jeweils einer in den anderen über.
Unser Pˆ ist daher ein Operator in dem Sinne, dass er mit einem Zustand „etwas tut“, um einen neuen Zustand zu erzeugen. Das Interessante dabei ist, dass die Anwendung von Pˆ auf den einen Zustand den anderen Zustand des Systems erzeugt. ˆ wie jeder andere Operator, den wir beschrieben haben, Matrixelemente, die durch Nun hat P, die übliche, einleuchtende Notation angegeben werden können. Und zwar sind P11 = � 1 | Pˆ | 1 �
und
P12 = � 1 | Pˆ | 2 �
die Matrixelemente, die wir erhalten, wenn wir Pˆ | 1 � und Pˆ | 2 � von links mit � 1 | multiplizieren. Nach (17.1) sind sie � 1 | Pˆ | 1 � = P11 = � 1 | 2 � = 0 , � 1 | Pˆ | 2 � = P12 = � 1 | 1 � = 1 .
(17.2)
Auf analoge Weise erhalten wir P21 und P22 . Die Matrix von Pˆ – in Bezug auf das Basissystem | 1 � und | 2 � – ist ⎛ ⎞ ⎜⎜⎜0 1⎟⎟⎟ P = ⎜⎜⎝ (17.3) ⎟⎟⎠ . 1 0 Wir sehen wieder einmal, dass die Begriffe Operator und Matrix in der Quantenmechanik praktisch austauschbar sind. Es gibt kleine technische Unterschiede – wie der Unterschied zwischen einer „Ziffer“ und einer „Zahl“ – die Unterscheidung ist aber so pedantisch, dass wir uns darum nicht kümmern wollen. Ganz gleich also, ob Pˆ eine Operation definiert oder zur Definition einer Zahlenmatrix verwendet wird, wollen wir nach Belieben von einem Operator oder einer Matrix sprechen.
17.1 Symmetrie
341
Wir wollen nun annehmen, dass die Physik des gesamten Wasserstoffmolekül-Ion-Systems symmetrisch ist. Das muss nicht so sein – es hängt zum Beispiel davon ab, was sonst in der Nähe geschieht. Aber wenn das System symmetrisch ist, sollte der folgende Gedanke sicher richtig sein. Angenommen, wir beginnen bei t = 0 mit dem System im Zustand | 1 � und stellen nach einer Zeitspanne t fest, dass sich das System in einer viel komplizierteren Situation befindet – in einer Linearkombination der beiden Basiszustände. Erinnern Sie sich, dass wir in Kapitel 8 den „Ablauf einer Zeitspanne“ durch Multiplikation mit dem Operator Uˆ dargestellt haben. Das bedeutet, dass das System nach einer Weile – sagen wir nach √ 15 Sekunden, um konkret zu sein – in einem anderen Zustand ist. Zum Beispiel könnte er 2/3 Teile des Zustands √ | 1 � und i 1/3 Teile der Zustände | 2 � sein, und wir würden schreiben ˆ | ψ nach 15 s � = U(15, 0) | 1 � = 2/3 | 1 � + i 1/3 | 2 � . (17.4)
Nun fragen wir, was passiert, wenn wir das System in dem symmetrischen Zustand | 2 � beginnen lassen und unter denselben Bedingungen 15 Sekunden warten? Wenn die Welt, wie wir annehmen, symmetrisch ist, sollten wir den zu (17.4) symmetrischen Zustand erhalten: ˆ | ψ nach 15 s � = U(15, 0) | 2 � = 2/3 | 2 � + i 1/3 | 1 � . (17.5)
Wahrscheinlichkeit
Diese Überlegungen sind in Abbildung 17.2 illustriert. Wenn daher die Physik eines Systems symmetrisch bezüglich einer Ebene ist und wir das Verhalten eines speziellen Zustands berechnen, kennen wir auch das Verhalten des Zustands, den wir erhalten würden, wenn wir den ursprünglichen Zustand an der Symmetrieebene spiegeln.
|1�
|2�
nach der Zeit t
|1�
|2�
|1�
|2�
Wahrscheinlichkeit
(a)
|1�
|2�
nach der Zeit t
(b)
Abb. 17.2: Wenn sich in einem symmetrischen System ein reiner | 1 �-Zustand wie in Teil (a) entwickelt, dann wird sich ein reiner | 2 �-Zustand wie in Teil (b) entwickeln.
Wir möchten das gern etwas allgemeiner formulieren, das heißt, etwas abstrakter. Sei Qˆ irgendeine aus einer Reihe von Operationen, die Sie auf ein System anwenden können, ohne die Physik zu ändern. Qˆ könnte zum Beispiel die zuvor betrachtete Operation Pˆ sein, durch die das Wasserstoffmolekül an der Ebene zwischen den beiden Atomen gespiegelt wird. Oder in einem System mit zwei Elektronen könnten wir an die Operation eines Austausches der beiden Elektronen denken. Eine andere Möglichkeit wäre in einem kugelsymmetrischen System
342
17 Symmetrien und Erhaltungssätze
die Operation einer Drehung des gesamten Systems um einen endlichen Winkel um eine beliebige Achse – was an der Physik nichts ändern würde. Natürlich würden wir gern für jeden Spezialfall eine spezielle Bezeichnung anstelle von Qˆ verwenden. Insbesondere definieren wir Rˆ y (θ) als die Operation „drehe das System um die y-Achse um den Winkel θ“. Mit Qˆ meinen wir einfach irgendeinen der Operatoren, die wir beschrieben haben, oder einen anderen, der die grundlegende physikalische Situation unverändert lässt. Denken wir an einige weitere Beispiele. Wenn wir ein Atom ohne äußeres Magnetfeld oder ohne äußeres elektrisches Feld betrachten und wenn wir die Koordinaten um irgendeine Achse drehen, dann erhalten wir wieder dasselbe physikalische System. Das Ammoniakmolekül wiederum ist symmetrisch in Bezug auf die Spiegelung an einer Ebene, die parallel zu der der drei Wasserstoffatome liegt – solange kein elektrisches Feld vorhanden ist. Wenn ein elektrisches Feld da ist, müssten wir auch das elektrische Feld ändern, wenn wir eine Spiegelung ausführen, und das ändert das physikalische Problem. Aber wenn kein äußeres Feld vorliegt, ist das Molekül symmetrisch. Nun betrachten wir eine allgemeine Situation. Angenommen, wir beginnen mit dem Zustand | ψ1 � und nach einer Zeit oder unter anderen gegebenen physikalischen Bedingungen ist aus ihm der Zustand | ψ2 � geworden. Wir können schreiben | ψ2 � = Uˆ | ψ1 � .
(17.6)
(Ein Beispiel dafür hatten wir in (17.4) gesehen.) Nun stellen Sie sich vor, wir wenden die Operation Qˆ auf das gesamte System an. Der Zustand | ψ1 � wird in einen Zustand | ψ�1 � transformiert, den wir auch als Qˆ | ψ1 � schreiben können. Ebenso wird der Zustand | ψ2 � transformiert in | ψ�2 � = Qˆ | ψ2 �. Falls nun die Physik unter Qˆ symmetrisch ist (vergessen Sie nicht das falls – es ist keine allgemeine Eigenschaft von Systemen), dann sollte, wenn wir dieselbe Zeit lang unter denselben Bedingungen warten, gelten | ψ�2 � = Uˆ | ψ�1 � .
(17.7)
(Ein Beispiel dafür hatten wir in (17.5) gesehen.) Aber wir können Qˆ | ψ1 � für | ψ�1 � und Qˆ | ψ2 � für | ψ�2 � schreiben, sodass (17.7) auch geschrieben werden kann als Qˆ | ψ2 � = Uˆ Qˆ | ψ1 � .
(17.8)
Wenn wir jetzt | ψ2 � durch Uˆ | ψ1 � ersetzen – siehe (17.6) –, erhalten wir Qˆ Uˆ | ψ1 � = Uˆ Qˆ | ψ1 � .
(17.9)
Es ist nicht schwer zu verstehen, was das bedeutet. Wenn wir an das Wasserstoffion denken, heißt es: „Spiegeln und dann eine Weile warten“ (der Ausdruck auf der rechten Seite von (17.9)) ist dasselbe wie „eine Weile warten und dann spiegeln“ (der Ausdruck auf der linken Seite von (17.9)). Beide sollten gleich sein, solange sich Uˆ bei der Spiegelung nicht ändert. Da (17.9) für jeden Ausgangszustand | ψ1 � gilt, handelt es sich um eine Gleichung zwischen den Operatoren: Qˆ Uˆ = Uˆ Qˆ .
(17.10)
17.2 Symmetrie und Erhaltung
343
Das wollten wir erhalten – es ist eine mathematische Aussage über eine Symmetrie. Wenn Gleichung (17.10) gilt, sagen wir, dass die Operatoren Uˆ und Qˆ kommutieren. Wir können dann „Symmetrie“ folgendermaßen definieren: Ein physikalisches System ist in Bezug auf eine Opeˆ der Operation der Zeittranslation, kommutiert. (Wir könration Qˆ symmetrisch, wenn Qˆ mit U, nen das auch durch Matrizen ausdrücken. Das Produkt zweier Operatoren ist dem Matrizenprodukt gleichwertig. Daher gilt Gleichung (17.10) auch für die Matrizen Q und U für ein System, das symmetrisch unter der Transformation Q ist.) ˆ Übrigens, da Uˆ = 1 − iHδt/ für infinitesimale Zeiten δt gilt – wobei Hˆ der übliche HamiltonOperator ist (siehe Gleichung (8.37)) –, können Sie sehen, dass, wenn (17.10) gilt, auch Qˆ Hˆ = Hˆ Qˆ
(17.11)
gelten muss. Daher ist (17.11) die mathematische Formulierung der Bedingung für die Symˆ Diese Gleichung definiert eine metrie einer physikalischen Situation unter dem Operator Q. Symmetrie.
17.2
Symmetrie und Erhaltung
Bevor wir das soeben gefundene Ergebnis anwenden, möchten wir das Konzept der Symmetrie noch etwas vertiefen. Wir betrachten die spezielle Situation, dass wir nach Anwendung von Qˆ auf einen Zustand denselben Zustand wieder erhalten. Dies ist ein ganz spezieller Fall, aber wir wollen annehmen, dass zufällig für einen Zustand | ψ0 � gilt, dass | ψ� � = Qˆ | ψ0 � derselbe physikalische Zustand wie | ψ0 � ist. Das bedeutet, dass | ψ� � bis auf einen Phasenfaktor gleich | ψ0 � ist.1 Wie ist das möglich? Nehmen wir zum Beispiel an, dass wir ein H+2 -Ion in dem Zustand haben, den wir früher2 | I � genannt haben. Für diesen Zustand gibt es eine gleich große Amplitude, in den Basiszuständen | 1 � und | 2 � zu sein. Die Wahrscheinlichkeiten sind als Balkendarstellung in Abbildung 17.3 (a) gezeigt. Wenn wir den Spiegelungsoperator Pˆ auf | I � anwenden, klappt er den Zustand um, indem er | 1 � in | 2 � und | 2 � in | 1 � überführt – wir erhalten die in Abbildung 17.3 (b) gezeigten Wahrscheinlichkeiten. Aber das ist wieder genau der Zustand | I �. Wenn wir mit Zustand | II � beginnen, sehen die Wahrscheinlichkeiten vor und nach der Spiegelung genau gleich aus. Es gibt jedoch einen Unterschied, wenn wir die Amplituden betrachten. Für den Zustand | I � sind die Amplituden nach der Spiegelung dieselben, aber für den Zustand | II � haben die Amplituden entgegengesetzte Vorzeichen. Es gilt also | 1 � + | 2 � | 2 � + | 1 � Pˆ | I � = Pˆ = = |I� , √ √ 2 2 | 1 � − | 2 � | 2 � − | 1 � = = − | II � . Pˆ | II � = Pˆ √ √ 2 2
1
2
(17.12)
Übrigens können Sie zeigen, dass Qˆ notwendigerweise ein unitärer Operator ist – was bedeutet, dass wenn er auf | ψ � angewendet wird und dann eine Zahl mal | ψ � ergibt, die Zahl von der Form eiδ sein muss, wobei δ reell ist. Das ist ein nebensächlicher Punkt. Der Beweis beruht auf der folgenden Beobachtung. Bei keiner solchen Operation, wie einer Spiegelung oder Drehung, gehen Teilchen verloren. Daher muss die Normierung von | ψ� � und | ψ � dieselbe sein, sodass sie sich nur um einen rein imaginären Phasenfaktor unterscheiden können. Vgl. Abschnitt 10.1. Die Zustände | I � und | II � sind in diesem Abschnitt gegenüber der früheren Diskussion vertauscht.
344
17 Symmetrien und Erhaltungssätze
Wahrscheinlichkeit 1 |I�
(a)
1/2 0 |1�
Wahrscheinlichkeit 1 Pˆ | I �
|2� (b)
1/2 0 |1�
|2�
Abb. 17.3: Der Zustand | I � des H+2 -Ions und der Zustand Pˆ | I �, der durch eine Spiegelung von | I � an der Mittelebene erhalten wird.
Wenn wir schreiben Pˆ | ψ0 � = eiδ | ψ0 �, dann erhalten wir eiδ = 1 für den Zustand | I � und eiδ = −1 für den Zustand | II �.
Sehen wir uns ein anderes Beispiel an, und zwar ein RZ-polarisiertes Photon, das sich in zRichtung fortbewegt. Wenn wir die Operation einer Drehung um die z-Achse ausführen, wissen wir, dass dies die Amplitude einfach mit eiφ multipliziert, wobei φ der Drehwinkel ist. Daher ist δ für eine Drehoperation in diesem Fall einfach gleich dem Drehwinkel. Wenn nun ein Operator Qˆ die Phase eines Zustandes zur Zeit t = 0 ändert, dann gilt dies für alle Zeiten. Mit anderen Worten, wenn der Zustand | ψ1 � nach einer Zeit t in den Zustand | ψ2 � übergeht, d. h. ˆ 0) | ψ1 � = | ψ2 � , U(t,
(17.13)
und wenn wegen der Symmetrie der Situation Qˆ | ψ1 � = eiδ | ψ1 �
(17.14)
gilt, dann gilt auch Qˆ | ψ2 � = eiδ | ψ2 � .
(17.15)
Dies ist klar, da Qˆ | ψ2 � = Qˆ Uˆ | ψ1 � = Uˆ Qˆ | ψ1 �
und wenn Qˆ | ψ1 � = eiδ | ψ1 � ist, folgt
ˆ iδ | ψ1 � = eiδ Uˆ | ψ1 � = eiδ | ψ2 � . Qˆ | ψ2 � = Ue
(Die einzelnen Gleichheitszeichen folgen aus (17.13) und (17.10) für ein symmetrisches System, aus (17.14) und aus der Tatsache, dass eine Zahl wie eiδ mit einem Operator kommutiert.)
17.2 Symmetrie und Erhaltung
345
Für bestimmte Symmetrien gilt also etwas, was anfangs gültig ist, für alle Zeiten. Aber ist das nicht gerade ein Erhaltungssatz? Ja! Wenn Sie den ursprünglichen Zustand betrachten und durch eine kleine Nebenrechnung entdecken, dass eine Operation, die eine Symmetrieoperation des Systems ist, nur eine Multiplikation mit einer gewissen Phase erzeugt, dann wissen Sie, dass diese Eigenschaft auch für den Endzustand gilt – dieselbe Operation multipliziert den Endzustand mit demselben Phasenfaktor. Dies ist immer richtig, auch wenn wir vielleicht sonst nichts über den inneren Mechanismus des Universums wissen, der ein System aus einem Anfangs- in einen Endzustand umwandelt. Auch wenn wir die Einzelheiten der Vorgänge nicht betrachten wollen, durch die das System von einem Zustand in den anderen gelangt, können wir doch zumindest Folgendes sagen: Wenn ein Objekt in einem Zustand ist, der ursprünglich einen gewissen Symmetriecharakter hat, und wenn der Hamilton-Operator für dieses Objekt unter dieser Symmetrieoperation symmetrisch ist, dann behält der Zustand für immer diesen Symmetriecharakter. Das ist die Grundlage aller Erhaltungssätze der Quantenmechanik. ˆ Betrachten wir als spezielles Beispiel noch einmal den P-Operator. Wir wollen zunächst unsere Definition von Pˆ etwas modifizieren. Und zwar werden wir für Pˆ keine Spiegelreflexion nehmen, weil das die Definition der Ebene erfordert, in die wir den Spiegel stellen. Es gibt eine besondere Reflexionsart, die nicht die Angabe einer Ebene verlangt. Wir definieren die Operation Pˆ nun folgendermaßen: Zuerst spiegeln wir an einem Spiegel in der z-Ebene, sodass z in −z übergeht, x bleibt x und y bleibt y; dann drehen wir das System um 180◦ um die z-Achse, sodass x in −x überführt wird und y in −y. Die ganze Operation heißt Inversion. Jeder Punkt wird durch den Ursprung in die diametral gegenüberliegende Position projiziert. Sämtliche Koordinaten von allen Objekten werden umgekehrt. Wir wollen für diese Operation weiterhin das Symbol Pˆ benutzen. Sie ist in Abbildung 17.4 gezeigt. Sie ist etwas bequemer als eine einfache Spiegelung, weil sie nicht verlangt, die Ebene der Spiegelung anzugeben – es muss nur der Punkt angegeben werden, der im Symmetriezentrum liegt. A
z
(a)
z
(b)
r
r
y
y x
x
−r
A� ˆ Was im Punkt A bei (x, y, z) liegt, wird zum Punkt A� bei Abb. 17.4: Die Operation der Inversion P. (−x, −y, −z) befördert.
Nun wollen wir einen Zustand | φ0 � betrachten, der bei der Inversionsoperation in eiδ | ψ0 � übergeht, d. h. | ψ�0 � = Pˆ | ψ0 � = eiδ | ψ0 � .
(17.16)
346
17 Symmetrien und Erhaltungssätze
Dann invertieren wir erneut. Nach zwei Inversionen sind wir wieder dort angelangt, wo wir begonnen haben – es hat sich überhaupt nichts geändert. Es gilt daher Pˆ | ψ�0 � = Pˆ · Pˆ | ψ0 � = | ψ0 � . Es ist aber ˆ iδ | ψ0 � = eiδ Pˆ | ψ0 � = (eiδ )2 | ψ0 � . Pˆ · Pˆ | ψ0 � = Pe Es folgt (eiδ )2 = 1 . Wenn daher der Inversionsoperator eine Symmetrieoperation eines Zustandes ist, gibt es nur zwei Möglichkeiten für eiδ , nämlich eiδ = ±1 . Damit gilt Pˆ | ψ0 � = | ψ0 �
oder
Pˆ | ψ0 � = − | ψ0 � .
(17.17)
Im klassischen Sinne ergibt die Operation, wenn ein Zustand bei einer Inversion symmetrisch ist, wieder denselben Zustand. In der Quantenmechanik jedoch gibt es zwei Möglichkeiten: Wir erhalten denselben Zustand oder minus denselben Zustand. Wenn wir denselben Zustand erhalten, also Pˆ | ψ0 � = | ψ0 �, sagen wir, dass der Zustand | ψ0 � gerade Parität hat. Wenn das Vorzeichen umgekehrt wird, also Pˆ | ψ0 � = − | ψ0 �, sagen wir, dass der Zustand ungerade Parität hat. (Der Inversionsoperator Pˆ wird auch Paritätsoperator genannt.) Der Zustand | I � des H+2 -Ions hat gerade Parität; und der Zustand | II � hat ungerade Parität – siehe (17.12). Es gibt natürlich Zustände, die bei der Operation Pˆ nicht symmetrisch sind; dies sind Zustände ohne bestimmte Parität. Im H+2 -System zum Beispiel hat der Zustand | I � gerade Parität, der Zustand | II � hat ungerade Parität und der Zustand | 1 � hat keine bestimmte Parität.
Wenn wir über eine Operation wie die Inversion sprechen, die „auf ein physikalisches System“ angewendet wird, können wir uns das auf zwei Arten vorstellen. Wir können sie als eine physikalische Bewegung ansehen, die das, was sich bei r befindet, in den inversen Punkt bei −r überführt. Oder wir stellen uns vor, dass wir das unveränderte System in einem neuen Bezugssystem x� , y� , z� betrachten, das mit dem alten verknüpft ist durch x� = −x, y� = −y und z� = −z. Analog dazu können wir, wenn wir Drehungen betrachten, an eine Drehung eines physikalischen Systems denken oder an eine Drehung des Koordinatensystems, während wir das physikalische System im Raum festhalten. Im Allgemeinen sind die beiden Standpunkte im Wesentlichen äquivalent. Bei Drehungen sind sie äquivalent mit dem Zusatz, dass die Drehung eines Systems um den Winkel θ äquivalent zu einer Drehung des Bezugssystems um das Negative von θ ist. Wir haben gewöhnlich betrachtet, was geschieht, wenn eine Projektion auf ein neues Koordinatensystem erfolgt. Was Sie auf diese Art erhalten, ist dasselbe wie das, was Sie erhalten, wenn Sie die Achsen festhalten und das System rückwärts um denselben Betrag drehen. Wenn Sie dies tun, werden die Vorzeichen der Winkel vertauscht.3 3
In anderen Büchern werden Sie eventuell Formeln mit anderen Vorzeichen finden. Dann wird möglicherweise eine andere Definition der Winkel benutzt.
17.2 Symmetrie und Erhaltung
347
Viele Gesetze der Physik – aber nicht alle – bleiben bei einer Spiegelung oder einer Inversion der Koordinaten unverändert. Sie sind bezüglich einer Inversion symmetrisch. Die Gesetze der Elektrodynamik zum Beispiel bleiben unverändert, wenn wir in allen Gleichungen x in −x, y in −y und z in −z umändern. Dasselbe gilt für die Gravitationsgesetze und für die starke Wechselwirkung der Kernphysik. Nur die schwache Wechselwirkung – die für den β-Zerfall verantwortlich ist – hat diese Symmetrie nicht. (Wir haben dies ausführlich in Band II, Kapitel 27 besprochen.) Im Moment wollen wir β-Zerfälle nicht berücksichtigen. Dann kommutieren in jedem physikalischen System, von dem man nicht erwartet, dass β-Zerfälle einen signifikanten Effekt haben, – ein Beispiel wäre die Lichtemission durch ein Atom – der Hamilton-Operator ˆ Unter diesen Umständen gilt der folgende Satz: Wenn ein ZuHˆ und der Inversionsoperator P. stand ursprünglich gerade Parität hat und wenn wir dann die physikalische Situation zu einem späteren Zeitpunkt betrachten, wird er immer noch gerade Parität haben. Zum Beispiel nehmen wir an, dass ein Atom, das gerade ein Photon aussenden will, in einem Zustand ist, von dem wir wissen, dass er gerade Parität hat. Wenn wir das gesamte System – einschließlich des Photons – nach der Emission betrachten, wird es immer noch gerade Parität haben (Analoges gilt, wenn wir mit ungerader Parität beginnen.) Dieses Prinzip wird Erhaltung der Parität genannt. Sie können sehen, warum die Begriffe „Erhaltung der Parität“ und „Inversionssymmetrie“ in der Quantenmechanik so eng miteinander verflochten sind. Während man noch bis vor einigen Jahren dachte, dass die Natur immer die Parität erhält, weiß man inzwischen, dass dies nicht stimmt. Man hat entdeckt, die β-Zerfallsreaktion nicht die Inversionssymmetrie hat, die man in den anderen Gesetzen der Physik vorfindet. Nun können wir einen interessanten Satz beweisen (der richtig ist, solange wir die schwache Wechselwirkung vernachlässigen können): Jeder Zustand mit bestimmter Energie, der nicht entartet ist, muss eine bestimmte Parität haben. Er muss entweder gerade Parität oder ungerade Parität haben. (Bedenken Sie, dass wir manchmal Systeme gesehen haben, bei denen mehrere Zustände dieselbe Energie haben – wir nennen solche Zustände entartet. Unser Satz trifft für sie nicht zu.) Bei einem Zustand | ψ0 � mit bestimmter Energie wissen wir, dass Hˆ | ψ0 � = E | ψ0 � ,
(17.18)
ˆ der wobei E einfach eine Zahl ist – die Energie des Zustands. Für einen beliebigen Operator Q, ein Symmetrieoperator des Systems ist, gilt Qˆ | ψ0 � = eiδ | ψ0 � ,
(17.19)
solange | ψ0 � ein eindeutiger Zustand mit bestimmter Energie ist. Betrachten wir den neuen Zustand | ψ�0 �, den wir nach Anwendung von Qˆ erhalten. Wenn die Physik symmetrisch ist, dann muss | ψ�0 � dieselbe Energie wie | ψ0 � haben. Wir haben aber eine Situation betrachtet, in der es nur einen Zustand mit dieser Energie gibt, nämlich | ψ0 �, daher muss | ψ�0 � derselbe Zustand sein – er kann sich von | ψ0 � nur um eine Phase unterscheiden. Das ist das physikalische Argument. Dasselbe folgt aus der Mathematik. Unsere Definition der Symmetrie ist Gleichung (17.10) bzw. Gleichung (17.11). Die Gleichheit gilt für jeden Zustand | ψ �, d. h. Hˆ Qˆ | ψ � = Qˆ Hˆ | ψ � .
(17.20)
348
17 Symmetrien und Erhaltungssätze
Aber wir betrachten einen Zustand | ψ0 �, der ein Zustand mit bestimmter Energie ist, sodass Hˆ | ψ0 � = E | ψ0 � ist. Da E einfach eine Zahl ist, die vor den Operator gezogen werden kann, erhalten wir Damit ist
ˆ | ψ0 � = E Qˆ | ψ0 � . Qˆ Hˆ | ψ0 � = QE Hˆ Qˆ | ψ0 � = E Qˆ | ψ0 � .
(17.21)
ˆ und zwar mit demselben E. Daher ist | ψ�0 � = Qˆ | ψ0 � auch ein Energieeigenzustand von H, Nach unserer Voraussetzung gibt es aber nur einen solchen Zustand; es muss | ψ�0 � = eiδ | ψ0 � sein. Was wir eben bewiesen haben, gilt für jeden Symmetrieoperator Qˆ des physikalischen Systems. Daher erhalten wir in einer Situation, in der wir nur elektromagnetische Kräfte und starke Wechselwirkungen betrachten – und keinen β-Zerfall –, sodass die Inversionssymmetrie eine erlaubte Näherung ist, dass Pˆ | ψ � = eiδ | ψ � ist. Wir haben aber auch gesehen, dass eiδ entweder +1 oder −1 sein muss. Daher hat jeder Zustand mit bestimmter Energie (der nicht entartet ist) entweder gerade oder ungerade Parität.
17.3
Die Erhaltungssätze
Wir wenden uns jetzt einer anderen interessanten Operation zu: der Drehung. Wir betrachten den Spezialfall eines Operators, der ein atomares System um den Winkel φ um die z-Achse dreht. Wir wollen diesen OperatorRˆ z(φ) nennen.4 Wir nehmen an, dass es keine Störungen entlang der x- und y-Achse gibt. Von jedem eventuell vorhandenen elektrischen oder magnetischen Feld nehmen wir an, dass es parallel zur z-Achse ist5 , sodass sich die äußeren Bedingungen nicht ändern, wenn wir das ganze physikalische System um die z-Achse drehen. Wenn wir zum Beispiel ein Atom im Vakuum betrachten und wir das Atom um den Winkel φ um die z-Achse drehen, haben wir wieder dasselbe physikalische System. Dann gibt es spezielle Zustände, die die Eigenschaft haben, dass ein solcher Operator einen neuen Zustand erzeugt, der gleich dem ursprünglichen Zustand multipliziert mit einem Phasenfaktor ist. Die folgende kurze Abschweifung soll Ihnen zeigen, dass, wenn dies wahr ist, die Phasenänderung immer proportional zum Winkel φ sein muss. Angenommen, wir würden zweimal um den Winkel φ drehen. Das ist dasselbe wie eine Drehung um den Winkel 2φ. Wenn eine Drehung um φ den Effekt hat, den Zustand | ψ0 � mit einer Phase eiδ zu multiplizieren, sodass Rˆ z (φ) | ψ0 � = eiδ | ψ0 � ,
würden zwei solche Drehungen nacheinander den Zustand mit dem Faktor (eiδ )2 = ei2δ multiplizieren, da 4 5
Rˆ z (φ)Rˆ z(φ) | ψ0 � = Rˆ z (φ)eiδ | ψ0 � = eiδ Rˆ z (φ) | ψ0 � = eiδ eiδ | ψ0 � .
Ganz genau wollen wir Rˆ z (φ) als eine Drehung des physikalischen Systems um −φ um die z-Achse definieren, was dasselbe ist wie eine Drehung des Koordinatensystems um +φ. Wir können z immer in Richtung des Feldes wählen, vorausgesetzt, es gibt gleichzeitig nur ein Feld und seine Richtung ändert sich nicht.
17.3 Die Erhaltungssätze
349
Die Phasenänderung δ muss also proportional zu φ sein6 . Wir betrachten damit jene speziellen Zustände | ψ0 �, für die gilt Rˆ z (φ) | ψ0 � = eimφ | ψ0 � ,
(17.22)
wobei m eine reelle Zahl ist. Wir kennen auch die bemerkenswerte Tatsache, dass, wenn das System symmetrisch unter einer Drehung um z ist, und wenn für den ursprünglichen Zustand (17.22) gilt, er dieselbe Eigenschaft auch weiterhin haben wird. Die Zahl m ist daher sehr wichtig. Wenn wir ihren Wert am Anfang kennen, dann kennen wir auch ihren Wert am Ende des Spiels. Es ist eine Zahl, die erhalten bleibt – m ist eine Konstante der Bewegung. Wir geben m als eigenständigen Faktor im Exponenten an, weil m nichts mit dem speziellen Winkel φ zu tun hat und auch weil m eine Entsprechung in der klassischen Mechanik hat. In der Quantenmechanik wollen wir m – bei solchen Zuständen wie | ψ0 � – den Drehimpuls um die z-Achse nennen. Wenn wir dies tun, sehen wir, dass im Grenzwert großer Systeme diese Größe gleich der z-Komponente des Drehimpulses der klassischen Mechanik ist. Wenn wir daher einen Zustand betrachten, bei dem eine Drehung um die z-Achse einfach einen Phasenfaktor eimφ erzeugt, dann ist dies ein Zustand mit bestimmtem Drehimpuls um diese Achse, und der Drehimpuls bleibt erhalten. Er ist m – jetzt und für immer. Natürlich können Sie um jede Achse drehen und Sie bekommen die Erhaltung des Drehimpulses für die verschiedenen Achsen. Sie sehen, dass die Erhaltung des Drehimpulses in Beziehung steht zu der Tatsache, dass Sie bei einer Drehung des Systems wieder denselben Zustand erhalten, nur mit einem neuen Phasenfaktor. Wir wollen nun zeigen, wie allgemein dieser Gedanke ist. Wir wollen ihn auf zwei andere Erhaltungssätze anwenden, die in den physikalischen Konzepten der Erhaltung des Drehimpulses entsprechen. In der klassischen Physik kennen wir auch noch die Erhaltung des Impulses und die Erhaltung der Energie, und es ist interessant zu sehen, dass beide auf dieselbe Art mit einer physikalischen Symmetrie verknüpft sind. Betrachten wir ein physikalisches System, zum Beispiel ein Atom, irgendeinen komplizierten Kern oder ein Molekül, und nehmen wir an, dass es keinen Unterschied macht, wenn wir das ganze System nehmen und es zu einem anderen Platz hinüberschaffen. Wir haben dann einen Hamilton-Operator mit der Eigenschaft, dass er nur von den inneren Koordinaten abhängt und nicht von der absoluten Lage im Raum. Dann gibt es eine spezielle Symmetrieoperation, die eine Translation im Raum ist. Definieren wir Dˆ x (a) als die Operation einer Verschiebung um die Strecke a längs der x-Achse. Dann können wir diese Operation auf jeden beliebigen Zustand anwenden und einen neuen Zustand erhalten. Aber wieder kann es ganz spezielle Zustände geben, die die Eigenschaft haben, dass sie bis auf einen Phasenfaktor denselben Zustand ergeben, wenn sie um a entlang der x-Achse verschoben werden. Man kann auch beweisen, dass dann die Phase proportional zu a sein muss. Wir können daher für diese speziellen Zustände | ψ0 � schreiben Dˆ x (a) | ψ0 � = eika | ψ0 � .
(17.23)
Der Koeffizient k, multipliziert mit , wird die x-Komponente des Impulses genannt. Der Grund hierfür ist, dass diese Zahl numerisch gleich dem klassischen Impuls p x ist, wenn wir ein großes 6
Bei einem strengen Beweis müssen wir kleine Drehungen � betrachten. Da jeder beliebige Winkel φ als geeignetes Vielfaches von � geschrieben werden kann, also φ = n�, gilt Rˆ z (φ) = [Rˆ z (�)]n , und die gesamte Phasenänderung ist das n-Fache der Phasenänderung für den kleinen Winkel � und daher proportional zu φ.
350
17 Symmetrien und Erhaltungssätze
System haben. Allgemein können wir Folgendes sagen: Wenn der Hamilton-Operator bei einer Verschiebung des Systems unverändert bleibt und wenn der Zustand mit einem bestimmten Impuls in x-Richtung beginnt, dann bleibt der Impuls in x-Richtung im weiteren Verlauf der Zeit derselbe. Der Gesamtimpuls eines Systems vor und nach Zusammenstößen – oder nach Explosionen oder was auch immer – wird derselbe sein. Es gibt eine andere Operation, die ganz analog zur Verschiebung im Raum ist: eine zeitliche Verschiebung. Betrachten wir eine physikalische Situation, in der es nichts Äußeres gibt, das von der Zeit abhängt, und stellen wir uns vor, wir lassen das System zu einem bestimmten Zeitpunkt in einem gegebenen Zustand starten. Wenn wir jetzt dasselbe System (in einem anderen Experiment) zwei Sekunden später starten lassen – oder sagen wir um eine Zeitspanne τ verzögert – und wenn die äußeren Bedingungen nicht von der absoluten Zeit abhängen, dann ist die Entwicklung dieselbe und der Endzustand ist derselbe wie der andere Endzustand, nur dass er um die Zeitspanne τ später eintritt. Unter diesen Umständen können wir auch spezielle Zustände finden, die die Eigenschaft haben, sich zeitlich so zu entwickeln, dass der zeitverschobene Zustand gerade der alte multipliziert mit einem Phasenfaktor ist. Wieder ist es klar, dass bei diesen speziellen Zuständen die Phasenänderung proportional zu τ sein muss. Wir können schreiben Dˆ t (τ) | ψ0 � = e−iωτ | ψ0 � .
(17.24)
Es ist üblich, bei der Definition von ω das negative Vorzeichen zu benutzen; mit dieser Konvention ist ω die Energie des Systems, und sie bleibt erhalten. Daher ist ein System mit bestimmter Energie eines, das sich selbst reproduziert, multipliziert mit e−iωτ , wenn es um τ zeitlich verschoben wird. (Das ist dasselbe, was wir zuvor für einen Quantenzustand mit bestimmter Energie gesagt haben; wir sind daher selbstkonsistent.) Wenn sich also ein System in einem Zustand mit bestimmter Energie befindet und wenn der Hamilton-Operator nicht von t abhängt, dann wird das System unabhängig von dem, was passiert, zu allen späteren Zeiten dieselbe Energie haben. Sie sehen daher die Beziehung zwischen den Erhaltungssätzen und der Symmetrie der Welt. Symmetrie bezüglich zeitlicher Verschiebungen impliziert die Erhaltung der Energie; Symmetrie bezüglich der Lage in x, y bzw. z impliziert die Erhaltung der entsprechenden Komponente des Impulses. Symmetrie bezüglich Drehungen um die x-, y- bzw. z-Achse impliziert die Erhaltung der x-, y- bzw. z-Komponente des Drehimpulses. Symmetrie bezüglich Spiegelung impliziert die Erhaltung der Parität. Symmetrie bezüglich des Austausches zweier Elektronen impliziert die Erhaltung von etwas, für das wir keinen Namen haben. Einige dieser Prinzipien haben klassische Entsprechungen und andere nicht. Es gibt in der Quantenmechanik mehr Erhaltungssätze als in der klassischen Mechanik – oder zumindest mehr, als man dort gewöhnlich benutzt. Damit Sie keine Schwierigkeiten haben, wenn Sie andere Bücher über Quantenmechanik lesen, müssen wir eine kleine technische Anmerkung zur verwendeten Notation machen. Die Operaˆ über die wir tion einer Verschiebung bezüglich der Zeit ist natürlich gerade die Operation U, vorher gesprochen haben: ˆ + τ, t) . Dˆ t (τ) = U(t
(17.25)
Die meisten Physiker beschreiben gern alles durch infinitesimale zeitliche Verschiebungen oder durch infinitesimale räumliche Verschiebungen oder durch Drehungen um infinitesimale Win-
17.3 Die Erhaltungssätze
351
kel. Da jede endliche Verschiebung und jeder endliche Winkel aus aufeinanderfolgenden infinitesimalen Verschiebungen bzw. Winkeln zusammengesetzt werden kann, ist es oft leichter, zuerst den infinitesimalen Fall zu untersuchen. Der Operator einer infinitesimalen zeitlichen Verschiebung Δt ist nach unserer Definition in Kapitel 8 i Dˆ t (Δt) = 1 − Δt Hˆ .
(17.26)
Dann ist Hˆ analog zu der klassischen Größe, die wir Energie nennen, denn wenn Hˆ | ψ � eine Konstante mal | ψ � ist, also Hˆ | ψ � = E | ψ �, dann ist diese Konstante die Energie des Systems.
Dasselbe wird bei den anderen Operationen gemacht. Wenn wir eine kleine Verschiebung Δx in x vornehmen, wird ein Zustand | ψ � im Allgemeinen in einen anderen Zustand | ψ� � übergehen. Wir können schreiben i | ψ� � = Dˆ x (Δx) | ψ � = 1 + pˆ x Δx | ψ � ,
(17.27)
denn wenn Δx gegen null geht, muss | ψ� � gleich | ψ � sein, was gleichbedeutend ist mit Dˆ x (0) = 1, und für kleine Δx muss Dˆ x (Δx) eine Abweichung von 1 haben, die proportional zu Δx ist. Der auf diese Weise definierte Operator pˆ x wird der Impulsoperator genannt – natürlich für die x-Komponente. Aus denselben Gründen schreibt man gewöhnlich für kleine Drehungen i Rˆ z (Δφ) | ψ � = 1 + Jˆz Δφ | ψ �
(17.28)
und nennt Jˆz den Operator der z-Komponente des Drehimpulses. Bei jenen speziellen Zuständen, für die Rˆ z (φ) | ψ0 � = eimφ | ψ0 � gilt, können wir für einen beliebigen kleinen Winkel Δφ die rechte Seite bis zur ersten Ordnung in Δφ entwickeln und erhalten Rˆ z (Δφ) | ψ0 � = eimΔφ | ψ0 � = (1 + im Δφ) | ψ0 � . Wenn wir dies mit der Definition von Jˆz in Gleichung (17.28) vergleichen, erhalten wir Jˆz | ψ0 � = m | ψ0 � .
(17.29)
Mit anderen Worten, wenn Sie Jˆz auf einen Zustand mit einem bestimmten Drehimpuls um die z-Achse anwenden, erhalten Sie m mal denselben Zustand, wobei m der Wert der zKomponente des Drehimpulses ist. Es ist ganz analog zur Anwendung von Hˆ auf einen Zustand mit bestimmter Energie, wodurch man E | ψ � erhält.
Wir möchten jetzt einige Anwendungen der Idee der Erhaltung des Drehimpulses vorstellen, um zu zeigen, wie sie sich auswirken. Entscheidend ist, dass sie wirklich sehr einfach sind. Dass der Drehimpuls erhalten bleibt, wussten Sie schon vorher. Das Einzige, was Sie wirklich aus diesem Kapitel behalten müssen, ist, dass ein Zustand | ψ0 � die z-Komponente des Drehimpulses m hat, wenn er durch eine Drehung um einen Winkel φ um die z-Achse in eimφ | ψ0 � überführt wird. Mehr brauchen wir nicht, um eine Reihe interessanter Dinge durchzuführen.
352
17 Symmetrien und Erhaltungssätze
17.4
Polarisiertes Licht
Zunächst einmal möchten wir eine Vorstellung überprüfen. In Abschnitt 11.4 hatten wir gezeigt, dass RZ-polarisiertes Licht in einem um den Winkel φ um die z-Achse7 gedrehten Koordinatensystem mit eiφ multipliziert wird. Bedeutet das dann, dass die rechtszirkular polarisierten Lichtphotonen einen Drehimpuls von einer Einheit8 längs der z-Achse mit sich führen? Das bedeutet es tatsächlich. Es bedeutet auch, dass ein Lichtstrahl, der eine große Zahl von Photonen enthält, die alle auf dieselbe Art zirkular polarisiert sind – wie es in einem klassischen Strahl der Fall ist –, einen Drehimpuls mit sich führt. Wenn W die Gesamtenergie ist, die der Strahl in einer gewissen Zeit befördert, dann sind daran N = W/ω Photonen beteiligt. Jedes hat den Drehimpuls , sodass sich ein Gesamtdrehimpuls von Jz = N =
W ω
(17.30)
ergibt. Können wir klassisch beweisen, dass rechtszirkular polarisiertes Licht eine Energie und einen Drehimpuls proportional zu W/ω mit sich führt? Das sollte klassisch der Fall sein, wenn alles richtig ist. Hier haben wir eine Situation, in der wir von den Quantenverhältnissen zu den klassischen Verhältnissen übergehen können. Wir können prüfen, ob die klassische Physik richtig liegt. Es wird sich zeigen, ob es berechtigt ist, m den Drehimpuls zu nennen. Erinnern Sie sich, was rechtszirkular polarisiertes Licht klassisch ist. Es wird beschrieben durch ein elektrisches Feld mit einer oszillierenden x-Komponente und einer um 90◦ phasenverschobenen oszillierenden y-Komponente, sodass der resultierende elektrische Vektor E auf einem Kreis umläuft (siehe Abbildung 17.5 (a)). Nun nehmen wir an, dass dieses Licht auf eine Wand scheint, die es absorbiert – oder zumindest etwas davon – und wir betrachten ein Atom in der Wand nach den Methoden der klassischen Physik. Wir haben oft die Bewegung des Elektrons im Atom als harmonischen Oszillator beschrieben, der durch ein äußeres elektrisches Feld in Schwingungen versetzt werden kann. Wir wollen annehmen, dass das Atom isotrop ist, sodass es gleich gut in der x- wie in der y-Richtung schwingen kann. Dann sind beim zirkular polarisierten Licht die x- und die yVerschiebungen gleich groß, aber eine läuft um 90◦ hinter der anderen hinterher. Das Ergebnis ist, dass sich das Elektron auf einem Kreis bewegt wie in Abbildung 17.5 (b). Das Elektron ist um die Strecke r aus der Gleichgewichtslage am Ursprung verschoben und läuft mit einer Phasenverzögerung in Bezug auf den Vektor E um. Die Beziehung zwischen E und r könnte so sein wie in Abbildung 17.5 (b). Mit fortschreitender Zeit dreht sich das elektrische Feld, und r dreht sich mit derselben Frequenz, daher bleibt die relative Lage von E und r die gleiche. Nun ermitteln wir die Arbeit, die an diesem Elektron verrichtet wird. Die Energierate, die diesem Elektron zugeführt wird, ist v, die Geschwindigkeit des Elektrons, mal der Komponente von qE parallel zur Geschwindigkeit: dW = qEt v . dt 7 8
(17.31)
Achtung, dieser Winkel ist das Negative von dem, den wir in Abschnitt 11.4 benutzt haben. Es ist gewöhnlich sehr bequem, den Drehimpuls atomarer Systeme in Einheiten von zu messen. Dann kann man sagen, dass ein Spin- 12 -Teilchen den Drehimpuls ±1/2 bezüglich irgendeiner Achse hat. Oder allgemein, dass die z-Komponente des Drehimpulses m ist. Sie brauchen das nicht dauernd zu wiederholen.
17.4 Polarisiertes Licht
353
y
y
E
Et u
r
φ = ωt
E
Elektron x φ = ωt − φ0
x (b)
Abb. 17.5: (a) Das elektrische Feld E in einer zirkular polarisierten Lichtwelle. (b) Die Bewegung eines Elektrons, das durch das zirkular polarisierte Licht angetrieben wird.
(a)
Aber sehen Sie, da wird diesem Elektron Drehimpuls zugeführt, weil es immer ein Drehmoment um den Ursprung gibt. Das Drehmoment ist qEt r, was gleich der Änderungsrate des Drehimpulses dJz /dt sein muss: dJz = qEt r . dt
(17.32)
Wenn wir bedenken, dass v = ωr ist, erhalten wir 1 dJz = . dW ω Das Integral über den absorbierten Gesamtdrehimpuls ist daher proportional zur Gesamtenergie – wobei die Proportionalitätskonstante 1/ω ist, was mit (17.30) übereinstimmt. Licht führt durchaus Drehimpuls mit sich, und zwar eine Einheit (mal ) entlang der z-Achse, wenn es rechtszirkular polarisiert ist, und minus eine Einheit entlang der z-Achse, wenn es linkszirkular polarisiert ist. Stellen wir uns jetzt folgende Frage: Wenn das Licht in x-Richtung linear polarisiert ist, welchen Drehimpuls hat es dann? In x-Richtung polarisiertes Licht kann als Überlagerung von RZund LZ-polarisiertem Licht dargestellt werden. Daher gibt es eine gewisse Amplitude, dass der Drehimpuls + ist, und eine andere Amplitude, dass der Drehimpuls − ist. Das Licht hat daher keinen bestimmten Drehimpuls. Es hat eine Amplitude, mit +, und eine gleiche Amplitude, mit − aufzutreten. Die Interferenz dieser beiden Amplituden erzeugt die lineare Polarisation, aber es hat gleiche Wahrscheinlichkeiten, mit plus oder minus einer Einheit des Drehimpulses aufzutreten. Makroskopische Messungen an einem linear polarisierten Lichtstrahl zeigen, dass es keinen Drehimpuls mit sich führt, weil es bei einer großen Zahl von Photonen fast gleichviel RZ- wie LZ-Photonen gibt, die entgegengesetzte Beiträge zum Drehimpuls liefern – der mittlere Drehimpuls ist null. Und in der klassischen Theorie finden Sie keinen Drehimpuls, wenn nicht eine zirkulare Polarisation vorhanden ist. Wir haben gesagt, dass jedes Spin-eins-Teilchen drei Werte für Jz annehmen kann, nämlich +1, 0, −1 (die drei Zustände, die wir im Stern-Gerlach-Versuch gesehen haben). Aber Licht ist eigenartig; es hat nur zwei Zustände. Der Fall null tritt nicht auf. Dieser seltsame Mangel hängt
354
17 Symmetrien und Erhaltungssätze
mit der Tatsache zusammen, dass Licht nicht ruhen kann. Für ein ruhendes Teilchen mit einem Spin j gibt es 2 j + 1 mögliche Zustände, wobei die Werte von jz in Schritten von 1 von − j bis + j gehen. Es stellt sich aber heraus, dass für ein Teilchen mit dem Spin j und der Masse null nur die Zustände mit den Komponenten + j und − j in Bewegungsrichtung existieren. So hat das Licht nicht drei Zustände, sondern nur zwei – obwohl ein Photon ein Objekt mit Spin eins ist. Wie stimmt das mit unseren früheren Beweisen überein – die darauf basierten, was bei Drehungen im Raum geschieht –, dass für Spin-eins-Teilchen drei Zustände nötig sind? Bei einem Teilchen in Ruhe können Drehungen um eine beliebige Achse ohne Änderung des Impulszustandes ausgeführt werden. Teilchen mit Ruhemasse null (wie Photonen und Neutrinos) können nicht in Ruhe sein; nur Drehungen um die Achse in Bewegungsrichtung ändern den Impulszustand nicht. Argumente bezüglich Drehungen um nur eine Achse reichen nicht aus, um zu beweisen, dass drei Zustände erforderlich sind, wenn gegeben ist, dass einer von ihnen bei einer Drehung um den Winkel φ wie eiφ variiert.9 Noch eine Randbemerkung. Bei einem Teilchen mit der Ruhemasse null ist im Allgemeinen nur einer der beiden Spinzustände bezüglich der Bewegungsrichtung (+ j, − j) wirklich notwendig. Bei Neutrinos – die Spin- 21 -Teilchen sind – existieren in der Natur nur die Zustände, deren Drehimpulskomponente entgegengesetzt zur Bewegungsrichtung (−/2) ist (und in Richtung der Bewegung (+/2) bei Antineutrinos). Wenn ein System symmetrisch bezüglich Inversion ist (sodass die Parität erhalten bleibt, wie beim Licht), dann sind beide Komponenten (+ j und − j) erforderlich.
17.5
Der Zerfall des Λ0
Wir betrachten nun ein Beispiel dafür, wie man den Satz von der Erhaltung des Drehimpulses in einem spezifisch quantenmechanischen Problem anwendet. Wir betrachten den Zerfall des Lambda-Teilchens (Λ0 ), das durch die „schwache“ Wechselwirkung in ein Proton und ein π− Meson zerfällt: Λ0 → p + π − .
Wir nehmen an, dass das Pion den Spin null, das Proton den Spin 12 und das Λ0 den Spin 1 0 2 hat. Wir möchten dann folgendes Problem lösen: Angenommen, das Λ wird auf eine Art erzeugt, die bewirkt, dass es vollständig polarisiert ist – womit wir meinen, dass sein Spin bezüglich einer geeignet gewählten z-Achse „up“ ist (siehe Abbildung 17.6 (a)). Die Frage ist dann, mit welcher Wahrscheinlichkeit es so zerfällt, dass das Proton unter einem Winkel θ bezüglich der z-Achse wegfliegt (siehe Abbildung 17.6 (b)). Mit anderen Worten, wir suchen die Winkelverteilung der Zerfallsprodukte. Wir wollen den Zerfall in einem Koordinatensystem betrachten, in dem das Λ0 in Ruhe ist, d. h., wir wollen die Winkel in diesem Ruhesystem messen. Dann können sie jederzeit immer noch auf ein anderes System transformiert werden. Wir beginnen mit dem speziellen Fall, bei dem das Proton in einen kleinen Raumwinkel ΔΩ längs der z-Achse emittiert wird (siehe Abbildung 17.7). Vor dem Zerfall haben wir ein Λ0 9
Wir haben versucht, wenigstens einen Beweis dafür zu finden, dass die Komponente des Drehimpulses in Bewegungsrichtung für ein Teilchen der Masse null ein ganzzahliges Vielfaches von /2 sein muss – und nicht etwa /3. Auch bei Verwendung aller möglichen Eigenschaften der Lorentz-Transformation und dergleichen ist es uns nicht gelungen. Vielleicht ist es nicht richtig. Wir müssen darüber mit Prof. Wigner sprechen, der alles über solche Sachen weiß.
17.5 Der Zerfall des Λ0 vorher z
355
nachher z θ
p up
Λ
0
π−
uπ−
(a)
Abb. 17.6: Ein Λ0 mit Spin „up“ zerfällt in ein Proton und ein Pion (im Schwerpunktsystem). Wie groß ist die Wahrscheinlichkeit, dass das Proton im Winkel θ wegfliegt?
(b)
mit Spin „up“, wie in Teil (a) der Abbildung. Nach einer kurzen Zeit zerfällt das Λ0 in ein Proton und ein Pion – aus Gründen, von denen man nichts weiß, außer dass sie mit der schwachen Wechselwirkung zusammenhängen. Angenommen, das Proton läuft die +z-Achse hinauf. Dann muss wegen der Impulserhaltung das Pion nach unten laufen. Da das Proton ein Spin1 2 -Teilchen ist, muss sein Spin entweder „up“ oder „down“ sein – es gäbe im Prinzip die zwei in Teil (b) und (c) der Abbildung gezeigten Möglichkeiten. Die Erhaltung des Drehimpulses verlangt jedoch, dass das Proton den Spin „up“ hat. Dies sieht man ganz leicht mit dem folgenden Argument ein. Ein Teilchen, das sich entlang der z-Achse bewegt, kann um diese Achse keinen Drehimpuls aufgrund seiner Bewegung liefern; daher können nur die Spins zu Jz beitragen. Der Spindrehimpuls um die z-Achse ist vor dem Zerfall +/2, er muss daher auch nachher +/2 sein. Wir können sagen, dass der Spin des Protons „up“ sein muss, da das Pion keinen Spin hat. vorher
nachher
z
z
z p
p
up
up oder
Λ0
uπ−
uπ− π−
π−
(a)
ja (b)
nein (c)
Abb. 17.7: Zwei Möglichkeiten für den Zerfall eines Λ0 mit Spin „up“, bei dem das Proton in Richtung der +zAchse läuft. Nur (b) erhält den Drehimpuls.
Da Sie vielleicht argwöhnen, dass Argumente dieser Art in der Quantenmechanik nicht gelten, wollen wir uns einen Augenblick Zeit nehmen, um zu zeigen, dass sie doch gelten.
356
17 Symmetrien und Erhaltungssätze
Der Anfangszustand (vor dem Zerfall), den wir | Λ0 , Spin +z � nennen können, hat die Eigenschaft, dass, wenn er um den Winkel φ um die z-Achse gedreht wird, der Zustandsvektor mit dem Phasenfaktor eiφ/2 multipliziert wird. (Im gedrehten System ist der Zustandsvektor eiφ/2 | Λ0 , Spin +z �.) Das meinen wir mit Spin „up“ bei einem Spin- 21 -Teilchen. Da das Verhalten der Natur nicht von unserer Wahl der Achsen abhängt, muss der Endzustand (das Proton plus Pion) dieselbe Eigenschaft haben. Wir könnten den Endzustand schreiben als | Proton läuft nach +z, Spin +z; Pion läuft nach −z � . Aber eigentlich brauchen wir die Pionbewegung gar nicht anzugeben, da sich in dem gewählten Schwerpunktssystem das Pion immer entgegengesetzt zum Proton bewegt; wir können unsere Beschreibung des Endzustandes vereinfachen zu | Proton läuft nach +z, Spin +z � . Was passiert nun mit diesem Zustandsvektor, wenn wir die Koordinaten um den Winkel φ um die z-Achse drehen? Da sich sowohl das Proton als auch das Pion entlang der z-Achse bewegen, wird ihre Bewegung durch die Drehung nicht verändert. (Deshalb haben wir diesen Spezialfall gewählt; die Beweisführung würde sonst nicht funktionieren.) Auch sonst geschieht mit dem Pion nichts, weil sein Spin null ist. Das Proton hat jedoch den Spin 21 . Wenn sein Spin „up“ ist, wird die Drehung eine Phasenänderung von eiφ/2 beitragen. (Wenn sein Spin „down“ wäre, wäre die durch das Proton bewirkte Phasenänderung e−iφ/2 .) Aber die Phasenänderung durch die Drehung muss vorher und nachher dieselbe sein, wenn der Drehimpuls erhalten bleiben soll. (Und das muss der Fall sein, da es keine äußeren Einflüsse in dem Hamilton-Operator gibt.) Die einzige Möglichkeit ist daher, dass der Spin des Protons „up“ ist. Wenn das Proton nach oben läuft, muss auch sein Spin „up“ sein. Wir folgern daraus, dass die Erhaltung des Drehimpulses den in Teil (b) von Abbildung 17.7 gezeigten Prozess erlaubt, den in Teil (c) gezeigten Prozess dagegen nicht. Da wir sicher wissen, dass sich der Zerfall früher oder später ereignet, gibt es eine Amplitude für den Prozess (b) – das Proton geht nach oben mit Spin „up“. Wir wollen mit a die Amplitude bezeichnen, dass der Zerfall auf diese Art in einem infinitesimalen Zeitintervall eintritt.10 Schauen wir jetzt, was passieren würde, wenn der Λ0 -Spin anfänglich „down“ wäre. Wieder fragen wir nach den Zerfällen, bei denen das Proton längs der z-Achse nach oben geht (siehe Abbildung 17.8). Offensichtlich muss in diesem Fall das Proton den Spin „down“ haben, wenn der Drehimpuls erhalten bleibt. Sagen wir, dass die Amplitude für solch einen Zerfall b ist. Wir können weiter nichts über die Amplituden a und b aussagen. Sie hängen von den inneren Vorgängen im Λ0 und von der schwachen Wechselwirkung ab, und niemand weiß bis jetzt, wie man sie berechnet. Wir müssen sie aus dem Experiment entnehmen. Aber allein mit diesen zwei Amplituden können wir alles herausfinden, was wir über die Winkelverteilung des Zerfalls wissen wollen. Wir müssen nur darauf achten, dass wir die Zustände, über die wir sprechen, vollständig definieren. 10
Wir setzen jetzt voraus, dass Ihnen die Maschinerie der Quantenmechanik genügend vertraut ist, sodass wir uns auf die Physik des Problems konzentrieren können und uns nicht mit den mathematischen Details aufhalten müssen. Für den Fall, dass Sie den Ausführungen nicht folgen können, haben wir einige der fehlenden Einzelheiten in einer Anmerkung ans Ende des Abschnittes gestellt.
17.5 Der Zerfall des Λ0 vorher
357
nachher p
p up
up oder
Λ0 uπ− π−
(a)
uπ− π−
nein (b)
ja (c)
Abb. 17.8: Der Zerfall längs der z-Achse für ein Λ0 mit Spin „down“.
Wir fragen nach der Wahrscheinlichkeit dafür, dass das Proton im Winkel θ zur z-Achse wegfliegt (in einem kleinen Raumwinkel ΔΩ), wie in Abbildung 17.6 skizziert: Wir wollen eine neue z-Achse in diese Richtung legen und sie die z� -Achse nennen. Wir wissen, wie wir berechnen können, was bezüglich dieser Achse geschieht. Bezüglich der z� -Achse hat das Λ0 nicht mehr den Spin „up“, sondern es hat nur noch eine gewisse Amplitude, den Spin „up“ zu haben, und eine andere Amplitude, den Spin „down“ zu haben. Wir haben dies schon in Kapitel 6 und noch einmal in Kapitel 10 erörtert, vgl. (10.30). Die Amplitude für Spin „up“ ist cos θ/2 und die Amplitude für Spin „down“ ist − sin θ/2.11 Wenn der Λ0 -Spin längs der z� -Achse „up“ wäre, würde das Λ0 mit der Amplitude a ein Proton in die +z� -Richtung emittieren. Daher ist die Amplitude, ein Proton mit Spin „up“ zu finden, das in z� -Richtung geht, a cos
θ . 2
(17.33)
Analog dazu ist die Amplitude, ein Proton mit Spin „down“ zu finden, das entlang der positiven z� -Achse geht, −b sin
θ . 2
(17.34)
Die beiden Prozesse, auf die sich diese Amplituden beziehen, sind in Abbildung 17.9 gezeigt. Stellen wir uns jetzt die folgende einfache Frage: Wenn das Λ0 längs der z-Achse den Spin up hat, wie groß ist dann die Wahrscheinlichkeit, dass das Zerfallsproton im Winkel θ wegfliegt? Die beiden Spinzustände („up“ oder „down“ längs z� ) sind unterscheidbar, auch wenn wir sie nicht einzeln betrachten werden. Um daher die Wahrscheinlichkeit zu erhalten, quadrieren wir die Amplituden und addieren sie. Die Wahrscheinlichkeit f (θ), das Proton in einem kleinen 11
Wir haben z� in die xz-Ebene gelegt und benutzen die Matrixelemente für Ry (θ). Das Ergebnis wäre für jede andere Wahl das gleiche.
358
17 Symmetrien und Erhaltungssätze z
z z�
p (a)
s�z =
θ
1 2
up
Λ0 π−
uπ−
Amplitude a cos θ/2 z
z
p (b)
s�z = − 12
θ
Λ0
z�
up π−
uπ−
Amplitude −b sin θ/2
Abb. 17.9: Zwei mögliche Zerfallszustände für das Λ0 .
Raumwinkel ΔΩ um θ zu finden, ist f (θ) = |a|2 cos2
θ θ + |b|2 sin2 . 2 2
Mit den Idenditäten sin2 (θ/2) = 12 (1 − cos θ) und cos2 (θ/2) = schreiben als |a|2 + |b|2 |a|2 − |b|2 f (θ) = + cos θ . 2 2
(17.35) 1 2 (1
+ cos θ) können wir f (θ) (17.36)
Die Winkelverteilung hat somit die Form f (θ) = β (1 + α cos θ) .
(17.37)
Die Wahrscheinlichkeit hat einen Anteil, der unabhängig von θ ist, und einen Anteil, der sich linear mit cos θ ändert. Aus einer Messung der Winkelverteilung können wir α und β erhalten und somit auch |a| und |b|.
Nun gibt es noch viele andere Fragen, die wir beantworten können. Interessieren uns nur Protonen mit Spin „up“ längs der alten z-Achse? Jeder der Ausdrücke in (17.33) und (17.34) wird eine Amplitude ergeben, ein Proton mit Spin „up“ und mit Spin „down“ bezüglich der z� -Achse (+z� und −z� ) zu finden. Spin „up“ bezüglich der alten Achse | +z � kann durch die Basiszustände | +z� � und | −z� � ausgedrückt werden. Wir können dann die beiden Amplituden (17.33)
17.5 Der Zerfall des Λ0
359
und (17.34) mit den zugehörigen Koeffizienten (cos θ/2 und − sin θ/2) kombinieren, um die Gesamtamplitude zu erhalten:
a cos2
θ θ + b sin2 . 2 2
Ihr Quadrat ist die Wahrscheinlichkeit, dass das Proton im Winkel θ herauskommt, wobei es denselben Spin hat wie das Λ0 („up“ in Bezug auf die z-Achse). Falls die Parität erhalten bleibt, können wir eine weitere Aussage machen. Der in Abbildung 17.8 dargestellte Zerfall ist gerade die Spiegelung – an der xy-Ebene – des Zerfalls aus Abbildung 17.712. Wenn die Parität erhalten bliebe, müsste b gleich a oder −a sein. Dann ist der Koeffizient α von (17.37) null, und der Zerfall kann mit gleicher Wahrscheinlichkeit in allen Richtungen auftreten. Die experimentellen Resultate zeigen jedoch, dass der Zerfall eine Asymmetrie aufweist. Die gemessene Winkelverteilung verläuft wie cos θ, wie wir vorhergesagt haben – und nicht wie cos2 θ oder irgendeine andere Potenz. Tatsächlich können wir, da die Winkelverteilung diese Form hat, aus den Messungen herleiten, dass der Spin des Λ0 gleich 12 ist. Außerdem sehen wir, dass die Parität nicht erhalten bleibt. Tatsächlich hat man experimentell herausgefunden, dass der Koeffizient α gleich −0,62 ± 0,05 ist, b ist daher ungefähr doppelt so groß wie a. Die Verletzung der Symmetrie bei einer Spiegelung ist offensichtlich. Sie sehen, wie viel wir aus der Erhaltung des Drehimpulses ableiten können. Im nächsten Kapitel werden wir einige weitere Beispiele betrachten.
Anmerkung. Mit der Amplitude a meinen wir in diesem Abschnitt die Amplitude, dass der Zustand | Proton läuft nach +z, Spin +z � in einem infinitesimalen Zeitabschnitt dt aus dem Zustand | Λ0 , Spin +z � erzeugt wird, oder anders formuliert � Proton läuft nach +z, Spin +z | H | Λ0 , Spin +z � = ia
(17.38)
Dabei ist H der Hamilton-Operator der Welt – oder jedenfalls von dem, was auch immer für den Λ0 -Zerfall verantwortlich ist. Die Erhaltung des Drehimpulses bedeutet, dass der Hamilton-Operator die Eigenschaft � Proton läuft nach +z, Spin −z | H | Λ0 , Spin +z � = 0
(17.39)
haben muss. Mit der Amplitude b meinen wir, dass � Proton läuft nach +z, Spin −z | H | Λ0 , Spin −z � = ib .
(17.40)
Die Erhaltung des Drehimpulses bedeutet, dass � Proton läuft nach +z, Spin +z | H | Λ0 , Spin −z � = 0 .
(17.41)
Wenn Ihnen nicht klar ist, was die durch (17.33) und (17.34) gegebenen Amplituden bedeuten, dann können wir sie mathematisch korrekter folgendermaßen ausdrücken. Mit (17.33) meinen wir die Amplitude, 12
Beachten Sie, dass der Spin ein axialer Vektor ist und bei der Spiegelung nicht umklappt.
360
17 Symmetrien und Erhaltungssätze
dass das Λ0 mit Spin längs +z in ein Proton zerfällt, das sich in +z� -Richtung bewegt, wobei auch sein Spin in +z� -Richtung zeigt. Das ist die Amplitude � Proton läuft nach +z� , Spin +z� | H | Λ0 , Spin +z � .
(17.42)
Mit den allgemeinen Sätzen der Quantenmechanik kann diese Amplitude geschrieben werden als � Proton läuft nach +z� , Spin +z� | H | Λ0 , i � � Λ0 , i | Λ0 , Spin +z � , (17.43) i
wobei die Summe über die Basiszustände | Λ0 , i � des ruhenden Λ0 -Teilchens genommen werden muss. Da das Λ0 -Teilchen den Spin 21 hat, gibt es zwei solche Basiszustände, die auf jede beliebige Basis bezogen sein können. Wenn wir als Basiszustände Spin „up“ und Spin „down“ bezüglich z� (+z� , −z� ) verwenden, dann ist die Amplitude von (17.43) gleich der Summe � Proton läuft nach +z� , Spin +z� | H | Λ0 , +z� � � Λ0 , +z� | Λ0 , Spin + z �
+ � Proton läuft nach +z� , Spin +z� | H | Λ0 , −z� � � Λ0 , −z� | Λ0 , Spin + z � . (17.44)
Der erste Faktor des ersten Terms ist (bis auf den Faktor i) gleich a und der erste Faktor des zweiten Terms ist null – nach der Definition von (17.38) und nach (17.41), was wiederum aus der Erhaltung des Drehimpulses folgt. Der verbleibende Faktor � Λ0 , +z� | Λ0 , Spin + z � des ersten Terms ist gerade die Amplitude, dass ein Spin- 12 -Teilchen, welches den Spin „up“ längs einer Achse hat, auch Spin „up“ längs einer um den Winkel θ geneigten Achse hat; diese Amplitude ergibt sich als cos θ/2 (siehe Tabelle 6.2). Daher ist (17.44) einfach a cos θ/2, wie wir in (17.33) geschrieben haben. Die Amplitude (17.34) erhalten wir, wenn wir die gleiche Argumentation auf ein Λ0 -Teilchen mit Spin „down“ anwenden.
17.6
Zusammenstellung der Drehmatrizen
Wir möchten jetzt die einzelnen Aussagen zusammenfassen, die wir über die Drehungen für Teilchen von Spin 12 und Spin eins hergeleitet haben, damit wir im weiteren Verlauf schnell darauf zurückgreifen können. Die Tabellen 17.1 bis 17.3 enthalten die Drehmatrizen Rz (φ) und Ry (φ) für Spin- 21 -Teilchen, für Spin-eins-Teilchen und für Photonen (Spin-eins-Teilchen mit Ruhemasse null). Für jeden Spin sind die Terme der Matrix � j | R | i � für Drehungen um die z-Achse bzw. die y-Achse angegeben. Sie sind natürlich genau gleichwertig mit Amplituden wie � +T | 0 S �, die wir in früheren Kapiteln benutzt haben. Mit Rz (φ) meinen wir, dass der Zustand in ein neues Koordinatensystem projiziert wird, das um den Winkel φ um die z-Achse gedreht ist – wobei immer die RechteHand-Regel benutzt wird, um den positiven Drehsinn zu definieren. Mit Ry (θ) meinen wir, dass die Bezugsachsen um den Winkel θ um die y-Achse gedreht werden. Wenn Sie diese beiden Drehungen kennen, können Sie jede beliebige Drehung herstellen. Wie üblich, schreiben wir die Matrixelemente so, dass der Zustand auf der linken Seite der Basiszustand des neuen (gedrehten) Systems ist und der Zustand auf der rechten Seite der Basiszustand des alten (ungedrehten) Systems ist. Sie können die Eintragungen in den Tabellen auf viele Arten interpretieren. Zum Beispiel bedeutet die Eintragung e−iφ/2 in Tabelle 17.1, dass das Matrixelement � − | Rz (φ) | − � = e−iφ/2 ist. Es bedeutet auch, dass Rˆ z (φ) | − � = e−iφ/2 | − � ist oder dass � − | Rˆ z (φ) = � − | e−iφ/2 ist. Es ist alles dasselbe.
17.6 Zusammenstellung der Drehmatrizen Rz (φ)
|+�
e+iφ/2 0
0 e−iφ/2
Ry (θ)
|+�
|−�
�+| �−|
cos θ/2 − sin θ/2
Rz (φ)
|+�
�+| �0| �−|
e+iφ 0 0
Ry (θ)
|+�
�+| �0| �−| Rz (φ) �R| �L|
sin θ/2 cos θ/2 |0� 0 1 0
e+iφ 0
1 − √ sin θ 2 |L� 0
e
−iφ
|−� 0 0
e−iφ
|0� 1 + √ sin θ 2 cos θ
1 (1 + cos θ) 2 1 − √ sin θ 2 1 (1 − cos θ) 2 |R�
Tabelle 17.1: Drehmatrizen für Spin 12 . Zwei Zustände: | + �, „up“ längs der z-Achse, m = + 12 ; | − �, „down“ längs der z-Achse, m = − 21
|−�
�+| �−|
361
Tabelle 17.2: Drehmatrizen für Spin eins. Drei Zustände: | + �, m = +1; | 0 �, m = 0; | − �, m = −1
|−�
1 (1 − cos θ) 2 1 + √ sin θ 2 1 (1 + cos θ) 2
Tabelle 17.3: Photonen. Zwei Zustände: 1 | R � = √ (| x � + i | y �), m = +1 (RZ-polarisiert); 2 1 | L � = √ (| x � − i | y �), m = −1 (LZ-polarisiert) 2
18
Drehimpuls
18.1
Elektrische Dipolstrahlung
Im vorangegangenen Kapitel haben wir das Konzept von der Erhaltung des quantenmechanischen Drehimpulses diskutiert und gezeigt, wie es benutzt werden kann, um die Winkelverteilung des Protons aus dem Zerfall des Λ0 -Teilchens vorherzusagen. Wir wollen nun einige weitere Beispiele für die Konsequenzen der Drehimpulserhaltung in atomaren Systemen betrachten. Unser erstes Beispiel ist die von einem Atom ausgehende Lichtstrahlung. Die Erhaltung des Drehimpulses legt (unter anderem) die Polarisation und die Winkelverteilung des emittierten Photons fest. Wir betrachten ein Atom, das in einem angeregten Zustand mit bestimmtem Drehimpuls ist – sagen wir mit einem Spin eins – und es vollführt einen Übergang in einen Zustand mit dem Drehimpuls null und einer niedrigeren Energie, wobei es ein Photon emittiert. Das Problem besteht darin, die Winkelverteilung und die Polarisation der Photonen auszurechnen. (Dieses Problem ist fast genau das gleiche wie beim Λ0 -Zerfall, nur dass wir Spin-eins- anstelle von Spin- 21 -Teilchen haben.) Da der höhere Zustand des Atoms den Spin eins hat, gibt es drei Möglichkeiten für die z-Komponente seines Drehimpulses. Der Wert von m könnte +1, 0 oder −1 sein. Für unser Beispiel werden wir m = +1 nehmen. Wenn Sie erst einmal gesehen haben, wie es geht, können Sie die anderen Fälle behandeln. Wir nehmen an, dass das Atom seinen Drehimpuls längs der +z-Achse gerichtet hat (siehe Abbildung 18.1 (a)) und fragen, mit welz
z
RZPhoton Atom im angeregten Zustand
j=1 m=1
j=0 m=0
Atom im Grundzustand
Amplitude a vorher (a)
nachher (b)
Abb. 18.1: Ein Atom mit j = 1 und m = +1 emittiert ein RZ-Photon längs der +z-Achse.
364
18 Drehimpuls z
z
LZPhoton Atom im angeregten Zustand
j=1 m = −1
j=0 m=0
Atom im Grundzustand
Amplitude b vorher (a)
nachher (b)
Abb. 18.2: Ein Atom mit j = 1 und m = −1 emittiert ein LZ-Photon längs der +z-Achse.
cher Amplitude es rechtszirkular polarisiertes Licht entlang der z-Achse nach oben emittiert, sodass das Atom zum Schluss den Drehimpuls null hat (siehe Teil (b) der Abbildung). Nun, wir kennen nicht die Antwort. Wir wissen aber, dass rechtszirkular polarisiertes Licht eine Einheit des Drehimpulses um seine Fortpflanzungsrichtung hat. Daher muss die Situation nach der Emission des Photons wie in Abbildung 18.1 (b) sein – das Atom bleibt mit Drehimpuls null um die z-Achse zurück, da wir ein Atom vorausgesetzt haben, dessen niedrigerer Zustand (Grundzustand) den Spin null hat. Wir wollen die Amplitude für dieses Ereignis gleich a setzen. Genauer gesagt, wir bezeichnen mit a die Amplitude, während der Zeit dt ein Photon in einem bestimmten kleinen Raumwinkel ΔΩ um die z-Achse zu emittieren. Beachten Sie, dass die Amplitude, ein LZ-Photon in dieselbe Richtung zu emittieren, null ist. Der Gesamtdrehimpuls um die z-Achse wäre für ein solches Photon −1 und wäre null für das Atom, was eine Summe von −1 ergibt, sodass der Drehimpuls nicht erhalten bliebe. Wenn der Spin des Atoms anfangs „down“ ist (−1 längs der z-Achse), dann ergibt sich ganz analog, dass es nur ein LZ-polarisiertes Photon in Richtung der +z-Achse emittieren kann (siehe Abbildung 18.2). Wir wollen die Amplitude für dieses Ereignis gleich b setzen, wobei wir wieder die Amplitude meinen, dass das Photon während der Zeit dt in einen gewissen Raumwinkel ΔΩ geht. Andererseits kann das Atom, wenn es im Zustand m = 0 ist, überhaupt kein Photon in die +z-Richtung emittieren, weil ein Photon nur den Drehimpuls +1 oder −1 längs seiner Bewegungsrichtung haben kann. Als Nächstes können wir zeigen, dass b mit a verknüpft ist. Angenommen, wir führen eine Inversion der Situation in Abbildung 18.1 aus, d. h., wir stellen uns vor, wie das System aussehen würde, wenn wir jeden Teil des Systems an einen äquivalenten Punkt auf der gegenüberliegenden Seite des Ursprungs befördern. Dies bedeutet nicht, dass wir einfach die Drehimpulsvektoren spiegeln, weil sie axiale Vektoren sind. Wir müssen vielmehr den wirklichen Bewegungscharakter, der einem solchen Drehimpuls entspricht, invertieren. In Abbildung 18.3 sehen wir, wie der Prozess von Abbildung 18.1 vor und nach einer Inversion am Mittelpunkt des Atoms
18.1 Elektrische Dipolstrahlung
365
(a)
(b)
Abb. 18.3: Wenn der Prozess von (a) durch eine Inversion am Mittelpunkt des Atoms transformiert wird, erscheint er wie in (b).
aussieht. Beachten Sie, dass der Drehsinn des Atoms unverändert bleibt.1 Im invertierten System von Abbildung 18.3 (b) haben wir ein Atom mit m = +1, das ein LZ-Photon nach unten emittiert. Wenn wir jetzt das System von Abbildung 18.3 (b) um 180◦ um die x- oder y-Achse drehen, wird es identisch mit Abbildung 18.2. Die Kombination von Inversion und Drehung wandelt den zweiten Prozess in den ersten um. Wenn wir Tabelle 17.2 benutzen, sehen wir, dass eine Drehung um 180◦ um die y-Achse den Zustand m = −1 in den Zustand m = +1 transformiert. Daher muss die Amplitude b gleich der Amplitude a sein, bis auf einen eventuellen Vorzeichenwechsel infolge der Inversion. Der Vorzeichenwechsel bei der Inversion hängt von den Paritäten des Anfangs- und Endzustandes des Atoms ab. Da bei atomaren Prozessen die Parität erhalten bleibt, muss die Parität des Gesamtsystems vor und nach der Photonemission die gleiche sein. Was geschieht, hängt davon ab, ob die Parität des Anfangszustands und die Parität des Endzustands des Atoms gerade oder ungerade ist – die Winkelverteilung der Strahlung wird für die verschiedenen Fälle unterschiedlich sein. Wir wollen den gewöhnlichen Fall ungerader Parität für den Anfangszustand und gerader Parität für den Endzustand des Atoms betrachten, was die so genannte „elektrische Dipolstrahlung“ ergeben wird. (Wenn der Anfangs- und der Endzustand dieselbe Parität haben, sagen wir, dass 1
Wenn wir x, y, z in −x, −y, −z ändern, denken Sie vielleicht, dass alle Vektoren umgekehrt werden. Das gilt zwar für polare Vektoren, wie Strecken und Geschwindigkeiten, aber nicht für einen axialen Vektor wie den Drehimpuls oder irgendeinen Vektor, der aus einem Kreuzprodukt zweier polarer Vektoren abgeleitet wird. Axiale Vektoren haben nach einer Inversion dieselben Komponenten.
366
18 Drehimpuls
„magnetische Dipolstrahlung“ vorliegt, die den Charakter der Strahlung eines oszillierenden Stroms in einer Schleife hat.) Wenn die Parität des Anfangszustands des Atoms ungerade ist, kehrt seine Amplitude bei der Inversion, die das System in Abbildung 18.3 von (a) nach (b) bringt, ihr Vorzeichen um. Der Endzustand des Atoms hat gerade Parität, daher ändert seine Amplitude nicht das Vorzeichen. Wenn die Reaktion die Parität des Gesamtsystems erhalten soll, muss die Amplitude b dem Betrag nach gleich a sein, aber das umgekehrte Vorzeichen haben. Wenn a die Amplitude dafür ist, dass das Atom im Zustand m = +1 ein Photon nach oben emittiert, dann folgern wir, dass bei den vorausgesetzten Paritäten des Anfangs- und des Endzustands die Amplitude, dass das Atom im Zustand m = −1 ein LZ-Photon nach oben emittiert, −a ist.2
Wir kennen nun alles, was wir wissen müssen, um die Amplitude zu finden, dass ein Photon in einen Winkel θ bezüglich der z-Achse emittiert wird. Nehmen wir an, wir betrachten ein Atom, das ursprünglich mit m = +1 polarisiert ist. Wir können diesen Zustand in Zustände +1, 0 und −1 bezüglich einer neuen z� -Achse in Richtung der Photonemission zerlegen. Die Amplituden für diese drei Zustände sind in der unteren Hälfte von Tabelle 17.2 angegeben. Die Amplitude, dass ein RZ-Photon in die Richtung θ emittiert wird, ist dann a mal die Amplitude, m = +1 in dieser Richtung zu haben, nämlich a � + | Ry(θ) | + � =
a (1 + cos θ) . 2
(18.1)
Die Amplitude, dass ein LZ-Photon in dieselbe Richtung emittiert wird, ist – a mal die Amplitude, m = −1 in der neuen Richtung zu haben. Wenn wir Tabelle 17.2 benutzen, ist sie a −a � − | Ry(θ) | + � = − (1 − cos θ) . 2
(18.2)
Wenn Sie an anderen Polarisationen interessiert sind, können Sie die Amplitude dafür aus der Überlagerung dieser beiden Amplituden bestimmen. Um die Intensität irgendeiner Komponente als Funktion des Winkels zu erhalten, müssen Sie natürlich das Absolutquadrat der Amplituden bilden.
18.2
Streuung des Lichts
Wir wollen diese Ergebnisse nun verwenden, um ein etwas komplizierteres Problem zu lösen, das dafür aber auch etwas realistischer ist. Wir nehmen an, dass sich dasselbe Atom in seinem Grundzustand ( j = 0) befindet und einen einfallenden Lichtstrahl streut. Nehmen wir an, dass das Licht ursprünglich in +z-Richtung läuft, sodass wir Photonen betrachten, die aus der −zRichtung zum Atom kommen (Abbildung 18.4 (a)). Wir können die Streuung des Lichts als zweistufigen Prozess ansehen: Das Photon wird absorbiert und dann wieder emittiert. Wenn wir wie in Abbildung 18.4 (a) mit einem RZ-Photon beginnen und der Drehimpuls erhalten bleibt, dann wird das Atom nach der Absorption in einem Zustand m = +1 sein (Abbildung 18.4 (b)). 2
Vielleicht werden Sie gegen dieses Argument einwenden, dass die Endzustände, die wir betrachtet haben, keine bestimmte Parität haben. Sie werden in Zusatz 2 am Ende dieses Kapitels eine andere Beweisführung finden, die Sie vielleicht vorziehen.
18.2 Streuung des Lichts z
j=0 m=0
z
z
j=0 m=0
j=1 m=1
(a)
367
(b)
θ
(c)
Abb. 18.4: Die Streuung von Licht an einem Atom als zweistufiger Prozess betrachtet.
Wir bezeichnen die Amplitude für diesen Prozess mit c. Das Atom kann dann ein RZ-Photon in die Richtung θ emittieren (siehe Abbildung 18.4 (c)). Die Gesamtamplitude � R� | S | R �, dass ein einlaufendes RZ-Photon in die Richtung θ gestreut wird, ist dann c mal (18.1): � R� | S | R � =
ac (1 + cos θ) . 2
(18.3)
Es gibt auch eine Amplitude, dass ein RZ-Photon absorbiert und ein LZ-Photon emittiert wird. Das Produkt der beiden Amplituden ist die Amplitude � L� | S | R �, dass ein RZ-Photon als LZPhoton gestreut wird. Wenn wir (18.2) verwenden, erhalten wir � L� | S | R � = −
ac (1 − cos θ) . 2
(18.4)
Fragen wir jetzt danach, was passiert, wenn ein LZ-Photon einfällt. Wenn es absorbiert wird, geht das Atom in einen Zustand m = −1 über. Mit der gleichen Argumentation wie im vorigen Abschnitt können wir zeigen, dass diese Amplitude −c sein muss. Die Amplitude, dass ein Atom im Zustand m = −1 ein RZ-Photon im Winkel θ emittiert, ist a mal die Amplitude � + | Ry(θ) | − �, die 21 (1 − cos θ) beträgt. Wir erhalten damit � R� | S | L � = −
ac (1 − cos θ) . 2
(18.5)
Schließlich ist die Amplitude dafür, dass ein LZ-Photon als LZ-Photon gestreut wird, � L� | S | L � =
ac (1 + cos θ) . 2
(18.6)
(Die beiden Minuszeichen heben sich auf.) Wenn wir eine Messung der gestreuten Intensität für irgendeine gegebene Kombination zirkularer Polarisationen durchführen, wird das Ergebnis proportional zum Quadrat von einer unserer vier Amplituden sein. Zum Beispiel wird sich bei einem einfallenden Strahl von RZ-Licht die Intensität des RZ-Lichts in der gestreuten Strahlung wie (1 + cos θ)2 verhalten.
368
18 Drehimpuls
Das ist alles schön und gut, aber was wäre, wenn wir von linear polarisiertem Licht ausgehen würden? Wenn wir x-polarisiertes Licht betrachten, kann es als Überlagerung von RZ- und LZ-Licht dargestellt werden. Wir schreiben (siehe Abschnitt 11.4) 1 | x � = √ (| R � + | L �) . 2
(18.7)
Oder wenn wir y-polarisiertes Licht betrachten, erhalten wir i | y � = − √ (| R � − | L �) . 2
(18.8)
Was möchten Sie also jetzt wissen? Möchten Sie die Amplitude dafür wissen, dass ein x-polarisiertes Photon in ein RZ-Photon im Winkel θ gestreut wird? Die können Sie mit der üblichen Regel für das Kombinieren von Amplituden berechnen. Zuerst müssen Sie (18.7) mit � R� | S multiplizieren. Sie erhalten 1 � R� | S | x � = √ (� R� | S | R � + � R� | S | L �) . 2
(18.9)
Dann benutzen Sie (18.3) und (18.5) für die zwei Amplituden. Sie bekommen ac � R� | S | x � = √ cos θ . 2
(18.10)
Für die Amplitude, dass ein x-Photon in ein LZ-Photon im Winkel θ gestreut wird, erhalten Sie ac � L� | S | x � = √ cos θ . 2
(18.11)
Zuletzt fragen wir nach der Amplitude dafür, dass ein x-polarisiertes Photon gestreut wird und es dabei seine x-Polarisation beibehält, also nach � x� | S | x �. Dies kann geschrieben werden als � x� | S | x � = � x� | R� � � R� | S | x � + � x� | L� � � L� | S | x � .
(18.12)
Unter Verwendung der Beziehungen 1 | R� � = √ (| x� � + i | y� �) , 2 1 | L� � = √ (| x� � − i | y� �) , 2
(18.13) (18.14)
folgt 1 � x� | R � � = √ , 2 1 � x� | L� � = √ . 2
(18.15) (18.16)
18.3 Die Vernichtung von Positronium
369
Damit erhalten Sie � x� | S | x � = ac cos θ .
(18.17)
Die Antwort ist, dass ein Strahl x-polarisierten Lichtes mit einer Intensität proportional zu cos2 θ in die Richtung θ (in der xz-Ebene) gestreut wird. Wenn Sie nach y-polarisiertem Licht fragen, erhalten Sie � y� | S | x � = 0 .
(18.18)
Das gestreute Licht ist also vollständig in x-Richtung polarisiert. Nun stellen wir etwas Interessantes fest. Die Ergebnisse (18.17) und (18.18) entsprechen genau der klassischen Theorie der Lichtstreuung, die wir in Band II, Abschnitt 7.5 behandelt haben. Dort hatten wir uns vorgestellt, dass das Elektron durch eine lineare rücktreibende Kraft an das Atom gebunden ist – sodass es sich wie ein klassischer Oszillator verhält. Vielleicht denken Sie: „Es ist doch in der klassischen Theorie so viel einfacher; wenn sie schon die richtigen Antworten liefert, warum müssen wir uns dann noch mit der Quantentheorie abmühen?“ Nun ja, wir haben bisher nur den speziellen – wenn auch üblichen – Fall eines Atoms mit einem angeregten Zustand j = 1 und einem Grundzustand j = 0 betrachtet. Wenn der angeregte Zustand den Spin zwei hätte, würden Sie ein anderes Ergebnis erhalten. Auch gibt es keinen Grund, warum das Modell eines an einer Feder befestigten und von einem oszillierenden elektrischen Feld angetriebenen Elektrons für ein einzelnes Photon korrekte Ergebnisse liefern sollte. Aber wir haben festgestellt, dass es das tatsächlich tut und dass die Polarisation und die Intensitäten richtig herauskommen. In gewissem Sinne bringen wir daher den gesamten Vorlesungsstoff zur vollen Geltung. Während wir in Band II die Theorie des Brechungsindex und der Lichtstreuung nach der klassischen Theorie behandelt haben, haben wir jetzt gezeigt, dass die Quantentheorie dasselbe Ergebnis für den üblichen Fall liefert. In der Tat haben wir jetzt zum Beispiel die Polarisation des Himmelslichts durch quantenmechanische Argumente erklärt, was die einzig wirklich legitime Methode ist. Es sollte natürlich so sein, dass alle klassischen Theorien, die zu korrekten Ergebnissen führen, letzten Endes durch Quantenargumente legitimiert werden. Natürlich haben wir die Situationen, auf deren Erklärung wir einen großen Teil der Zeit verwendet haben, aus jenen Teilen der klassischen Physik ausgewählt, die in der Quantenmechanik ihre Gültigkeit behalten. Wir haben beispielsweise kein detailliertes Atommodell besprochen, mit Elektronen, die sich auf Kreisbahnen bewegen. Der Grund dafür ist, dass ein solches Modell keine Ergebnisse liefert, die mit der Quantenmechanik übereinstimmen. Aber das Elektron an einer Feder – das im anschaulichen Sinne überhaupt nicht dem „Aussehen“ eines Atoms entspricht – führt durchaus zu korrekten Ergebnissen, und daher benutzten wir das Modell für die Theorie des Brechungsindex.
18.3
Die Vernichtung von Positronium
Als Nächstes möchten wir ein Beispiel anführen, das sehr hübsch ist. Es ist recht interessant, und wenn es auch etwas schwierig ist, so hoffen wir doch, dass es nicht zu schwierig ist. Unser Beispiel ist das System, das Positronium genannt wird, was ein „Atom“ ist, das aus einem
370
18 Drehimpuls
Positron und einem Elektron zusammengesetzt ist – ein gebundener Zustand von einem e+ und einem e− . Es ist wie ein Wasserstoffatom, nur dass das Proton durch ein Positron ersetzt ist. Dieses Objekt hat – wie das Wasserstoffatom – viele Zustände. Ebenso ist, wie beim Wasserstoff, der Grundzustand durch die Wechselwirkung der magnetischen Momente in eine „Hyperfeinstruktur“ aufgespalten. Die Spins des Elektrons und des Positrons sind beide 21 , und sie können entweder parallel oder antiparallel zu irgendeiner gegebenen Achse sein. (Im Grundzustand gibt es keinen Drehimpuls aufgrund der Bahnbewegung.) Daher gibt es vier Zustände: drei sind die Zustände eines Spin-eins-Systems, die alle dieselbe Energie haben, und einer ist ein Zustand mit Spin null mit einer anderen Energie. Die Energieaufspaltung ist jedoch viel größer als die 1420 Megahertz beim Wasserstoff, weil das magnetische Moment des Positrons so viel größer – 1000-mal größer – als das magnetische Moment des Protons ist. Der wesentliche Unterschied ist jedoch, dass ein Positronium nicht für immer bestehen kann. Das Positron ist das Antiteilchen des Elektrons. Die beiden Teilchen können einander vernichten, d. h., sie verschwinden beide vollständig, wobei sie ihre Ruheenergien in Strahlung umwandeln, die als γ-Strahlung (Photonen) auftritt. Beim Zerfall gehen zwei Teilchen mit endlicher Ruhemasse in zwei oder mehr Objekte mit der Ruhemasse null über.3
Positronium e+ e−
vorher (a)
nachher (b)
Abb. 18.5: Die Zweiphotonvernichtung von Positronium.
Wir beginnen mit der Untersuchung des Zerfalls des Spin-null-Zustands des Positroniums. Es zerfällt mit einer Lebensdauer von etwa 10−10 Sekunden in zwei γ-Strahlen. Am Anfang haben wir ein Positron und ein Elektron nahe beieinander mit antiparallelen Spins, die das Positroniumsystem bilden. Nach dem Zerfall gibt es zwei Photonen, die mit Impulsen vom gleichen Betrag und mit entgegengesetzten Richtungen auseinanderlaufen (Abbildung 18.5). Die Impulse müssen gleich groß und entgegengesetzt sein, weil der Gesamtimpuls nach dem Zerfall null sein muss, so wie er vorher war, wenn wir den Fall einer Vernichtung aus dem Ruhezustand annehmen. Wenn das Positronium nicht in Ruhe ist, können wir uns mit ihm mitbewegen, das Problem lösen und dann alles wieder zurück in das Laborsystem transformieren. (Sehen Sie, wir können jetzt alles machen, wir haben alle Werkzeuge.) 3
Nach dem heutigen tieferen Verständnis der Welt gibt es keine einfache Methode zur Unterscheidung, ob die Energie eines Photons weniger „Materie“ ist als die Energie eines Elektrons, denn wie Sie sich erinnern werden, verhalten die Teilchen sich alle sehr ähnlich. Der einzige Unterschied ist, dass das Photon keine Ruhemasse hat.
18.3 Die Vernichtung von Positronium
371
Zuerst bemerken wir, dass die Winkelverteilung nicht sehr interessant ist. Da der Anfangszustand den Spin null hat, hat er keine spezielle Achse – er ist bei allen Drehungen symmetrisch. Der Endzustand muss dann auch bei allen Drehungen symmetrisch sein. Das bedeutet, dass für den Zerfall alle Winkel gleich wahrscheinlich sind – die Amplitude dafür, dass ein Photon in irgendeine Richtung geht, ist immer gleich. Wenn wir erst einmal eines der Photonen in einer bestimmten Richtung gefunden haben, muss sich natürlich das andere in der entgegengesetzten Richtung befinden. Die einzig verbleibende Frage, die wir jetzt betrachten wollen, ist die nach der Polarisation der Photonen. Wir legen die z-Achse in die Bewegungsrichtung der Photonen. Wir können beliebige Darstellungen für die Polarisationszustände des Photons verwenden; für unsere Beschreibung werden wir rechts- und linkszirkulare Polarisationen wählen, immer in Bezug auf die Bewegungsrichtungen.4 Wir sehen sofort, dass, wenn das nach oben laufende Photon RZ ist, der Drehimpuls nur dann erhalten bleibt, wenn das nach unten laufende Photon auch RZ ist. Jedes wird plus eine Einheit des Drehimpulses bezüglich seiner Impulsrichtung tragen, was plus und minus eine Einheit um die z-Achse bedeutet. Die Summe ist null, und der Drehimpuls nach dem Zerfall ist derselbe wie vorher (siehe Abbildung 18.6). z
z m = +1
RZ
m = −1
RZ
Positronium j=0 m=0
e+ e−
Abb. 18.6: Eine Möglichkeit für die Vernichtung von Positronium längs der z-Achse.
Dieselben Argumente zeigen, dass, wenn das nach oben laufende Photon RZ ist, das nach unten laufende nicht LZ sein kann, denn dann hätte der Endzustand zwei Einheiten des Drehimpulses. Dies ist nicht erlaubt, wenn der Anfangszustand Spin null hat. Beachten Sie, dass dieser Endzustand auch nicht für den anderen Positroniumgrundzustand mit dem Spin eins möglich ist, weil er maximal eine Einheit des Drehimpulses in jeder Richtung haben kann. 4
Beachten Sie, dass wir immer den Drehimpuls um die Bewegungsrichtung des Teilchens untersuchen. Wenn wir nach dem Drehimpuls um irgendeine andere Achse fragen würden, müssten wir uns um die Möglichkeit kümmern, dass ein „Bahndrehimpuls“ auftritt – aus einem p× r Term. Zum Beispiel können wir nicht sagen, dass die Photonen genau vom Mittelpunkt des Positroniums ausgehen. Sie könnten fortfliegen wie zwei Objekte, die vom Rand eines sich drehenden Rades fortgeschleudert werden. Wir brauchen uns um solche Komplikationen nicht zu kümmern, wenn wir die Achse in die Bewegungsrichtung legen.
372
18 Drehimpuls
(a)
(b)
j=1 m=0
j=1 m=0 e+ e−
e+ e−
Abb. 18.7: Beim Zustand j = 1 des Positroniums sind der Prozess (a) und seine 180◦ -Drehung um y (b) identisch.
Nun möchten wir zeigen, dass eine Zweiphotonvernichtung aus dem Spin-eins-Zustand heraus überhaupt nicht möglich ist. Sie denken vielleicht, dass der ( j = 1, m = 0)-Zustand – der den Drehimpuls null um die z-Achse hat – wie der Spin-null-Zustand sein sollte und in zwei RZ-Photonen zerfallen könnte. Richtig, der in Abbildung 18.7 (a) skizzierte Zerfall erhält den Drehimpuls um die z-Achse. Aber nun schauen Sie, was passiert, wenn wir dieses System um 180◦ um die y-Achse drehen – wir erhalten das in Abbildung 18.7 (b) gezeigte Bild. Es ist genau das gleiche wie in Teil (a) der Abbildung. Dabei haben wir lediglich die beiden Photonen vertauscht. Nun sind Photonen Bose-Teilchen, d. h., wenn wir sie vertauschen, hat die Amplitude dasselbe Vorzeichen. Daher muss die Amplitude für den Zerfall in Teil (b) dieselbe wie in Teil (a) sein. Wir haben aber vorausgesetzt, dass das ursprüngliche Objekt Spin eins hat. Und wenn wir ein Spin-eins-Objekt in einen Zustand mit m = 0 um 180◦ um die y-Achse drehen, ändert seine Amplitude das Vorzeichen (siehe Tabelle 17.2 für θ = π). Dann müssten die Amplituden für (a) und (b) in Abbildung 18.7 aber entgegengesetzte Vorzeichen haben; der Spin-eins-Zustand kann also nicht in zwei Photonen zerfallen. Wenn Positronium gebildet wird, würden Sie erwarten, dass es in 1/4 der Zeit im Spin-nullZustand entsteht und in 3/4 der Zeit im Spin-eins-Zustand (mit m = −1, 0 oder +1). Daher werden Sie in 1/4 der Zeit Zweiphotonvernichtungen erhalten. In den anderen 3/4 der Zeit kann es keine Zweiphotonvernichtungen geben. Es gibt dann zwar immer noch eine Vernichtung, aber sie muss mit drei Photonen ablaufen. Es ist schwieriger für das Positronium dies zu tun, und die Lebensdauer ist 1000-mal länger – etwa 10−7 Sekunden. Dies ist es, was experimentell beobachtet wird. Wir wollen nicht weiter auf die Details der Spin-eins-Vernichtung eingehen. Bis jetzt ergibt sich also, wenn wir uns um den Drehimpuls kümmern, dass der Spin-nullZustand des Positroniums in zwei RZ-Photonen übergehen kann. Es gibt aber noch eine andere Möglichkeit: Er kann in zwei LZ-Photonen übergehen, wie in Abbildung 18.8 gezeigt. Die nächste Frage ist, wie die Beziehung zwischen den Amplituden für diese beiden möglichen Zerfallsformen aussieht. Die Antwort finden wir, wenn wir die Erhaltung der Parität ausnutzen. Dazu müssen wir jedoch die Parität des Positroniums kennen. Nun haben theoretische Physiker auf eine nicht leicht zu erklärende Art gezeigt, dass die Parität des Elektrons und die des Po-
18.3 Die Vernichtung von Positronium
373
LZ
j=0 m=0
e+ e−
LZ
Abb. 18.8: Ein anderer möglicher Prozess für die Positroniumvernichtung.
sitrons – seines Antiteilchens – entgegengesetzt sein müssen, sodass der Spin-null-Zustand des Positroniums ungerade sein muss. Wir wollen einfach voraussetzen, dass er ungerade ist, und da wir uns in Übereinstimmung mit dem Experiment befinden, können wir das als ausreichenden Beweis ansehen. Schauen wir nun, was geschieht, wenn wir den Prozess in Abbildung 18.6 invertieren. Wenn wir das tun, kehren die zwei Photonen Richtungen und Polarisationen um. Das invertierte Bild sieht genau wie Abbildung 18.8 aus. Unter der Voraussetzung, dass die Parität des Positroniums ungerade ist, müssen die Amplituden für die zwei Prozesse in den Abbildungen 18.6 und 18.8 entgegengesetzte Vorzeichen haben. Bezeichnen wir den Endzustand von Abbildung 18.6, in dem beide Photonen RZ sind, mit | R1 R2 � und den Endzustand in Abbildung 18.8, in dem beide Photonen LZ sind, mit | L1 L2 �. Für den tatsächlichen Endzustand – nennen wir ihn | F � – muss gelten | F � = | R1 R2 � − | L1 L2 � .
(18.19)
P | F � = | L1 L2 � − | R1 R2 � = − | F � ,
(18.20)
Dann wandelt nämlich eine Inversion die R� s in L� s um und ergibt den Zustand der das Negative von (18.19) ist. Somit hat der Endzustand | F � negative Parität, was dasselbe wie beim anfänglichen Spin-null-Zustand des Positroniums ist. Dies ist der einzige Endzustand, der sowohl Drehimpuls als auch Parität erhält. Es gibt eine Amplitude dafür, dass der Zerfall in diesem Zustand endet, um die wir uns jetzt jedoch nicht zu kümmern brauchen, da wir nur an der Polarisation interessiert sind. Was bedeutet der Endzustand (18.19) physikalisch? Eine Bedeutung ist die folgende: Wenn wir die zwei Photonen in zwei Detektoren beobachten, die so eingestellt werden können, dass sie RZ- und LZ-Photonen getrennt zählen, werden wir immer zwei RZ-Photonen gemeinsam oder zwei LZ-Photonen gemeinsam registrieren. Das heißt, wenn Sie auf einer Seite des Positroniums stehen und jemand anderes steht auf der gegenüberliegenden Seite, dann können Sie die Polarisation messen und Ihrem Kollegen mitteilen, welche Polarisation er erhalten wird. Sie haben eine Wahrscheinlichkeit von 50 : 50, ein RZ- oder ein LZ-Photon einzufangen; aber welches Sie auch erhalten, Sie können vorhersagen, dass Ihr Kollege das gleiche erhalten wird.
374
18 Drehimpuls
Da es eine Wahrscheinlichkeit von 50 : 50 für RZ- und LZ-Polarisation gibt, hört sich das wie bei einer linearen Polarisation an. Was passiert, wenn wir das Photon in Zählern beobachten, die nur linear polarisiertes Licht akzeptieren? Bei γ-Strahlen kann man die Polarisation nicht so leicht messen wie bei Licht; es gibt keinen Polarisator, der bei solch kurzen Wellenlängen gut arbeitet. Aber stellen wir uns vor, dass es ihn gäbe, um die Diskussion einfacher zu gestalten. Angenommen, Sie hätten einen Zähler, der nur Licht mit x-Polarisation akzeptiert, und Ihr Kollege wäre auf der anderen Seite, der nach linear polarisiertem Licht mit y-Polarisation Ausschau hält. Wie groß ist die Wahrscheinlichkeit, dass Sie die zwei Photonen aus einer Vernichtung auffangen? Wonach wir fragen müssen, ist die Amplitude dafür, dass | F � im Zustand | x1 y2 � sein wird. Mit anderen Worten, wir suchen die Amplitude � x1 y 2 | F � . Sie ist natürlich gerade � x1 y2 | R1 R2 � − � x1 y2 | L1 L2 � .
(18.21)
Obwohl wir jetzt mit Zweiteilchenamplituden für die beiden Photonen arbeiten, können wir sie genauso behandeln, wie wir es bei den Einteilchenamplituden gemacht haben, da sich jedes Teilchen unabhängig von dem anderen verhält. Das bedeutet, dass die Amplitude � x1 y2 | R1 R2 � einfach das Produkt der beiden unabhängigen √ � x1 | R1 � und � y2 | R2 � ist. Nach √ Amplituden Tabelle 17.3 sind diese beiden Amplituden 1/ 2 und i/ 2, sodass gilt i � x1 y 2 | R 1 R 2 � = + . 2 Entsprechend finden wir i � x1 y2 | L1 L2 � = − . 2 Wenn wir diese beiden Amplituden gemäß (18.21) subtrahieren, erhalten wir � x1 y2 | F � = +i .
(18.22)
Wenn Sie also ein Photon in Ihrem x-polarisierten Detektor erhalten, wird Ihr Kollege mit Wahrscheinlichkeit eins5 ein Photon in seinem y-polarisierten Detektor auffangen. Nun nehmen wir an, dass Ihr Kollege seinen Zähler ebenfalls auf x-Polarisation einstellt. Er würde niemals einen Zählimpuls erhalten, wenn Sie einen erhalten haben. Wenn Sie das durchrechnen, bekommen Sie � x1 x2 | F � = 0 .
(18.23)
Es wird natürlich auch herauskommen, dass, wenn Sie Ihren Zähler auf y-Polarisation einstellen, er nur dann gleichzeitige Zählimpulse erhält, wenn er seinen auf x-Polarisation eingestellt hat. 5
Wir haben unsere Amplituden nicht normiert oder mit der Amplitude für den Zerfall in irgendeinen besonderen Endzustand multipliziert, dennoch können wir sehen, dass dieses Ergebnis richtig ist, weil wir die Wahrscheinlichkeit null erhalten, wenn wir die andere Alternative betrachten – siehe (18.23).
18.3 Die Vernichtung von Positronium
375
Nun führt dies alles zu einer interessanten Situation. Angenommen, Sie stellen ein Stück Kalkspat auf, das die Photonen in einen x-polarisierten und einen y-polarisierten Strahl aufteilt, und stellen einen Zähler in jeden Strahl. Nennen wir den einen x-Zähler und den anderen y-Zähler. Wenn Ihr Kollege auf der anderen Seite dasselbe tut, können Sie ihm immer sagen, in welchen Strahl sein Photon hineingehen wird. Wann immer Sie und er gleichzeitige Zählimpulse erhalten, können Sie nachschauen, welcher von Ihren Detektoren das Photon eingefangen hat und ihm dann sagen, welcher von seinen Zählern ein Photon registriert hat. Angenommen, Sie stellen bei einem bestimmten Zerfall fest, dass ein Photon in Ihren x-Zähler gegangen ist; Sie können dann Ihrem Kollegen mitteilen, dass er einen Zählimpuls in seinem y-Zähler gehabt hat. Nun finden viele Leute, die die Quantenmechanik nach der üblichen (altmodischen) Methode lernen, dies verwirrend. Ihnen ist die Vorstellung lieber, dass, wenn erst einmal die Photonen emittiert worden sind, sie wie eine Welle mit bestimmtem Charakter weiterlaufen. Da „irgendein gegebenes Photon“ eine „Amplitude“ hat, x-polarisiert oder y-polarisiert zu sein, sollte es eine Wahrscheinlichkeit geben, es entweder im x- oder im y-Zähler aufzufangen, und dass diese Wahrscheinlichkeit nicht davon abhängen sollte, was irgendeine andere Person über ein vollkommen anderes Photon herausfindet. Sie argumentieren, dass „irgendein anderer, der eine Messung durchführt, nicht imstande sein dürfte, die Wahrscheinlichkeit zu ändern, dass ich etwas finden werde.“ Unsere Quantenmechanik sagt jedoch, dass Sie nach einer Messung am Photon eins genau vorhersagen können, wie die Polarisation von Photon zwei bei seinem Nachweis sein wird. Diese Implikation wurde von Einstein nie akzeptiert, und er beschäftigte sich damit sehr eingehend – sie wurde als „Einstein-Podolsky-Rosen-Paradoxon“ oder kurz „EPRParadoxon“ bekannt. Wenn man aber die Situation so beschreibt, wie wir es hier getan haben, scheint es überhaupt kein Paradoxon zu geben; es ergibt sich ganz natürlich, dass das, was an einem Ort gemessen wird, mit dem verknüpft ist, was irgendwo anders gemessen wird. Die Argumentation, dass das Ergebnis paradox sei, läuft etwa so: (1) Wenn Sie einen Zähler haben, der Ihnen sagt, ob Ihr Photon RZ oder LZ ist, können Sie genau vorhersagen, welche Art Photon (RZ oder LZ) der andere Beobachter finden wird. (2) Die Photonen, die er empfängt, müssen daher entweder rein RZ oder rein LZ sein, einige von der einen und einige von der anderen Sorte. (3) Sicherlich können Sie nicht die physikalische Natur seiner Photonen verändern, indem Sie die Beobachtungsmethoden für Ihre Photonen ändern. Ganz gleich, welche Messungen Sie an Ihren vornehmen, seine müssen immer noch entweder RZ oder LZ sein. (4) Nun nehmen wir an, er ändert seinen Apparat mit einem Stück Kalkspat derart, dass die Photonen in zwei linear polarisierte Strahlen aufgespalten werden, sodass alle seine Photonen entweder in einen x-polarisierten oder einen y-polarisierten Strahl gehen. In der Quantenphysik gibt es absolut keine Möglichkeit vorherzusagen, in welchen Strahl ein spezielles RZ-Photon gehen wird. Es gibt eine Wahrscheinlichkeit von 50%, dass es in den x-Strahl gehen wird, und eine Wahrscheinlichkeit von 50%, dass es in den y-Strahl gehen wird. Und dasselbe trifft für ein LZ-Photon zu. (5) Da jedes Photon entweder RZ oder LZ ist – nach (2) und (3) – muss jedes eine 50 : 50 Wahrscheinlichkeit haben, in den x-Strahl oder in den y-Strahl zu gehen, und es gibt keine Möglichkeit vorherzusagen, welchen Weg es einschlagen wird.
376
18 Drehimpuls
(6) Dennoch folgt aus der Theorie, dass Sie, wenn Sie Ihr Photon durch einen x-Polarisator gehen sehen, mit Sicherheit vorhersagen können, dass das Photon des anderen Beobachters in seinen y-polarisierten Strahl gehen wird. Dies steht in Widerspruch zu (5), sodass ein Paradoxon vorliegt. Die Natur sieht das „Paradoxon“ jedoch offenbar nicht, weil das Experiment zeigt, dass die Vorhersage in (6) tatsächlich richtig ist. Wir haben den Schlüssel zu diesem „Paradoxon“ schon in unserer allerersten Vorlesung über quantenmechanisches Verhalten in Band II, Kapitel 12 diskutiert.6 In den oben angeführten Argumenten sind die Schritte (1), (2), (4) und (6) alle richtig, aber Schritt (3) und die Folgerung (5) sind falsch, sie geben keine wahre Beschreibung der Natur. Argument (3) sagt, dass Sie durch Ihre Messung (Sie sehen ein RZ- oder ein LZPhoton) bestimmen können, welches von zwei alternativen Ereignissen bei ihm eintritt (er sieht ein RZ- oder ein LZ-Photon) und dass Sie, auch wenn Sie Ihre Messung nicht durchführen, dennoch sagen können, dass sein Ereignis in der einen oder der anderen Alternative eintreten wird. Aber es war genau der wesentliche Punkt von Band II, Kapitel 12 gleich am Anfang zu betonen, dass dies in der Natur nicht so ist. Ihre Beschaffenheit erfordert die Beschreibung durch interferierende Amplituden mit je einer Amplitude für jede Alternative. Eine Messung, welche Amplitude wirklich auftritt, zerstört die Interferenz. Wenn aber eine Messung nicht gemacht wird, können Sie auch nicht mehr sagen, dass „die eine oder die andere Alternative eintritt“. Wenn Sie bei jedem Ihrer Photonen bestimmen könnten, ob es RZ oder LZ ist, und auch, ob es x-polarisiert ist (alles bei demselben Photon), gäbe es tatsächlich ein Paradoxon. Aber Sie können es nicht – das ist ein Beispiel für das Unbestimmtheitsprinzip. Denken Sie immer noch, dass es sich um ein „Paradoxon“ handelt? Seien Sie sich im Klaren darüber, dass es nur dann ein Paradoxon im Verhalten der Natur wäre, wenn man ein Gedankenexperiment aufbauen könnte, für das die Theorie der Quantenmechanik über zwei verschiedene Argumentationsketten nicht übereinstimmende Ergebnisse vorhersagt. Sonst ist das „Paradoxon“ nur ein Konflikt zwischen der Realität und Ihrem Gefühl, wie die Realität Ihrer Meinung nach sein sollte. Glauben Sie, dass es kein „Paradoxon“ ist, sondern höchstens sehr eigenartig? Darauf können wir uns einigen. Das ist es, was die Physik so faszinierend macht.
18.4
Drehmatrix für beliebige Spins
Mittlerweile haben Sie sicher erkannt, wie wichtig der Begriff des Drehimpulses für das Verständnis atomarer Prozesse ist. Bisher haben wir nur Systeme mit Spins – oder „Gesamtdrehimpuls“ – von null, 21 oder eins betrachtet. Es gibt natürlich atomare Systeme mit höherem Drehimpuls. Zur Untersuchung solcher Systeme haben wir Tabellen für die Amplituden bei Drehungen benutzt, wie jene in Abschnitt 17.6. Das heißt, wir haben die Matrix der Amplituden für Spin 23 , 2, 52 , 3 usw. verwendet. Obwohl wir diese Tabellen nicht im Einzelnen ausarbeiten wollen, möchten wir Ihnen doch wenigstens zeigen, wie es gemacht wird, damit Sie gegebenenfalls selbst dazu in der Lage sind. 6
Siehe auch Kapitel 1 in diesem Band.
18.4 Drehmatrix für beliebige Spins
377
Wie wir früher gesehen haben, kann jedes System, das den Spin oder „Gesamtdrehimpuls“ j hat, in einem der (2 j + 1)-Zustände existieren, für die die z-Komponente des Drehimpulses einen der diskreten Werte j, j − 1, j − 2, . . . , −( j − 1), − j (alle in Einheiten von ) hat. Wenn wir die z-Komponente des Drehimpulses eines speziellen Zustandes m nennen, können wir einen speziellen Drehimpulszustand definieren, indem wir die Zahlenwerte der zwei „Drehimpulsquantenzahlen“ j und m angeben. Wir können diesen Zustand mit dem Zustandsvektor | j, m � bezeichnen. Im Falle eines Spin- 21 -Teilchens sind die zwei Zustände dann | 12 , 12 � und | 12 , − 12 �. Bei einem Spin-eins-System sind die Zustände in dieser Notation | 1, +1 � , | 1, 0 � , | 1, −1 �. Ein Spin-null-Teilchen hat natürlich nur den einen Zustand | 0, 0 �.
Nun möchten wir wissen, was geschieht, wenn wir den allgemeinen Zustand | j, m � in eine auf ein gedrehtes Koordinatensystem bezogene Darstellung projizieren. Als Erstes wissen wir, dass j eine Zahl ist, die das System charakterisiert, daher ändert sie sich nicht. Wenn wir das Koordinatensystem drehen, erhalten wir nur eine Mischung der verschiedenen m-Zustände für dasselbe j. Im Allgemeinen wird es eine Amplitude dafür geben, dass das System in dem gedrehten Koordinatensystem im Zustand | j, m� � ist, wobei m� die neue z-Komponente des Drehimpulses angibt. Wir fragen daher nach allen Matrixelementen � j, m� | R | j, m � für die verschiedenen Drehungen. Wir wissen bereits, was geschieht, wenn wir um einen Winkel φ um die z-Achse drehen. Der neue Zustand ist einfach der alte multipliziert mit eimφ – er hat immer noch denselben m-Wert. Wir können dies ausdrücken durch Rz (φ) | j, m � = eimφ | j, m � .
(18.24)
Oder, wenn Sie es vorziehen � j, m� | Rz (φ) | j, m � = δm,m� eimφ
(18.25)
(wobei δm,m� gleich eins ist, wenn m� = m ist, und sonst null). Bei einer Drehung um irgendeine andere Achse wird es eine Mischung der verschiedenen m-Zustände geben. Wir könnten natürlich versuchen, die Matrixelemente für eine beliebige Drehung auszurechnen, die durch die Eulerschen Winkel β, α und γ beschrieben wird. Es ist aber leichter, wenn man bedenkt, dass die allgemeinste Drehung aus den drei Drehungen Rz (γ), Ry (α), Rz(β) zusammengesetzt werden kann. Wenn wir daher die Matrixelemente für eine Drehung um die y-Achse kennen, wissen wir alles, was wir brauchen. Wie können wir die Drehmatrix für eine Drehung um den Winkel θ um die y-Achse für ein Teilchen mit Spin j finden? Eine allgemeingültige Antwort haben wir nicht. Wir haben die Drehmatrix für Spin 21 mit einem komplizierten Symmetrieargument gefunden. Wir haben es dann für Spin eins wiederholt, indem wir den Spezialfall eines Spin-eins-Systems betrachtet haben, das aus zwei Spin- 21 -Teilchen gebildet ist. Wenn Sie uns folgen wollen und die Tatsache akzeptieren, dass im allgemeinen Fall die Ergebnisse nur vom Spin j abhängen und unabhängig davon sind, wie das Objekt mit Spin j im Inneren aufgebaut ist, können wir die Beweisführung für Spin eins auf beliebigen Spin ausdehnen. Wir können zum Beispiel ein künstliches System mit Spin 32 aus drei Spin- 21 -Objekten konstruieren. Wir können sogar Schwierigkeiten vermeiden, indem wir uns vorstellen, dass sie alle verschiedene Teilchen sind – wie ein Proton, ein Elektron und ein Myon. Wenn wir jedes Spin- 21 -Objekt transformieren, können wir sehen, was mit dem ganzen System passiert – wobei wir daran denken, dass für den zusammengesetzten Zustand die drei Amplituden multipliziert werden. Schauen wir, wie es in diesem Falle geht.
378
18 Drehimpuls
Angenommen, alle drei Spin- 21 -Objekte haben den Spin „up“; wir können diesen Zustand mit | + + + � bezeichnen. Wenn wir dieses System in einem um den Winkel φ um die z-Achse gedrehten Koordinatensystem betrachten, bleibt jedes Plus ein Plus, wird aber mit eiφ/2 multipliziert. Da wir drei solche Faktoren haben, gilt Rz (φ) | + + + � = ei(3φ/2 ) | + + + � .
(18.26)
Offensichtlich ist der Zustand | + + + � gerade das, was wir mit dem Zustand m = + 32 meinen, oder der Zustand | 32 , + 32 �.
Wenn wir dieses System nun um die y-Achse drehen, wird jedes der Spin- 21 -Objekte eine Amplitude haben, plus oder minus zu sein, daher wird das System jetzt eine Mischung der acht möglichen Kombinationen | + + + �, | + + − �, | + − + �, | − + + �, | + − − �, | − + − �, | − − + � und | − − − � sein. Es ist jedoch klar, dass diese in vier Gruppen aufgeteilt werden können, wobei jede Gruppe einem speziellen Wert von m entspricht. Als Erstes haben wir den Zustand | + + + �, für den m = 32 ist. Dann gibt es die drei Zustände | + + − �, | + − + �, | − + + �, von denen jeder zwei Plus und ein Minus hat. Da jedes Spin- 21 -Objekt dieselbe Wahrscheinlichkeit hat, bei der Drehung mit einem Minus herauszukommen, müssen die Beträge dieser drei Kombinationen gleich sein. Nehmen wir also die Kombination
1 (18.27) √ {| + + − � + | + − + � + | − + + �} , 3 √ wobei der Faktor 1/ 3 für die Normierung des Zustands sorgt. Wenn wir diesen Zustand um die z-Achse drehen, erhalten wir einen Faktor eiφ/2 für jedes Plus und e−iφ/2 für jedes Minus. Jeder Term in (18.27) wird folglich mit eiφ/2 multipliziert, sodass der gemeinsame Faktor eiφ/2 ist. Dieser Zustand genügt unserer Vorstellung von einem m = + 21 Zustand; wir können folgern 1 √ {| + + − � + | + − + � + | − + + �} = | 32 , + 21 � . 3
(18.28)
Entsprechend können wir schreiben 1 √ {| + − − � + | − + − � + | − − + �} = | 32 , − 21 � , 3
(18.29)
was einem Zustand mit m = − 12 entspricht. Beachten Sie, dass wir nur die symmetrischen Kombinationen bilden – wir bilden keine Kombinationen mit subtrahierten Basiszuständen. Sie würden Zuständen mit demselben m, aber anderem j entsprechen. (Es ist genauso wie im Spin√ eins-Fall, wo√wir gefunden haben, dass (1/ 2){| +− � + | −+ �} der Zustand | 1, 0 � ist, aber der Zustand (1/ 2){| +− � − | −+ �} der Zustand | 0, 0 � ist.) Schließlich erhalten wir | 32 , − 23 � = | − − − � .
(18.30)
Wir fassen unsere vier Zustände in Tabelle 18.1 zusammen. Nun brauchen wir nur noch jeden Zustand zu nehmen, ihn um die y-Achse zu drehen und zu sehen, wie viel von den anderen Zuständen er ergibt – wobei wir unsere bekannte Drehmatrix für
18.4 Drehmatrix für beliebige Spins
379
Tabelle 18.1: Zustände eines Systems mit Spin
3 2
= | 32 , + 23 �
|+++�
1 √ { | + + − � + | + − + � + | − + + �} = | 32 , + 21 � 3 1 √ { | + − − � + | − + − � + | − − + �} = | 32 , − 21 � 3 |−−−� = | 32 , − 23 � die Spin- 21 -Teilchen verwenden. Wir können auf genau dieselbe Weise vorgehen, wie wir es im Spin-eins-Fall in Abschnitt 12.6 gemacht haben. (Es erfordert nur etwas mehr Rechenaufwand.) Wir wollen direkt der Argumentation von Kapitel 12 folgen und deshalb nicht alle Erklärungen im Detail wiederholen. Die Zustände im System S werden | 32 , + 32 , S � = | + + + �, | 32 , + 21 , S � = √ (1/ 3){| + + − � + | + − + � + | − + + �} usw. Das T -System ist eines, das um die y-Achse von S um den Winkel θ gedreht ist. Zustände in T werden mit | 23 , + 23 , T �, | 32 , + 21 , T � usw. bezeichnet. Natürlich ist | 32 , + 23 , T � dasselbe wie | +� +� +� �, wobei die Striche immer auf das T -System √ verweisen. Entsprechend ist | 23 , + 21 , T � gleich (1/ 3){| +� +� −� �+| +� −� +� �+| −� +� +� �} usw. Jeder | +� �-Zustand im T -System kommt über die Matrixelemente von Tabelle 12.4 sowohl von den | + � als auch den | − �-Zuständen in S her. Wenn wir drei Spin- 21 -Teilchen haben, wird Gleichung (12.47) ersetzt durch | + + + � = a 3 | +� +� +� � + a 2 b | + � +� −� � + | + � −� +� � + | − � +� +� � + ab2 | +� −� −� � + | −� +� −� � + | −� −� +� � + b3 | −� −� −� �
(18.31)
Unter Verwendung der Tabelle 18.1 erhalten wir anstelle von (12.48) die Gleichung √ | 32 , + 23 , S � = a3 | 32 , + 32 , T � + 3 a2 b | 32 , + 21 , T � √ + 3 ab2 | 32 , − 21 , T � + b3 | 32 , − 23 , T � .
(18.32)
Diese liefert uns schon mehrere Matrixelemente � jT | iS �. Um den Ausdruck für | 32 , + 21 , S � zu erhalten, beginnen wir mit der Transformation eines Zustandes mit zwei „+“- und einem „−“-Bestandteil. Zum Beispiel | + + − � = a2 c | +� +� +� � + a2 d | +� +� −� � + abc | +� −� +� � + bac | −� +� +� � + abd | +� −� −� � + bad | −� +� −� � 2
2
(18.33)
+b c|− − + �+ b d|− − − � . �
�
�
�
�
�
Wenn wir die beiden analogen Ausdrücke für | + − + � und | − + + � zu (18.33) addieren und
380
18 Drehimpuls √ 3 dividieren, erhalten wir √ | 32 , + 21 , S � = 3 a2 c | 32 , + 23 , T �
durch
+ (a2 d + 2abc) | 32 , + 21 , T �
(18.34)
+ (2bad + b2 c) | 32 , − 21 , T � √ + 3 b2 d | 32 , − 32 , T � .
Wenn wir den Prozess fortsetzen, finden wir alle Elemente � jT | iS � der Transformationsmatrix, siehe Tabelle 18.2. Die erste Spalte ergibt sich aus (18.32); die zweite aus (18.34). Die letzten beiden Spalten wurden auf dieselbe Art berechnet. Tabelle 18.2: Drehmatrix für ein Spin- 32 -Teilchen. Die Koeffizienten a, b, c, d sind in Tabelle 12.4 angegeben.
� jT | iS �
| 32 , + 23 , S �
| 32 , + 23 , T � | 32 , + 21 , T �
a3 √ 2 3a b √ 3 ab2
| 32 , − 23 , T �
b3
| 32 , − 21 , T �
| 32 , + 21 , S � √ 2 3a c
| 32 , − 21 , S � √ 3 ac2
a2 d + 2abc
c2 d + 2dac
2bad + b2 c √ 2 3b d
2cdb + d 2 a √ 3 bd 2
| 32 , − 23 , S � c3 √ 2 3c d √ 3 cd 2 d3
Nun nehmen wir an, das T -System wäre bezüglich S um den Winkel θ um dessen y-Achse gedreht. Dann haben a, b, c, d die Werte a = d = cos θ/2 und c = −b = sin θ/2, siehe (12.54). Wenn wir diese Werte in Tabelle 18.2 verwenden, erhalten wir die Formen, die dem zweiten Teil von Tabelle 17.2 entsprechen, jedoch für ein System vom Spin 23 . Die Argumente, die wir gerade durchgegangen sind, kann man ohne weiteres auf ein System mit beliebigem Spin j verallgemeinern. Die Zustände | j, m � können dann aus 2 j Teilchen, von denen jedes den Spin 12 hat, zusammengesetzt werden. (Es gibt j + m von ihnen im | + �Zustand und j − m im | − �-Zustand.) Man bildet die Summen über alle möglichen Arten, auf die dies getan werden kann, und der Zustand wird durch Multiplikation mit einer geeigneten Konstanten normiert. Wer von Ihnen mathematische Neigungen hat, kann vielleicht zeigen, dass das folgende Resultat herauskommt:7 � j, m� | Ry (θ) | j, m � = ( j + m)!( j − m)!( j + m� )!( j − m� )! 1/2 (−1)k+m−m� (cos θ/2)2 j+m� −m−2k (sin θ/2)m−m� +2k , × (m − m� + k)!( j + m� − k)!( j − m − k)!k! k wobei k über alle Werte laufen muss, die Terme ≥ 0 in allen Fakultäten ergeben.
(18.35)
Dies ist eine recht umfangreiche Formel, aber mit ihr können Sie Tabelle 17.2 für j = 1 nachprüfen und eigene Tabellen für größere j aufstellen. Verschiedene spezielle Matrixelemente 7
Einzelheiten finden Sie in den Kapiteln 5 und 6 von Band IV.
18.5 Messung eines Kernspins
381
sind von besonderer Wichtigkeit und haben spezielle Namen erhalten. Zum Beispiel sind die Matrixelemente für m = m� = 0 und ganzzahlige j als Legendre-Polynome bekannt und werden mit P j (cos θ) bezeichnet: � j, 0 | Ry (θ) | j, 0 � = P j (cos θ) .
(18.36)
Die ersten vier dieser Polynome sind: P0 (cos θ) = 1 , P1 (cos θ) = cos θ ,
(18.37) (18.38)
P2 (cos θ) = 12 (3 cos2 θ − 1) ,
(18.39)
P3 (cos θ) =
18.5
3 1 2 (5 cos
θ − 3 cos θ) .
(18.40)
Messung eines Kernspins
Wir wollen nun ein Beispiel für die Anwendung der eben ermittelten Koeffizienten betrachten. Es hat mit einem interessanten Experiment zu tun, das zu verstehen Sie jetzt in der Lage sein werden. Ein paar Physiker wollten den Spin eines bestimmten angeregten Zustandes des Ne20 Kerns herausfinden. Dazu haben sie ein Kohlenstoff-Target mit einem Strahl beschleunigter Kohlenstoffionen beschossen und den gewünschten angeregten Zustand von Ne20 erzeugt, der mit Ne20∗ bezeichnet wird und durch die Reaktion C12 + C12 → Ne20∗ + α1
entsteht. Hierbei ist α1 das α-Teilchen oder He4 . Mehrere der angeregten Zustände des auf diese Art erzeugten Ne20 sind instabil und zerfallen gemäß Ne20∗ → O16 + α2 . Daher gibt es im Experiment zwei α-Teilchen, die bei der Reaktion entstehen. Wir bezeichnen sie mit α1 und α2 . Aufgrund ihrer unterschiedlichen Energien kann man sie voneinander unterscheiden. Indem wir eine bestimmte Energie für α1 auswählen, können wir auch jeden einzelnen angeregten Zustand des Ne20 herausfinden.
α
2
Silizium-Halbleiterdetektoren
C12 -Strahl 16 MeV
θ α1 Kohlenstofffolie 30 μg/cm2
Abb. 18.9: Experimentelle Anordnung zur Bestimmung des Spins eines bestimmten Zustands von Ne20 .
Abbildung 18.9 zeigt den Aufbau des Experiments. Ein Strahl von 16-MeV-Kohlenstoffionen wurde auf eine dünne Kohlenstofffolie gerichtet. Das erste α-Teilchen (α1 ) wurde in einem
382
18 Drehimpuls
Silizium-Halbleiter-Detektor registriert, der so aufgebaut war, dass er α-Teilchen der richtigen Energie akzeptierte, die sich in Vorwärtsrichtung bewegten (bezüglich des einfallenden C12 Strahls). Das zweite α-Teilchen (α2 ) wurde in einem zweiten Zähler aufgefangen, der mit dem ersten den Winkel θ bildet. Die Zählrate der Koinzidenzsignale von α1 und α2 wurde als Funktion des Winkels θ gemessen. Die Idee des Experiments ist folgende. Als Erstes müssen Sie wissen, dass die Spins von C12 , O16 und dem α-Teilchen alle null sind. Wenn wir die Bewegungsrichtung des ursprünglichen C12 die +z-Richtung nennen, dann wissen wir, dass das Ne20∗ den Drehimpuls null um die zAchse haben muss. Keines der anderen Teilchen hat irgendeinen Spin; das C12 kommt längs der z-Achse an und auch das α1 bewegt sich längs der z-Achse, sodass sie keinen Drehimpuls um die z-Achse haben können. Daher wissen wir, was auch immer der Spin j des Ne20∗ ist, dass es im Zustand | j, 0 � ist. Was wird jetzt passieren, wenn das Ne20∗ in ein O16 und das zweite αTeilchen zerfällt? Nun, das α2 -Teilchen wird im zweiten Zähler aufgefangen und das O16 muss, um den Impuls zu erhalten, in die entgegengesetzte Richtung wegfliegen.8 Um die neue Achse in Richtung von α2 kann es keine Komponente des Drehimpulses geben. Der Endzustand hat den Drehimpuls null um die neue Achse, daher kann das Ne20∗ auf diese Art nur dann zerfallen, wenn es eine Amplitude dafür hat, m� gleich null zu haben, wobei m� die Quantenzahl der Komponente des Drehimpulses um die neue Achse ist. Tatsächlich ist die Wahrscheinlichkeit, „α2 “ beim Winkel θ zu beobachten, das Quadrat der Amplitude (oder des Matrixelementes) � j, 0 | Ry (θ) | j, 0 � .
(18.41)
Um den Spin des in Frage kommenden Ne20∗ -Zustandes zu finden, wurde die Intensität des α2 -Teilchens als Funktion des Winkels θ aufgetragen und mit den theoretischen Kurven für verschiedene j-Werte verglichen. Wie wir im vorigen Abschnitt ausgeführt haben, sind die Amplituden � j, 0 | Ry (θ) | j, 0 � gerade die Funktionen P j (cos θ). Daher sind die möglichen Winkelverteilungen Kurven von [P j (cos θ)]2 . Die experimentellen Ergebnisse sind für zwei der angeregten Zustände in Abbildung 18.10 dargestellt. Sie können sehen, dass die Winkelverteilung für den 5,80-MeV-Zustand sehr gut mit der Kurve für [P1 (cos θ)]2 zusammenfällt, und daher muss es ein Spin-eins-Zustand sein. Die Daten für den 5,63-MeV-Zustand dagegen sind ganz anders; sie passen zu der Kurve [P3 (cos θ)]2 . Der Zustand hat also den Spin drei. Mit diesem Experiment konnten wir den Drehimpuls von zwei der angeregten Zustände des Ne20∗ herausfinden. Anhand dieser Information kann man dann versuchen zu verstehen, wie die Konfiguration der Protonen und Neutronen innerhalb dieses Kerns ist – ein weiterer Beitrag zu den Informationen über die geheimnisvollen Kernkräfte.
18.6
Addition von Drehimpulsen
Als wir in Kapitel 12 die Hyperfeinstruktur des Wasserstoffatoms untersucht haben, mussten wir die inneren Zustände eines Systems aus zwei Teilchen, aus einem Elektron und einem Proton, bestimmen, von denen jedes den Spin 21 hat. Wir fanden heraus, dass die vier möglichen Spinzustände eines solchen Systems in zwei Gruppen zusammengefasst werden können – in 8
Wir können den auf das Ne20∗ beim ersten Zusammenstoß übertragenen Impuls vernachlässigen. Oder, noch besser, wir können berechnen, wie groß er ist, und eine Korrektur dafür vornehmen.
18.6 Addition von Drehimpulsen
383
5,80-MeV-Zustand, J = 1 0,12 [Koinzidenz/Richtung]C.M. pro Sterad. (C.M.=Schwerpunktsystem)
0,10
0,61 ×
3 2 4π [P1 (cos θ)]
0,08 0,06 0,04 0,02
0,06
5,63-MeV-Zustand, J = 3 7 0,36 × 4π [P3 (cos θ)]2
0,04 0,02 20 40 60 80 100 120 140 160 Winkel im Schwerpunktsystem in Grad
Abb. 18.10: Experimentelle Ergebnisse für die Winkelverteilung der α2 Teilchen aus den zwei angeregten Zuständen des Ne20 , die in der Anordnung von Abbildung 18.9 erzielt wurden. [Aus J. A. Kuehner, Physical Review, Bd. 125. S. 1650, 1962.].
eine Gruppe mit drei Zuständen gleicher Energie, die für die äußere Welt wie ein Spin-einsTeilchen wirkt, und in einen verbleibender Zustand, der sich wie ein Teilchen mit Spin null verhält. Das heißt, wenn wir zwei Spin- 21 -Teilchen zusammensetzen, können wir ein System bilden, dessen „Gesamtspin“ eins oder null ist. In diesem Abschnitt möchten wir in allgemeinerer Form die Spinzustände eines Systems diskutieren, das aus zwei Teilchen mit beliebigen Spins gebildet ist. Es ist ein weiteres wichtiges Problem, das mit dem Drehimpuls in quantenmechanischen Systemen zusammenhängt. Schreiben wir zuerst noch einmal die Ergebnisse von Kapitel 12 für das Wasserstoffatom in einer Form, die man leichter auf den allgemeinen Fall erweitern kann. Wir haben mit zwei Teilchen begonnen, die wir jetzt Teilchen a (das Elektron) und Teilchen b (das Proton) nennen wollen. Teilchen a hatte den Spin ja (= 21 ), und seine z-Komponente des Drehimpulses ma konnte einen von mehreren Werten annehmen (in diesem Fall 2, nämlich ma = + 21 oder ma = − 21 ). Entsprechend wird der Spinzustand von Teilchen b durch seinen Spin jb und seine zKomponente des Drehimpulses mb beschrieben. Es konnten verschiedene Kombinationen der Spinzustände der beiden Teilchen gebildet werden. Zum Beispiel konnten Teilchen a mit ma = 1 1 1 1 2 und Teilchen b mit mb = − 2 einen Zustand | a, + 2 ; b, − 2 � bilden. Im Allgemeinen bildeten die zusammengesetzten Zustände ein System, dessen „Systemspin“ oder „Gesamtspin“ oder „Gesamtdrehimpuls“ J gleich 1 oder 0 sein konnte. Und das System konnte eine z-Komponente des Drehimpulses M gleich +1, 0 oder −1 haben, wenn J = 1 ist oder gleich 0, wenn J = 0 ist. In dieser neuen Notation können wir die Formeln in (12.41) und (12.42), wie in Tabelle 18.3 gezeigt, noch einmal schreiben. In jeder Gleichung steht auf der linke Seite der zusammengesetzte Zustand, ausgedrückt durch den Gesamtdrehimpuls J und seine z-Komponente M. Auf der rechten Seite steht, ausgedrückt durch die m-Werte der Teilchen a und b, wie der Zustand gebildet ist.
384
18 Drehimpuls
Tabelle 18.3: Addition der Drehimpulse von zwei Spin- 12 -Teilchen ( ja = 12 , jb = 12 )
| J = 1, M = +1 � = | a, + 21 ; b, + 21 �
1 | J = 1, M = 0 � = √ | a, + 21 ; b, − 21 � + | a, − 21 ; b, + 21 � 2 | J = 1, M = −1 � = | a, − 21 ; b, − 21 � 1 | J = 0, M = 0 � = √ | a, + 21 ; b, − 21 � − | a, − 21 ; b, + 21 � 2
Wir wollen dieses Ergebnis nun auf Zustände verallgemeinern, die aus zwei Objekten a und b mit beliebigen Spins ja und jb aufgebaut sind. Wir beginnen mit einem Beispiel, bei dem ja = 12 und jb = 1 ist, nämlich dem Deuteriumatom, in dem Teilchen a ein Elektron (e) und Teilchen b der Kern – ein Deuteron (d) – ist. Wir haben dann für das Elektron ja = je = 12 . Das Deuteron besteht aus einem Proton und einem Neutron in einem Zustand, dessen Gesamtspin eins ist, daher ist jb = jd = 1. Wir möchten die Hyperfeinzustände des Deuteriums untersuchen – genauso, wie wir es beim Wasserstoff gemacht haben. Da das Deuteron drei mögliche Zustände mb = md ∈ {+1, 0, −1} hat und das Elektron zwei, ma = me ∈ {+ 12 , − 12 }, gibt es folglich sechs mögliche Zustände (bei Verwendung der Schreibweise | e, me ; d , md �): | e, + 21 ; d, +1 � ,
| e, + 21 ; d, 0 � ; | e, − 21 ; d, +1 � ,
| e, + 21 ; d, −1 � ; | e, − 21 ; d, 0 � ,
(18.42)
| e, − 21 ; d, −1 � ,
Sie werden bemerken, dass wir die Zustände nach den Werten der Summe von me und md gruppiert haben – in absteigender Reihenfolge angeordnet. Nun fragen wir: Was geschieht mit diesen Zuständen, wenn wir zu einem anderen Koordinatensystem übergehen? Wenn das neue System um den Winkel φ um die z-Achse gedreht ist, dann wird der Zustand | e, me ; d , md � multipliziert mit eime φ eimd φ = ei(me +md )φ .
(18.43)
(Der Zustand kann als das Produkt | e, me � | d, md � angesehen werden, und jeder Zustandsvektor steuert unabhängig vom anderen seinen eigenen Exponentialfaktor bei.) Der Faktor (18.43) ist von der Form eiMφ , daher hat der Zustand | e, me ; d, md � eine z-Komponente des Drehimpulses gleich M = m e + md .
(18.44)
Die z-Komponente des Gesamtdrehimpulses ist die Summe der z-Komponenten der Drehimpulse der einzelnen Teile. In der Liste (18.42) hat daher der Zustand in der obersten Zeile M = + 32 , die beiden Zustände in der zweiten Zeile haben M = + 12 , die nächsten beiden haben M = − 12 und der letzte Zustand
18.6 Addition von Drehimpulsen
385
hat M = − 23 . Wir sehen sofort, dass eine Möglichkeit für den Spin J des zusammengesetzten Zustands (für den Gesamtdrehimpuls) 32 sein muss, und das entspricht vier Zuständen mit M ∈ {+ 32 , + 21 , − 21 − 32 }.
Es gibt nur einen Kandidaten für M = 32 , wir wissen daher schon, dass | J = 32 , M = + 23 � = | e, + 21 ; d, +1 � .
(18.45)
Aber was ist der Zustand | J = 23 , M = + 12 �? Wir haben zwei Kandidaten in der zweiten Zeile von (18.42), und in der Tat ergibt jede Linearkombination von ihnen M = 12 . Im Allgemeinen erwarten wir daher, dass | J = 32 , M = + 21 � = α | e, + 21 ; d, 0 � + β | e, − 21 ; d, +1 � ,
(18.46)
wobei a und β zwei Zahlen sind, die Clebsch-Gordan-Koeffizienten genannt werden. Unser nächstes Problem besteht darin, sie zu bestimmen. Das ist nicht schwierig, wenn wir uns daran erinnern, dass das Deuteron aus einem Neutron und einem Proton aufgebaut ist, und wenn wir die Deuteronzustände (18.42) ausführlicher ausschreiben, indem wir die Regeln von Tabelle 18.3 benutzen. Wenn wir das tun, erhalten wir Tabelle 18.4. Tabelle 18.4: Drehimpulszustände für ein Deuteriumatom. 3 2 | e, + 21 ;
M= | e, + 21 ; d, +1 � =
M=
n, + 21 ; p, + 21 �
1 2
1 | e, + 21 ; d, 0 � = √ | e, + 21 ; n, + 21 ; p, − 21 � + | e, + 21 ; n, − 21 ; p, + 21 � 2 | e, − 21 ; d, +1 � = | e, − 21 ; n, + 21 ; p, + 21 � M = − 12
| e, + 21 ; d, −1 � = | e, + 21 ; n, − 21 ; p, − 21 � 1 | e, − 21 ; d, 0 � = √ | e, − 21 ; n, + 21 ; p, − 21 � + | e, − 21 ; n, − 21 ; p, + 21 � 2 M = − 32
| e, − 21 ; d, −1 � = | e, − 21 ; n, − 21 ; p, − 21 � Wir möchten, unter Benutzung der Zustände in der Tabelle 18.4, die vier Zustände mit J = 3 2 bilden. Aber wir kennen die Antwort schon, weil wir in Tabelle 18.1 die Zustände mit Spin 32 haben, die aus drei Spin- 21 -Teilchen gebildet sind. Der erste Zustand in Tabelle 18.1 hat | J = 32 , M = + 32 � und er ist | + + + �, was in unserer Notation | e, + 21 ; n, + 21 ; p, + 21 � entspricht bzw. dem ersten Zustand in Tabelle 18.4. Aber dieser Zustand ist auch derselbe wie der
386
18 Drehimpuls
erste in der Liste (18.42), was unsere Feststellung in (18.45) bestätigt. Die zweite Zeile von Tabelle 18.1 besagt in unserer Notation 1 | J = 32 , M = + 21 � = √ | e, + 21 ; n, + 21 ; p, − 21 � 3 1 1 + | e, + 2 ; n, − 2 ; p, + 21 � + | e, − 21 ; n, + 21 ; p, + 21 � .
(18.47)
Die rechte Seite kann offenbar aus den√beiden Einträgen in der zweiten √ Zeile von Tabelle 18.4 zusammengesetzt werden, wenn man 2/3 vom ersten Term und 1/3 vom zweiten nimmt. Das heißt, Gleichung (18.47) ist gleichbedeutend mit | J = 32 , M = + 21 � = 2/3 | e, + 21 ; d, 0 � + 1/3 | e, − 21 ; d, +1 � . (18.48) Damit haben wir die in (18.46) eingeführten Clebsch-Gordan-Koeffizienten a und β gefunden: (18.49) α = 2/3 , β = 1/3 .
Nach derselben Prozedur erhalten wir | J = 32 , M = − 21 � = 1/3 | e, + 21 ; d, −1 � + 2/3 | e, − 21 ; d, 0 �
(18.50)
und natürlich auch
| J = 32 , M = − 23 � = | e, − 21 ; d, −1 � .
(18.51)
Dies sind die Regeln für die Addition von Spin 12 und Spin 1 zu einem Gesamtspin J = 32 . Wir fassen (18.45), (18.48), (18.50) und (18.51) in Tabelle 18.5 zusammen. Tabelle 18.5: Die J = 32 -Zustände des Deuteriumatoms.
| J = 32 , M = + 32 � = | e, + 21 ; d, +1 � . | J = 32 , M = + 12 � = 2/3 | e, + 21 ; d, 0 � + 1/3 | e, − 21 ; d, +1 � | J = 32 , M = − 12 � = 1/3 | e, + 21 ; d, −1 � + 2/3 | e, − 21 ; d, 0 � | J = 32 , M = − 32 � = | e, − 21 ; d, −1 � .
Wir haben jedoch nur vier Zustände berücksichtigt, während das betrachtete System sechs mögliche Zustände hat. Von den beiden Zuständen in der zweiten Zeile von (18.42) haben wir nur eine Linearkombination benutzt, um | J = 32 , M = + 12 � zu bilden. Es gibt aber noch eine andere Linearkombination, orthogonal zu der, die wir genommen haben, und die auch M = + 21 hat, nämlich 1/3 | e, + 21 ; d, 0 � − 2/3 | e, − 21 ; d, +1 � . (18.52)
Entsprechend können die beiden Zustände in der dritten Zeile von (18.42) zu zwei orthogonalen Zuständen kombiniert werden, von denen jeder M = − 21 hat. Der zu (18.50) orthogonale Zustand ist 2/3 | e, + 21 ; d, −1 � − 1/3 | e, − 21 ; d, 0 � . (18.53)
18.6 Addition von Drehimpulsen
387
Dies sind die beiden übrigen Zustände. Sie haben M = me + md = ± 21 und müssen die zwei Zustände sein, die J = 21 entsprechen. Daher haben wir | J = 12 , M = + 12 � = 1/3 | e, + 21 ; d, 0 � − 2/3 | e, − 21 ; d, +1 � , (18.54) | J = 12 , M = − 12 � = 2/3 | e, + 21 ; d, −1 � − 1/3 | e, − 21 ; d, 0 � .
Wir können verifizieren, dass sich diese beiden Zustände tatsächlich wie die Zustände eines Spin- 21 -Objektes verhalten, indem wir die Deuteriumanteile durch die Neutron- und Protonzustände ausdrücken – unter Benutzung von Tabelle 18.4. Der erste Zustand in (18.52) ist
1/6 | e, + 21 ; n, + 21 ; p, − 21 � + | e, + 21 ; n, − 21 ; p, + 21 � − 2/3 | e, − 21 ; n, + 21 ; p, + 21 � .
(18.55)
Er kann auch geschrieben werden als
1/3
1/2 | e, + 21 ; n, + 21 ; p, − 21 � − | e, − 21 ; n, + 21 ; p, + 21 � + 1/2 | e, + 21 ; n, − 21 ; p, + 21 � − | e, − 21 ; n, + 21 ; p, + 21 � .
(18.56)
Nun sehen Sie sich die Terme in der ersten geschweiften Klammer an, und denken Sie sich das e und p zusammengenommen. Zusammen bilden sie einen Spin-null-Zustand (siehe die unterste Zeile von Tabelle 18.3) und steuern keinen Drehimpuls bei. Nur das Neutron mit mn = + 21 bleibt übrig, daher verhält sich die ganze erste geschweifte Klammer bei Drehungen wie ein Neutron, nämlich wie ein Zustand mit J = 21 , M = + 12 . Mit einer analogen Argumentation sehen wir, dass sich in der zweiten geschweiften Klammer von (18.56) das Elektron und das Neutron zusammentun, um einen Drehimpuls null zu bilden, wobei nur der Anteil des Protons mit mp = + 12 übrigbleibt. Die Terme in der zweiten geschweiften Klammer verhalten sich wie ein Objekt mit J = 12 , M = + 12 . Daher transformiert sich der ganze Ausdruck (18.56) wie | J = + 21 , M = + 21 �, wie es auch sein sollte. Der Zustand | J = + 12 , M = − 12 �, der (18.53) entspricht, kann hingeschrieben werden (durch Umändern der richtigen + 12 ’s in − 12 ’s), sodass wir erhalten 1/3 1/2 {| e, + 21 ; n, − 21 ; p, − 21 � − | e, − 21 ; n, − 21 ; p, + 21 �} + 1/2{| e, + 21 ; n, − 21 ; p, − 21 � − | e, − 21 ; n, + 21 ; p, − 21 �} . (18.57)
Sie können leicht nachprüfen, dass dies gleich der zweiten Zeile von (18.54) ist, wie es auch sein sollte, wenn die beiden Terme dieses Paares die beiden Zustände eines Spin- 21 -Systems sein sollen. Damit sind unsere Ergebnisse bestätigt. Ein Deuteron und ein Elektron können in sechs Spinzuständen existieren, von denen sich vier wie die Zustände eines Spin- 23 -Objektes verhalten (Tabelle 18.5) und zwei wie ein Objekt vom Spin 12 (18.54).
Die Ergebnisse von Tabelle 18.5 und Gleichung (18.54) haben wir erhalten, indem wir von der Tatsache Gebrauch gemacht haben, dass das Deuteron aus einem Neutron und einem Proton gebildet ist. Die Gültigkeit der Gleichungen hängt nicht von diesem besonderen Umstand ab. Für jedes Spin-eins-Objekt, das mit einem Spin- 21 -Objekt zusammengesetzt wird, sind die Additionsregeln (und die Koeffizienten) dieselben. Der Satz von Gleichungen in Tabelle 18.5 bedeutet
388
18 Drehimpuls
zum Beispiel, dass sich bei einer Drehung der Koordinaten um die y-Achse – durch die sich die Zustände des Spin- 21 -Teilchens und des Spin-eins-Teilchens gemäß Tabelle 17.1 bzw. Tabelle 17.2 ändern –, die Linearkombinationen auf der rechten Seite auf eine für ein Spin- 23 -Objekt richtige Weise ändern. Bei derselben Drehung werden sich die Zustände von (18.54) wie die Zustände eines Spin- 21 -Objektes ändern. Die Ergebnisse hängen nur von den Drehungseigenschaften (d. h. den Spinzuständen) der beiden ursprünglichen Teilchen ab, in keiner Weise aber von der Herkunft ihrer Drehimpulse. Wir haben von dieser Tatsache nur Gebrauch gemacht, um die Formeln für einen Spezialfall auszurechnen, in dem einer der Bestandteile selbst aus zwei Spin- 21 -Teilchen in einem symmetrischen Zustand zusammengesetzt ist. Wir haben alle unsere Ergebnisse in Tabelle 18.6 zusammengefasst und dabei die Bezeichnungen „e“ und „d“ in „a“ und „b“ geändert, um die Allgemeingültigkeit unserer Schlussfolgerungen zu betonen. Tabelle 18.6: Addition von einem Spin- 21 -Teilchen ( ja = 12 ) und einem Spin-eins-Teilchen ( jb = 1).
| J = 32 , M = + 32 � = | a, + 21 ; b, +1 � | J = 32 , M = + 12 � = 2/3 | a, + 21 ; b, 0 � + 1/3 | a, − 21 ; b, +1 � | J = 32 , M = − 12 � = 1/3 | a, + 21 ; b, −1 � + 2/3 | a, − 21 ; b, 0 � | J = 32 , M = − 32 � = | a, − 21 ; b, −1 � | J = 12 , M = + 12 � = 1/3 | a, + 21 ; b, 0 � − 2/3 | a, − 21 ; b, +1 � | J = 12 , M = − 12 � = 2/3 | a, + 21 ; b, −1 � − 1/3 | a, − 21 ; b, 0 �
Betrachten wir nun das allgemeine Problem, die Zustände zu finden, die sich durch Zusammenfügen zweier Objekte mit beliebigen Spins bilden lassen. Angenommen, der Spin des einen Objekts sei ja (seine z-Komponente ma läuft daher über die 2 ja + 1 Werte von − ja bis + ja ) und der Spin des anderen Objekts sei jb (mit der z-Komponente mb , die von − jb bis + jb läuft). Die zusammengesetzten Zustände sind | a, ma ; b, mb �, und es gibt (2 ja + 1)(2 jb + 1) verschiedene zusammengesetzte Zustände. Welche Zustände mit Gesamtspin J können jetzt gefunden werden? Die z-Komponente des Gesamtdrehimpulses M ist gleich ma + mb , und die Zustände können für die verschiedenen M’s aufgelistet werden (wie in (18.42)). Das größte M ist eindeutig; es entspricht ma = ja und mb = jb und ist daher ja + jb . Das bedeutet, dass der größte Gesamtspin J auch gleich der Summe ja + jb ist: J = (M)max = ja + jb . Für den ersten M-Wert, der kleiner als (M)max ist, gibt es zwei Zustände (entweder ist ma oder mb um eine Einheit kleiner als sein Maximum). Sie müssen einen Zustand zu dem Satz beisteuern, der zu J = ja + jb gehört, und der übriggebliebene wird zu einem neuen System mit J = ja + jb − 1 gehören. Der nächste M-Wert – der dritte von oben in der Liste – kann auf drei Arten gebildet werden. (Aus ma = ja − 2, mb = jb ; aus ma = ja − 1, mb = jb − 1 und aus ma = ja , mb = jb − 2.) Zwei davon gehören zu den Gruppen, die schon oben begonnen wurden;
18.7 Zusatz 1: Herleitung der Drehmatrix
389
die dritte sagt uns, dass Zustände mit J = ja + jb − 2 auch mit einbezogen werden müssen. Diese Argumentation geht weiter bis wir eine Stufe erreichen, wo wir in unserer Liste keinen Schritt mehr in einem der m’s nach unten gehen können, um neue Zustände herzustellen. Sei jb kleiner als ja (wenn sie gleich sind, nehmen wir irgendeinen von beiden); dann sind nur 2 jb Werte von J erforderlich – wobei wir in ganzzahligen Schritten von ja + jb hinunter nach ja − jb gehen. Das heißt, wenn zwei Objekte vom Spin ja und jb zusammengesetzt werden, kann das System einen Gesamtdrehimpuls J haben, der gleich irgendeinem der folgenden Werte ist: ⎧ ⎪ ja + jb ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ja + jb − 1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ j + j −2 a b J=⎪ (18.58) ⎪ ⎪ ⎪ ⎪ . ⎪ .. ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩| j − j | . a b (Indem wir | ja − jb | anstatt ja − jb schreiben, müssen wir nicht jedesmal anmerken, dass ja ≥ jb ist.)
Für jeden dieser J-Werte gibt es die 2J + 1 Zustände mit verschiedenen M-Werten – wobei M von +J bis −J läuft. Jeder von diesen wird aus Linearkombinationen der ursprünglichen Zustände | a, ma ; b, mb � mit geeigneten Faktoren – den Clebsch-Gordan-Koeffizienten für jeden einzelnen Term – gebildet. Wir können uns auf den Standpunkt stellen, dass diese Koeffizienten die „Menge“ des Zustands | ja , ma ; jb , mb � angeben, die im Zustand | J, M � erscheint. Daher hat jeder Clebsch-Gordan-Koeffizient, wenn Sie so wollen, sechs Indizes, die seine Position in Formeln wie denjenigen von Tabelle 18.3 und 18.6 angeben. Das heißt, wenn wir diese Koeffizienten C(J, M; ja , ma ; jb , mb ) nennen, können wir die Gleichheit in der zweiten Zeile von Tabelle 18.6 ausdrücken durch � � � C 23 , + 21 ; 12 , + 21 ; 1, 0 = 2/3 , � � � C 23 , + 21 ; 12 , − 21 ; 1, +1 = 1/3 . Die Koeffizienten für andere Spezialfälle wollen wir hier nicht berechnen.9 Sie können aber in vielen Büchern Tabellen finden. Vielleicht möchten Sie es selbst mit einem anderen Spezialfall versuchen. Der nächste, der betrachtet werden müsste, wäre die Zusammensetzung von zwei Spin-eins-Teilchen. Wir geben in Tabelle 18.7 einfach das Ergebnis an. Die Gesetze für die Addition von Drehimpulsen sind sehr wichtig in der Teilchenphysik, wo sie unzählige Anwendungen finden. Leider haben wir hier nicht genug Zeit, um weitere Beispiele zu betrachten.
18.7
Zusatz 1: Herleitung der Drehmatrix
Für diejenigen unter Ihnen, die es gern genau wissen wollen, rechnen wir nun die allgemeine Drehmatrix für ein System mit dem Spin (Gesamtdrehimpuls) j aus. Es ist eigentlich nicht so 9
Da wir die allgemeine Drehmatrix kennen, siehe (18.35), ist ein großer Teil der Arbeit getan.
390
18 Drehimpuls
Tabelle 18.7: Zusammensetzung von zwei Spin-eins-Teilchen ( ja = 1, jb = 1).
| J = 2, M = +2 � = | a, +1; b, +1 � 1 1 | J = 2, M = +1 � = √ | a, +1; b, 0 � + √ | a, 0; b, +1 � 2 2 1 1 2 | J = 2, M = 0 � = √ | a, +1; b, −1 � + √ | a, −1; b, +1 � + √ | a, 0; b, 0 � 6 6 6 1 1 | J = 2, M = −1 � = √ | a, 0; b, −1 � + √ | a, −1; b, 0 � 2 2 | J = 2, M = −2 � = | a, −1; b, −1 � 1 1 | J = 1, M = +1 � = √ | a, +1; b, 0 � − √ | a, 0; b, +1 � 2 2 1 1 | J = 1, M = 0 � = √ | a, +1; b, −1 � − √ | a, −1; b, +1 � 2 2 1 1 | J = 1, M = −1 � = √ | a, 0; b, −1 � − √ | a, −1; b, 0 � 2 2 1 | J = 0, M = 0 � = √ | a, +1; b, −1 � + | a, −1; b, +1 � − | a, 0; b, 0 � 3
wichtig, den allgemeinen Fall auszuarbeiten; wenn Sie erst einmal das Prinzip verstanden haben, können Sie die allgemeinen Ergebnisse den Tabellen entnehmen, die Sie in vielen Büchern finden. Andererseits möchten Sie vielleicht, nachdem Sie schon so weit gekommen sind, gerne auch die äußerst komplizierten Formeln der Quantenmechanik verstehen, wie beispielsweise Gleichung (18.35), die in die Beschreibung des Drehimpulses eingehen. Wir erweitern die Argumente von Abschnitt 18.4 auf ein System mit Spin j, das wir als aus 2 j Spin- 21 -Objekten bestehend betrachten. Der Zustand mit m = j ist | + + + . . . + � (mit 2 j Pluszeichen). Für m = j − 1 gibt es 2 j Terme wie | + + . . . + +− �, | + + . . . + −+ � usw. Betrachten wir den allgemeinen Fall, in dem es r Pluszeichen und s Minuszeichen gibt, wobei r + s = 2 j. Bei einer Drehung um die z-Achse wird jedes der r Pluszeichen den Faktor e+iφ/2 beitragen. Das Ergebnis ist eine Phasenänderung von (r/2 − s/2)φ. Es gilt daher m=
r−s . 2
(18.59)
Ebenso wie bei j = 32 muss jeder Zustand mit bestimmtem m die Linearkombination mit Plusund Minuszeichen von allen Zuständen mit demselben r und s sein – das heißt, von Zuständen, die jeder möglichen Anordnung entsprechen, die r Pluszeichen und s Minuszeichen hat. Wie Sie sicher ausrechnen können, gibt es (r + s)!/r!s! solche Anordnungen. Um jeden Zustand zu normieren, müssen wir die Summe durch die Quadratwurzel dieser Zahl dividieren. Wir können
18.7 Zusatz 1: Herleitung der Drehmatrix
391
schreiben (r + s)! −1/2 − − · · · − −� | + + + ··· + +− r!s! r
s
+ (alle Umordnungen der Reihenfolge) = | j, m � (18.60)
mit j=
r+s , 2
m=
r−s . 2
(18.61)
Es wird uns bei der Arbeit helfen, wenn wir noch eine weitere Notation einführen. Wenn wir erst einmal die Zustände durch (18.60) definiert haben, kennzeichnen die beiden Zahlen r und s einen Zustand ebenso gut wie j und m. Es wird für die Beschreibung hilfreich sein, wenn wir schreiben | j, m � = | rs � ,
(18.62)
wobei wegen der Gleichheitsbeziehungen von (18.61) gilt: r = j +m,
s = j −m.
Als Nächstes möchten wir (18.60) in einer neuen speziellen Notation schreiben als (r + s)! +1/2 | j, m � = | rs � = {| + �r | − � s }perm . r!s!
(18.63)
Beachten Sie, dass wir den Exponenten des Vorfaktors in plus 12 geändert haben. Wir tun das, weil es gerade N = (r + s)!/r!s! Terme innerhalb der geschweiften Klammern gibt. Wenn wir (18.63) mit (18.60) vergleichen, wird klar, dass {| + �r | − � s }perm
eine abkürzende Notation ist für {| + + . . . − − � + alle Umordnungen} , N wobei N die Anzahl der Terme in der geschweiften Klammer ist. Diese Notation ist deshalb bequem, weil jedes Mal, wenn wir eine Drehung ausführen, alle Pluszeichen denselben Faktor beisteuern, sodass wir diesen Faktor zur r-ten Potenz erhalten. Entsprechend tragen alle s Minusterme zusammen einen Faktor zur s-ten Potenz bei, ganz gleich wie die Reihenfolge der Terme ist. Nun nehmen wir an, wir würden unser System um den Winkel θ um die y-Achse drehen. Was wir haben möchten, ist Ry (θ) | rs �. Wenn Ry (θ) auf jedes | + � angewendet wird, ergibt sich Ry (θ) | + � = | + � C + | − � S ,
(18.64)
wobei C = cos θ/2 und S = − sin θ/2 ist. Wenn Ry (θ) auf jedes | − � angewendet wird, ergibt sich Ry (θ) | − � = | − � C − | + � S .
392
18 Drehimpuls
Was wir daher haben möchten, ist (r + s)! 1/2
Ry (θ) | + �r | − � s perm r!s! (r + s)! 1/2 = (Ry (θ) | + �)r (Ry (θ) | − �) s perm r!s! (r + s)! 1/2 = (| + � C + | − � S )r (| − � C − | + � S ) s perm . r!s!
Ry (θ) | rs � =
(18.65)
Nun muss jedes Binom bis zu seiner jeweiligen Potenz entwickelt und die beiden Ausdrücke müssen miteinander multipliziert werden. Es wird Terme mit | + � in allen Potenzen von null bis (r + s) geben. Sehen wir uns alle Terme an, die ein | + � in der Potenz r� haben. Sie werden immer mit | − � in der Potenz s� multipliziert auftreten, wobei s� = 2 j − r� ist. Angenommen, wir sammeln alle diese Terme. Für jede Permutation werden sie einen skalaren Koeffizienten haben, der die Faktoren der Binomialentwicklung sowie die Faktoren C und S enthält. Angenommen, wir nennen diesen Faktor Ar� . Dann wird (18.65) folgendermaßen aussehen: Ry (θ) |
r s
�=
r+s r� =0
Ar� | + �r | − � s �
�
perm
.
(18.66)
Nun dividieren wir Ar� durch den Faktor [(r� + s� )!/r� !s� !]1/2 und bezeichnen den Quotienten mit Br� . Gleichung (18.66) ist dann gleichbedeutend mit Ry (θ) | rs � =
r+s r� =0
Br �
(r� + s� )! 1/2 � � | + �r | − � s perm . � � r !s !
(18.67)
(Wir könnten einfach sagen, dass diese Gleichung Br� durch die Forderung definiert, dass (18.67) denselben Ausdruck ergibt, der in (18.65) auftritt.) Mit dieser Definition von Br� sind die restlichen Faktoren auf der rechten Seite von (18.67) � gerade die Zustände | rs� �. Daher erhalten wir Ry (θ) | rs � =
r+s
r� =0
Br � |
r� s�
�,
(18.68)
wobei s� gleich r + s − r� ist. Dies bedeutet natürlich, dass die Koeffizienten Br� gerade die gewünschten Matrixelemente sind, nämlich �
r� s�
| Ry (θ) | rs � = Br� .
(18.69)
Nun müssen wir nur noch die Berechnungen ausführen, um die verschiedenen Br� zu ermitteln. Wenn wir (18.65) mit (18.67) vergleichen – und daran denken, dass r� + s� = r + s ist – sehen � � wir, dass Br� gerade der Koeffizient von ar b s in dem folgenden Ausdruck ist: r� !s� ! 1/2 r!s!
(aC + bS )r (bC − aS ) s.
(18.70)
18.8 Zusatz 2: Erhaltung der Parität bei der Photonenemission
393
Es ist jetzt nur noch Fleißarbeit, die Entwicklungen nach dem binomischen Satz auszuführen und die Terme mit der gegebenen Potenz von a und b zu sammeln. Wenn Sie damit fertig sind, � � erhalten Sie für den Koeffizienten von ar b s in (18.70) r� !s� ! 1/2 s! r! � � · . (18.71) (−1)k S r−r +2k C s+r −2k · � � r!s! (r − r + k)!(r − k)! (s − k)!k! k
Die Summe muss über alle ganzzahligen k genommen werden, die Terme größer oder gleich null in den Fakultäten liefern. Dieser Ausdruck ist dann das gesuchte Matrixelement. Schließlich können wir zu unserer ursprünglichen Notation mit j, m und m� zurückkehren. Mit den Substitutionen r = j +m,
r � = j + m� ,
s = j −m,
s� = j − m�
erhalten wir wieder Gleichung (18.35) aus Abschnitt 18.4.
18.8
Zusatz 2: Erhaltung der Parität bei der Photonenemission
In Abschnitt 18.1 dieses Kapitels haben wir die Emission von Licht durch ein Atom betrachtet, das von einem angeregten Zustand mit Spin eins in den Grundzustand mit Spin null übergeht. Wenn der angeregte Zustand den Spin up hat (m = +1), kann er ein RZ-Photon längs der +z-Achse oder ein LZ-Photon längs der −z-Achse emittieren. Wir bezeichnen diese beiden Zustände des Photons mit | Rup � und | Ldown �. Keiner von ihnen hat eine bestimmte Parität. Sei Pˆ der Paritätsoperator, dann ist Pˆ | Rup � = | Ldown � und Pˆ | Ldown � = | Rup �.
Was ist mit unserem früheren Beweis, dass ein Atom in einem Zustand mit bestimmter Energie eine bestimmter Parität haben muss, und was ist mit unserer Feststellung, dass die Parität in atomaren Prozessen erhalten bleibt? Sollte nicht der Endzustand auch bei diesem Prozess (der Zustand nach der Emission eines Photons) eine bestimmte Parität haben? Er hat sie, wenn wir den vollständigen Endzustand betrachten, der die Amplituden für die Photonenemission in alle möglichen Winkel enthält. In Abschnitt 18.1 haben wir uns darauf beschränkt, nur einen Teil des vollständigen Endzustands zu betrachten.
Wenn wir wollen, können wir nur Endzustände betrachten, die wirklich eine bestimmte Parität haben. Betrachten wir zum Beispiel einen Endzustand | ψF �, der eine Amplitude α dafür hat, ein RZ-Photon zu sein, das in +z-Richtung läuft, und eine Amplitude β dafür, ein LZ-Photon zu sein, das in −z-Richtung läuft. Wir können dann schreiben | ψF � = α | Rup � + β | Ldown � .
(18.72)
Pˆ | ψF � = α | Ldown � + β | Rup � .
(18.73)
| ψ+F � = α{| Rup � + | Ldown �} ,
(18.74)
Die Paritätsoperation ergibt für diesen Zustand Dieser Zustand wird ± | ψF � sein, wenn β = α bzw. β = −α ist. Daher ist ein Endzustand mit gerader Parität
394
18 Drehimpuls
und ein Zustand mit ungerader Parität ist | ψ−F � = α{| Rup � − | Ldown �} .
(18.75)
Als Nächstes möchten wir den Zerfall eines angeregten Zustands mit ungerader Parität in einen Grundzustand mit gerader Parität betrachten. Wenn die Parität erhalten bleiben soll, muss der Endzustand des Photons ungerade Parität haben. Er muss der Zustand in (18.75) sein. Wenn die Amplitude, | Rup � zu finden, α ist, dann ist die Amplitude, | Rdown � zu finden, −α.
Schauen wir nun, was passiert, wenn wir eine Drehung von 180◦ um die y-Achse ausführen. Der ursprüngliche angeregte Zustand des Atoms wird ein (m = −1)-Zustand (ohne Änderung des Vorzeichens, gemäß Tabelle 17.2). Und die Drehung des Endzustandes ergibt Ry (180◦) | ψ−F � = α{| Rdown � − | Lup �} .
(18.76)
Wenn Sie diese Gleichung mit (18.75) vergleichen, sehen Sie, dass bei der vorausgesetzten Parität des Endzustands die Amplitude, ein LZ-Photon in +z-Richtung aus dem Anfangszustand m = −1 zu bekommen, das Negative der Amplitude ist, ein RZ-Photon aus dem Anfangszustand m = +1 zu erhalten. Das stimmt mit dem Ergebnis überein, das wir in Abschnitt 18.1 gefunden hatten.
19
Das Wasserstoffatom und das Periodensystem
19.1
Die Schrödinger-Gleichung für das Wasserstoffatom
Der beeindruckendste Erfolg in der Geschichte der Quantenmechanik war das Verständnis der Einzelheiten der Spektren einiger einfacher Atome sowie die Erklärung für die Periodizitäten der chemischen Elemente, die sich im Periodensystem niederschlagen. In diesem Kapitel wollen wir in unserem Verständnis der Quantenmechanik zu diesem wichtigen Meilenstein vordringen, speziell zu einem Verständnis des Spektrums des Wasserstoffatoms. Außerdem gelangen wir zu einer qualitativen Erklärung der rätselhaften Eigenschaften der chemischen Elemente. Wir wollen dies tun, indem wir das Verhalten des Elektrons in einem Wasserstoffatom eingehend untersuchen – wobei wir erstmals eine ausführliche Berechnung durchführen, um gemäß den in Kapitel 16 entwickelten Vorstellungen eine räumliche Verteilung zu bestimmen. Für eine vollständige Beschreibung des Wasserstoffatoms müssten wir eigentlich sowohl die Bewegung des Protons als auch die des Elektrons beschreiben. Es ist möglich, dies in der Quantenmechanik auf eine dem klassischen Verfahren analoge Art zu tun und die Bewegung eines jeden Teilchens relativ zum Schwerpunkt zu beschreiben. Aber wir wollen es nicht so machen. Wir wollen einfach eine Näherung erläutern, bei der wir das Proton als sehr schwer annehmen, sodass wir es uns als im Mittelpunkt des Atoms ruhend vorstellen können. Wir wollen eine weitere Näherung machen, indem wir nicht berücksichtigen, dass das Elektron einen Spin hat und eigentlich durch die relativistischen Gesetze der Quantenmechanik beschrieben werden müsste. Einige kleinere Korrekturen an unserer Darlegung werden erforderlich sein, da wir die nichtrelativistische Schrödinger-Gleichung verwenden und magnetische Effekte vernachlässigen wollen. Kleine magnetische Effekte treten auf, weil vom Elektron aus gesehen das Proton eine rotierende Ladung ist, die ein magnetisches Feld erzeugt. In diesem Feld hat das Elektron eine andere Energie, wenn sein Spin up ist, als wenn sein Spin down ist. Die Energie des Atoms ist dann gegenüber dem, was wir ausrechnen, ein wenig verschoben. Wir wollen diese geringe Energieverschiebung nicht beachten. Außerdem wollen wir uns vorstellen, dass sich das Elektron wie ein Kreisel im Raum bewegt und dabei immer dieselbe Spinrichtung beibehält. Da wir ein freies Atom im Raum betrachten, bleibt der Gesamtdrehimpuls erhalten. In unserer Näherung wollen wir voraussetzen, dass der Drehimpuls des Elektronenspins konstant bleibt, sodass der ganze übrige Drehimpuls des Atoms – der gewöhnlich Bahndrehimpuls genannt wird – ebenfalls erhalten bleibt. In sehr guter Näherung bewegt sich das Elektron im Wasserstoffatom wie ein Teilchen ohne Spin – der Drehimpuls der Bewegung ist eine Konstante. Mit dieser Näherung kann die Amplitude, das Elektron an verschiedenen Stellen im Raum zu finden, durch eine Funktion der Position in Raum und der Zeit dargestellt werden. Wir bezeich-
396
19 Das Wasserstoffatom und das Periodensystem
nen die Amplitude, das Elektron zur Zeit t an einem bestimmten Ort zu finden, mit ψ(x, y, z, t). Gemäß der Quantenmechanik ergibt sich die zeitliche Änderungsrate dieser Amplitude durch die Anwendung des Hamilton-Operators auf dieselbe Funktion. Nach Kapitel 16 ist i mit
∂ψ ψ =H ∂t
(19.1)
2
= − ∇2 + V( r) . H (19.2) 2m Hier ist m die Elektronenmasse und V(r) die potentielle Energie des Elektrons im elektrostatischen Feld des Protons. Wenn wir für große Entfernungen vom Proton V = 0 annehmen, können wir schreiben1 e2 . r Die Wellenfunktion ψ muss dann die Gleichung V=−
∂ψ 2 e2 = − ∇2 ψ − ψ (19.3) ∂t 2m r erfüllen. Wir suchen jetzt nach Zuständen mit bestimmter Energie, d. h. nach Lösungen der Form i
ψ( r, t) = e−(i/)Et ψ( r) .
(19.4)
Die Funktion ψ(r) muss dann eine Lösung sein von 2 e2 ψ, − ∇2 ψ = E + 2m r
(19.5)
wobei E eine Konstante ist – die Energie des Atoms.
Da der Term der potentiellen Energie nur vom Radius abhängt, erweist es sich als viel bequemer, diese Gleichung in Polarkoordinaten anstatt in rechtwinkligen Koordinaten zu lösen. Der Laplace-Operator ist in rechtwinkligen Koordinaten definiert durch ∇2 =
∂2 ∂2 ∂2 + 2+ 2. 2 ∂x ∂y ∂z
Wir wollen stattdessen die in Abbildung 19.1 gezeigten Koordinaten r, θ, φ verwenden. Diese Koordinaten sind mit x, y, z verknüpft durch x = r sin θ cos φ ;
y = r sin θ sin φ ;
z = r cos θ .
Es ist eine recht umständliche Angelegenheit, sich durch diese Rechnung durchzuarbeiten, aber Sie können schließlich zeigen, dass für jede Funktion f (r) = f (r, θ, φ) die folgende Gleichung gilt: 1 ∂2 f ∂f 1 ∂2 1 1 ∂ ∇2 f (r, θ, φ) = sin θ + . (19.6) (r f ) + r ∂r2 ∂θ r2 sin θ ∂θ sin2 θ ∂φ2 1
Wie gewöhnlich ist e2 = q2e /4π�0 .
19.2 Kugelsymmetrische Lösungen
397
z
P
θ r
0
y φ Abb. 19.1: Die räumlichen Polarkoordinaten r, θ, φ des Punktes P.
x
Daher lautet die Gleichung, die von ψ(r, θ, φ) befriedigt werden muss, in Polarkoordinaten ∂ψ 1 ∂2 ψ 2m e2 1 ∂2 1 1 ∂ sin θ + ψ. = − E + (rψ) + r ∂r2 ∂θ r r2 sin θ ∂θ 2 sin2 θ ∂φ2
19.2
(19.7)
Kugelsymmetrische Lösungen
Versuchen wir zunächst, eine sehr einfache Funktion zu finden, die die furchteinflößende Gleichung in (19.7) befriedigt. Obwohl die Wellenfunktion ψ im Allgemeinen sowohl von den Winkeln θ und φ als auch vom Radius r abhängt, können wir überlegen, ob es vielleicht eine spezielle Situation gibt, in der ψ nicht von den Winkeln abhängt. Bei einer Wellenfunktion, die nicht von den Winkeln abhängt, wird sich keine der Amplituden in irgendeiner Weise ändern, wenn Sie das Koordinatensystem drehen. Das bedeutet, dass alle Komponenten des Drehimpulses null sind. Solch ein ψ muss einem Zustand entsprechen, dessen Gesamtdrehimpuls null ist. (Eigentlich ist es nur der Bahndrehimpuls, der null ist, und wir müssten noch den Spin des Elektrons berücksichtigen, aber wir lassen diesen Teil außer Acht.) Ein Zustand mit Bahndrehimpuls null hat einen speziellen Namen. Er heißt „s-Zustand“ – Sie können sich merken: „s für sphärisch symmetrisch.“2 Wenn jetzt ψ nicht von θ und φ abhängt, dann reduziert sich der gesamte Laplace-Operator auf den ersten Term und Gleichung (19.7) wird viel einfacher:
2
1 d2 e2 2m E + ψ. (rψ) = − r dr2 r 2
(19.8)
Diese speziellen Namen werden Sie sich einprägen müssen, da sie zur üblichen Terminologie der Atomphysik gehören. Als Hilfestellung werden wir sie später in diesem Kapitel in einem kurzen „Wörterbuch“ zusammenstellen.
398
19 Das Wasserstoffatom und das Periodensystem
Bevor Sie sich an die Arbeit machen, eine Gleichung wie diese zu lösen, ist es eine gute Idee, alle überflüssigen Konstanten wie e2 , m und loszuwerden, indem Sie einige Skalenänderungen vornehmen. Das macht die Rechnung einfacher. Mit den Substitutionen r=
2 ρ me2
E=
me4 �, 22
(19.9)
und (19.10)
und nach Multiplikation mit ρ wird Gleichung (19.8) zu 2 d2 (ρψ) ρψ . = − � + dρ2 ρ
(19.11)
Diese Skalenänderungen bedeuten, dass wir den Abstand r und die Energie E als Vielfache von „natürlichen“ atomaren Einheiten messen. Wir schreiben also ρ = r/rB , wobei rB = 2 /me2 der „bohrsche Radius“ genannt wird und ungefähr 0,528 Ångström beträgt. Entsprechend ist � = E/ER , mit ER = me4 /22 . Diese Energie heißt ein „Rydberg“ und beträgt etwa 13,6 Elektronenvolt. Da das Produkt ρψ auf beiden Seiten erscheint, ist es bequemer, damit zu arbeiten anstatt mit ψ selbst. Mit ρψ = f
(19.12)
erhalten wir die einfacher aussehende Gleichung d2 f 2 f. = − � + ρ dρ2
(19.13)
f (ρ) = e−αρ g(ρ) .
(19.14)
Jetzt müssen wir eine Funktion f finden, die (19.13) befriedigt – mit anderen Worten, wir müssen eine Differentialgleichung lösen. Leider gibt es keine besonders brauchbare, allgemeine Methode zur Lösung einer gegebenen Differentialgleichung. Sie müssen eben herumprobieren. Unsere Gleichung ist nicht einfach; aber es ist bekannt, dass sie mit dem folgendem Verfahren gelöst werden kann. Zuerst ersetzen wir f , das eine Funktion von ρ ist, durch ein Produkt von zwei Funktionen:
Das bedeutet einfach, dass wir den Faktor e−αρ aus f (ρ) herausziehen, und wir können das für jedes beliebige f (ρ) machen. Damit verlagern wir unser Problem: wir müssen nun die richtige Funktion g(ρ) finden. Wenn wir (19.14) in (19.13) einsetzen, erhalten wir die folgende Gleichung für g: d2 g dg 2 2 + + � + α g = 0. − 2α dρ ρ dρ2
(19.15)
19.2 Kugelsymmetrische Lösungen
399
Da wir α frei wählen können, setzen wir α2 = −�
(19.16)
dg 2 d2 g − 2α + g = 0. dρ ρ dρ2
(19.17)
und erhalten
Sie denken vielleicht, dass wir damit nicht besser dran sind, als wir es mit (19.13) waren, aber der Vorteil unserer neuen Gleichung besteht darin, dass sie leicht durch eine Potenzreihe in ρ gelöst werden kann. (Es ist im Prinzip möglich, auch (19.13) auf diese Art zu lösen, aber es ist viel schwieriger.) Wir nehmen also an, dass (19.17) durch eine Potenzreihe g(ρ) =
∞
ak ρk ,
(19.18)
k=1
gelöst werden kann, wobei die ak konstante Koeffizienten sind. Nun müssen wir nur noch ein geeignetes unendliches System von Koeffizienten finden! Prüfen wir, ob unser Ansatz zu einer solchen Lösung führt. Die erste Ableitung von diesem g(ρ) ist dg = ak k ρk−1 , dρ k=1 ∞
und die zweite Ableitung ist d2 g = ak k(k − 1) ρk−2 . dρ2 k=1 ∞
Wenn wir diese Ausdrücke in (19.17) einsetzen, erhalten wir ∞ k=1
k(k − 1)ak ρk−2 −
∞ k=1
2αkak ρk−1 +
∞
2ak ρk−1 = 0 .
(19.19)
k=1
Man sieht noch nicht, ob dies zum Erfolg führt, aber wir kommen voran. Es wird alles besser aussehen, wenn wir die erste Summe durch etwas Gleichwertiges ersetzen. Da der erste Term der Summe null ist, können wir jedes k durch k + 1 ersetzen, ohne irgendetwas an der unendlichen Reihe zu ändern. Mit dieser Änderung kann die erste Summe ebenso gut geschrieben werden als ∞
(k + 1)kak+1 ρk−1 .
k=1
Nun können wir alle Summen zusammenfassen und erhalten ∞ k=1
(k + 1)kak+1 − 2αkak + 2ak ρk−1 = 0 .
(19.20)
400
19 Das Wasserstoffatom und das Periodensystem
Diese Potenzreihe muss für alle möglichen Werte von ρ verschwinden. Das ist nur dann möglich, wenn der Koeffizient jeder Potenz von ρ für sich null ist. Wir bekommen eine Lösung für das Wasserstoffatom, wenn wir ein System ak finden können, für das gilt (k + 1)kak+1 − 2(αk − 1)ak = 0
(19.21)
für alle k ≥ 1. Das ist sicherlich leicht einzurichten. Nehmen Sie ein beliebiges a1 . Dann erzeugen Sie alle anderen Koeffizienten aus ak+1 =
2(αk − 1) ak . k(k + 1)
(19.22)
Damit erhalten Sie a2 , a3 , a4 usw., und jedes Paar (ak , ak+1 ) wird (19.21) befriedigen. Wir erhalten eine Reihe für g(ρ), die (19.17) erfüllt. Damit können wir ein ψ konstruieren, das die Schrödinger-Gleichung erfüllt. Beachten Sie, dass die Lösungen von der vorausgesetzten Energie (über α) abhängen, dass es aber für jeden Wert von � eine entsprechende Reihe gibt. Wir haben nun zwar eine Lösung, aber was bedeutet sie physikalisch? Wir können eine Vorstellung davon bekommen, wenn wir uns anschauen, was weit weg vom Proton geschieht – bei großen Werten von ρ. Dort draußen sind die Terme der Reihe mit höherer Ordnung die wichtigsten, daher sollten wir uns ansehen, was bei großen k geschieht. Für k � 1 ist Gleichung (19.22) näherungsweise dasselbe wie ak+1 =
2α ak , k
was bedeutet, dass ak+1 ≈
(2α)k . k!
(19.23)
Dies sind aber gerade die Koeffizienten der Reihe für e+2αρ . Die Funktion g ist eine schnell ansteigende Exponentialfunktion. Selbst wenn sie mit e−αρ gekoppelt ist, um f (ρ) zu bilden – siehe (19.14) –, ergibt sie noch immer eine Lösung für f (ρ), die für große ρ wie eαρ verläuft. Wir haben zwar eine mathematische, aber keine physikalische Lösung gefunden. Sie stellt eine Situation dar, in der es am wenigsten wahrscheinlich ist, dass das Elektron in der Nähe des Protons ist! Es ist wahrscheinlicher, dass es bei einem sehr großen Radius ρ gefunden wird. Eine Wellenfunktion für ein gebundenes Elektron muss aber für große ρ gegen null gehen. Überlegen wir also, ob es doch noch eine Möglichkeit gibt, das Spiel zu gewinnen. Ja, diese Möglichkeit gibt es. Wenn α gleich 1/n ist, wobei n irgendeine positive ganze Zahl ist, dann ergibt (19.22) an+1 = 0. Alle höheren Terme sind dann ebenfalls null. Aus der unendlichen Reihe wird ein endliches Polynom. Jedes Polynom wächst langsamer als eαρ , daher wird es schließlich vom Term e−αρ erschlagen, und die Funktion f wird für große ρ gegen null gehen. Die einzigen Lösungen für gebundene Zustände sind diejenigen mit α = 1/n, wobei n = 1, 2, 3, 4 . . .. Gemäß (19.16) kann es Lösungen für gebundene Zustände der kugelsymmetrischen Wellengleichung nur dann geben, wenn � = −1,
−1 −1 −1 −1 , , ,..., 2 ,... 4 9 16 n
19.2 Kugelsymmetrische Lösungen
401
Die erlaubten Energien sind einfach diese Brüche mal die Rydberg-Energie ER = me4 /22 , bzw. die Energie des n-ten Energieniveaus ist En = −ER
1 . n2
(19.24)
Es ist übrigens nichts Geheimnisvolles an negativen Zahlen für die Energie. Die Energien sind negativ, weil wir, als wir uns entschlossen haben, V = −e2 /r zu schreiben, unseren Nullpunkt als die Energie eines Elektrons gewählt haben, das unendlich weit vom Proton entfernt ist. Wenn es nahe am Proton ist, ist seine Energie geringer und daher etwas unter null. Die Energie ist am niedrigsten (am stärksten negativ) für n = 1 und strebt mit größer werdendem n gegen null. Vor der Entdeckung der Quantenmechanik war schon aus experimentellen Untersuchungen des Wasserstoffspektrums bekannt, dass die Energieniveaus durch (19.24) beschrieben werden können, wobei man aus den Beobachtungen für ER ungefähr 13,6 Elektronenvolt ermittelte. Bohr stellte dann ein Modell auf, das Gleichung (19.24) lieferte und vorhersagte, dass ER gleich me4 /22 sein sollte. Aber es war der erste große Erfolg von Schrödingers Theorie, dass sie dieses Ergebnis aus einer grundlegenden Bewegungsgleichung für das Elektron reproduzieren konnte. Nachdem wir nun die Schrödinger-Gleichung für unser erstes Atom gelöst haben, wollen wir uns die Beschaffenheit der gefundenen Lösung ansehen. Wenn wir alle Bestandteile zusammenführen, lautet jede Lösung ψn =
fn (ρ) e−ρ/n = gn (ρ) ρ ρ
(19.25)
mit n
ak ρk
(19.26)
2(k/n − 1) ak . k(k + 1)
(19.27)
gn (ρ) =
k=1
und ak+1 =
Solange wir nur an den relativen Wahrscheinlichkeiten, das Elektron an verschiedenen Stellen zu finden, interessiert sind, können wir für a1 jede beliebige Zahl verwenden. Wir können genauso gut a1 = 1 setzen. (Man wählt a1 häufig so, dass die Wellenfunktion „normiert“ ist, das heißt, dass die Gesamtwahrscheinlichkeit, das Elektron irgendwo im Atom zu finden, gleich eins ist. Wir haben aber keinen Grund, dies gerade jetzt zu tun.) Für den Zustand mit der niedrigsten Energie ist n = 1 und ψ1 (ρ) = e−ρ .
(19.28)
Bei einem Wasserstoffatom im Grundzustand (mit der niedrigsten Energie) nimmt die Amplitude, das Elektron an irgendeinem Ort zu finden, exponentiell mit dem Abstand vom Proton ab.
402
19 Das Wasserstoffatom und das Periodensystem
Am wahrscheinlichsten ist es direkt beim Proton zu finden, und der charakteristische Ausbreitungsabstand ist ungefähr eine Einheit von ρ oder etwa ein bohrscher Radius rB . Wenn wir n = 2 setzen, ergibt sich das nächsthöhere Niveau. Die Wellenfunktion für diesen Zustand hat dann zwei Terme. Sie lautet ρ −ρ/2 e ψ2 (ρ) = 1 − . (19.29) 2 Die Wellenfunktion für das nächste Niveau ist 2 2 −ρ/3 2ρ + ρ e ψ3 (ρ) = 1 − . 3 27
(19.30)
Die Wellenfunktionen für diese ersten drei Niveaus sind in Abbildung 19.2 aufgetragen. Sie können den allgemeinen Trend sehen. Alle Wellenfunktionen gehen für große ρ nach ein paar Oszillationen schnell gegen null. Dabei ist die Zahl der „Buckel“ gleich n, oder, wenn Sie es vorziehen, die Anzahl der Nulldurchgänge von ψn ist n − 1. ψ
n=1 n=3 n=2
19.3
r
Abb. 19.2: Die Wellenfunktionen für die ersten drei (l = 0)-Zustände des Wasserstoffatoms. (Die Skalen sind so gewählt, dass die Gesamtwahrscheinlichkeiten gleich sind.)
Zustände mit Winkelabhängigkeit
Für die Zustände, die durch die ψn (r) beschrieben werden, haben wir vorausgesetzt, dass die Wahrscheinlichkeitsamplitude, das Elektron anzutreffen, kugelsymmetrisch ist, d. h., sie hängt nur von r, dem Abstand vom Proton, ab. Solche Zustände haben den Bahndrehimpuls l = 0 (vgl. Abbildung 19.2). Wir sollten jetzt nach Zuständen suchen, die eine Winkelabhängigkeit haben können. Wenn wir wollten, könnten wir einfach das streng mathematische Problem untersuchen, die Funktionen von r, θ und φ zu finden, die der Differentialgleichung (19.7) genügen, wobei wir die zusätzliche physikalische Bedingung stellen, dass nur solche Funktionen zugelassen sind, die für große r gegen null gehen. Sie werden dies so in vielen Büchern finden. Wir werden jedoch eine Abkürzung wählen, indem wir ausnutzen, was wir bereits über die Abhängigkeit der Amplituden von Winkeln im Raum wissen.
19.3 Zustände mit Winkelabhängigkeit
403
Das Wasserstoffatom ist in jedem einzelnen Zustand ein Objekt mit einem bestimmten Spin j, der Quantenzahl des Gesamtdrehimpulses. Ein Teil dieses Spins stammt aus dem intrinsischen Spin des Elektrons und ein Teil aus der Bahnbewegung des Elektrons. Da die beiden Komponenten voneinander unabhängig sind (in sehr guter Näherung), wollen wir wieder den Spinanteil vernachlässigen und nur den „Bahndrehimpuls“ betrachten. Die Bahnbewegung verhält sich jedoch genauso wie ein Spin. Wenn die Bahnquantenzahl zum Beispiel l ist, kann die z-Komponente des Drehimpulses l, l − 1, l − 2, . . . , −l sein. (Wir messen wie gewöhnlich in Einheiten von .) Auch gelten weiterhin alle Drehmatrizen und die anderen Eigenschaften, die wir ermittelt haben. (Von jetzt an wollen wir wirklich den Spin des Elektrons außer Acht lassen; wenn wir vom „Drehimpuls“ sprechen, meinen wir nur den Bahnanteil.) Da das Potential V, in dem sich das Elektron bewegt, nur von r und nicht von θ oder φ abhängt, ist der Hamilton-Operator bei allen Drehungen symmetrisch. Daraus folgt, dass der Drehimpuls und alle seine Komponenten erhalten bleiben. (Dies gilt für jede Bewegung in einem „Zentralfeld“ – in einem, das nur von r abhängt –, es ist also keine besondere Eigenheit des Coulomb-Potentials −e2 /r.)
Betrachten wir jetzt einen möglichen Zustand des Elektrons. Seine innere Winkelstruktur wird durch die Quantenzahl l charakterisiert. In Abhängigkeit von der „Orientierung“ des Gesamtdrehimpulses bezüglich der z-Achse ist die z-Komponente des Drehimpulses m und nimmt einen der 2l + 1 möglichen Werte zwischen +l und −l an. Sei m = 1. Mit welcher Amplitude wird dann das Elektron auf der z-Achse in einem Abstand r gefunden? Diese Amplitude ist null. Ein Elektron auf der z-Achse kann keinen Bahndrehimpuls um diese Achse haben. Nun gut, nehmen wir an, m ist null, dann kann es eine endliche Amplitude geben, das Elektron in einer beliebigen Entfernung vom Proton zu finden. Wir wollen diese Amplitude mit Fl (r) bezeichnen. Es ist die Amplitude, das Elektron in der Entfernung r auf der positiven z-Achse zu finden, wenn das Atom im Zustand | l, 0 � ist, womit wir Bahnspin l und z-Komponente m = 0 meinen.
Wenn wir Fl (r) kennen, wissen wir alles. Für irgendeinen Zustand | l, m � kennen wir dann die Amplitude ψl,m (r), das Elektron irgendwo im Atom zu finden. Wie? Passen Sie auf. Angenommen, das Atom ist im Zustand | l, m �, was ist dann die Amplitude, das Elektron im Winkel θ, φ und im Abstand r vom Ursprung zu finden? Wir zeichnen eine neue Achse z� , die durch diese Winkel definiert ist, und fragen nach der Amplitude dafür, dass das Elektron im Abstand r auf dieser neuen Achse ist. Wir wissen, dass es auf z� nicht gefunden werden kann, wenn nicht m� , die z� -Komponente seines Drehimpulses, null ist. Wenn jedoch m� null ist, ist die Amplitude, das Elektron auf z� zu finden, Fl (r). Daher ist das Ergebnis das Produkt zweier Faktoren. Der erste ist die Amplitude dafür, dass das Atom, das sich bezüglich der z-Achse im Zustand | l, m � befindet, bezüglich der z� -Achse im Zustand | l, m� = 0 � ist. Wir multiplizieren diese Amplitude mit Fl (r) und erhalten die Amplitude ψl,m (r), das Elektron bei (r, θ, φ) bezüglich der ursprünglichen Achsen zu finden. Schreiben wir es aus. Wir haben früher die Transformationsmatrizen für Drehungen ermittelt. Um von dem System x, y, z zu dem System x� , y� , z� in Abbildung 19.3 überzugehen, können wir zunächst eine Drehung um den Winkel φ um die z-Achse ausführen und anschließend eine Drehung um den Winkel θ um die neue y-Achse (y� ). Diese kombinierte Drehung ist das Produkt Ry (θ)Rz (φ) .
404
19 Das Wasserstoffatom und das Periodensystem z
z� (r, θ, φ) θ
r y� φ y φ
x
x
�
Abb. 19.3: Der Punkt (r, θ, φ) liegt auf der z� -Achse des x� y� z� -Koordinatensystems.
Die Amplitude, nach der Drehung den Zustand l, m� = 0 zu finden, ist � l, 0 | Ry(θ)Rz (φ) | l, m � .
(19.31)
Unser Ergebnis ist dann ψl,m ( r) = � l, 0 | Ry(θ)Rz (φ) | l, m � Fl (r) .
(19.32)
Die Bahnbewegung kann nur ganzzahlige Werte von l haben. (Wenn das Elektron irgendwo bei r 0 gefunden werden kann, gibt es eine Amplitude, dass es in dieser Richtung m = 0 hat. Und Zustände mit m = 0 gibt es nur für ganzzahlige Spins.) Die Drehmatrizen für l = 1 sind in Tabelle 17.2 angegeben. Für größere l können Sie die allgemeinen Formeln verwenden, die wir in Kapitel 18 hergeleitet haben. Die Matrizen für Rz (φ) und Ry (θ) treten getrennt auf, aber Sie wissen, wie sie zu kombinieren sind. Im allgemeinen Fall beginnen Sie mit dem Zustand | l, m � und wenden darauf Rz (φ) an, um den neuen Zustand Rz (φ) | l, m � zu erhalten (der eimφ | l, m � ist.) Dann wenden Sie auf diesen Zustand Ry (θ) an, um den Zustand Ry (θ)Rz (φ) | l, m � zu erhalten. Multiplikation mit � l, 0 | ergibt das gesuchte Matrixelement (19.31).
Die Matrixelemente der Drehoperation sind algebraische Funktionen von θ und φ. Die speziellen Funktionen, die in (19.31) erscheinen, treten bei vielen Problemen mit sphärischer Geometrie auf. Für ihre Bezeichnung gibt es unterschiedliche Konventionen; eine der gebräuchlichsten ist �l, 0 | Ry (θ) Rz (φ) | l, m � ≡ aYl,m (θ, φ) .
(19.33)
Die Funktionen Yl,m (θ, φ) werden Kugelfunktionen genannt, und a ist einfach ein Zahlenfaktor, der von der speziellen Definition von Yl,m abhängt. Bei der üblichen Definition ist 4π . (19.34) a= 2l + 1
19.3 Zustände mit Winkelabhängigkeit
405
Mit dieser Notation können die Wasserstoffwellenfunktionen geschrieben werden als ψl,m ( r) = aYl,m (θ, φ)Fl (r) .
(19.35)
Die Kugelfunktionen Yl,m (θ, φ) sind nicht nur bei vielen quantenmechanischen Problemen wichtig, sondern auch in vielen Gebieten der klassischen Physik, in denen der ∇2 -Operator auftritt, beispielsweise beim Elektromagnetismus. Als ein weiteres Beispiel für die Anwendung der Kugelfunktionen in der Quantenmechanik betrachten wir den Zerfall eines angeregten Zustands von Ne20 (vgl. Kapitel 18), das zerfällt, indem es ein α-Teilchen emittiert und in O16 übergeht: Ne20∗ → O16 + He4 . Nehmen wir an, dass der angeregte Zustand den Spin l hat (notwendigerweise eine ganze Zahl) und dass die z-Komponente des Drehimpulses m ist. Wir könnten nun die folgende Frage stellen (siehe auch Abbildung 19.4): Wenn l und m gegeben sind, wie groß ist dann die Amplitude dafür, dass das α-Teilchen in einer Richtung wegfliegt, die den Winkel θ mit der z-Achse und den Winkel φ mit der x-Achse bildet? z
z
θ Ne20 | l, m �
α
∗
x
y
φ
x O16
y
Abb. 19.4: Der Zerfall eines angeregten Zustands von Ne20 .
Um dieses Problem zu lösen, überlegen wir uns zunächst Folgendes. Ein Zerfall, bei dem das α-Teilchen entlang der z-Achse nach oben läuft, muss aus einem Zustand mit m = 0 heraus erfolgen. Das ist so, weil sowohl O16 als auch das α-Teilchen Spin null haben und weil ihre Bewegung keinen Drehimpuls um die z-Achse haben kann. Nennen wir diese Amplitude a (pro Raumwinkeleinheit). Dann müssen wir, um die Amplitude für einen Zerfall mit den beliebigen Winkeln θ und φ von Abbildung 19.4 zu ermitteln, nur noch wissen, mit welcher Amplitude der Anfangszustand den Drehimpuls null um die Zerfallsrichtung hat. Die Amplitude für den Zerfall mit den Winkeln θ und φ ist dann a mal die Amplitude dafür, dass ein Zustand |l, m� bezüglich der z-Achse im Zustand |l, 0� bezüglich z� – der Zerfallsrichtung – ist. Diese letztere Amplitude ist genau das, was wir in (19.31) aufgeschrieben haben. Die Wahrscheinlichkeit, das α-Teilchen bei θ, φ zu sehen, ist 2 P(θ, φ) = a2 � l, 0 | Ry(θ) Rz (φ) | l, m � .
406
19 Das Wasserstoffatom und das Periodensystem
Betrachten wir als Beispiel die Anfangszustände mit l = 1 und den möglichen Werten von m. Aus Tabelle 17.2 kennen wir die benötigten Amplituden. Sie sind 1 �1, 0 | Ry (θ) Rz (φ) | 1, +1� = − √ sin θ eiφ , 2 �1, 0 | Ry (θ) Rz (φ) | 1, 0� = cos θ , 1 �1, 0 | Ry (θ) Rz (φ) | 1, −1� = √ sin θ e−iφ . 2
(19.36)
Dies sind die drei möglichen Winkelverteilungsamplituden – je nach dem m-Wert des Ausgangskerns. Tabelle 19.1: Bahndrehimpuls-Wörterbuch (l = j = ganze Zahl) z-Komponente m
Bahndrehimpuls l 0
0 ⎧ ⎪ ⎪ ⎪ ⎪ +1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ 0 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ −1
1
2
3 4 5 .. .
Winkelabhängigkeit der Amplituden
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
⎧ ⎪ ⎪ ⎪ +2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ +1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ 0 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ −1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ −2
⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩
1 ⎫ ⎪ 1 ⎪ ⎪ − √ sin θ eiφ ⎪ ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎬ cos θ ⎪ ⎪ ⎪ ⎪ ⎪ 1 ⎪ −iφ ⎪ ⎪ √ sin θ e ⎪ ⎪ ⎭ 2 √ ⎫ 6 2 2iφ ⎪ ⎪ ⎪ sin θ e ⎪ ⎪ ⎪ 4 ⎪ ⎪ ⎪ ⎪ √ ⎪ ⎪ ⎪ 6 ⎪ iφ ⎪ ⎪ sin θ cos θ e ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 ⎬ 2 (3 cos θ − 1) ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ √ ⎪ ⎪ ⎪ 6 ⎪ −iφ ⎪ ⎪ ⎪ − sin θ cos θ e ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ √ ⎪ ⎪ ⎪ ⎪ 6 2 −2iφ ⎪ ⎪ sin θ e ⎭ 4 ⎫ � l, 0 | Ry (θ) Rz (φ) | l, m � ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ = Yl,m (θ, φ) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ m imφ ⎭ = Pl (cos θ) e
Name
Anzahl der Zustände
Bahnparität
s
1
+
p
3
−
d
5
+
2l + 1
(−1)l
f g h .. .
Amplituden wie die in (19.36) treten sehr häufig auf und sind so wichtig, dass man ihnen mehrere Namen gegeben hat. Wenn die Winkelverteilungsamplitude proportional zu irgendeiner der drei Funktionen oder zu irgendeiner Linearkombination von ihnen ist, sagen wir: „Das System hat den Bahndrehimpuls eins.“ Oder wir können sagen: „Das Ne20∗ emittiert ein p-Wellen-αTeilchen.“ Oder wir sagen: „Das α-Teilchen wird in einem Zustand l = 1 emittiert.“ Weil es so viele Möglichkeiten gibt, dasselbe zu sagen, ist es nützlich, sich ein Wörterbuch anzulegen.
19.3 Zustände mit Winkelabhängigkeit
407
Wenn Sie verstehen wollen, worüber andere Physiker sprechen, werden Sie deren Sprache eben auswendig lernen müssen. In Tabelle 19.1 finden Sie ein Wörterbuch für den Bahndrehimpuls. Wenn der Bahndrehimpuls null ist, dann gibt es keine Veränderung, wenn Sie das Koordinatensystem drehen, und es gibt keine Abhängigkeit von den Winkeln – die Abhängigkeit von den Winkeln ist wie eine Konstante, sagen wir 1. Dies wird auch ein „s-Zustand“ genannt und es gibt nur einen solchen Zustand – soweit es die Winkelabhängigkeit betrifft. Wenn der Bahndrehimpuls 1 ist, dann kann die Amplitude der Winkelveränderung irgendeine der drei angegebenen Funktionen sein – abhängig vom Wert von m – oder es kann eine Linearkombination dieser Funktionen sein. Diese Zustände heißen „p-Zustände“ und es gibt drei davon. Wenn der Bahndrehimpuls 2 ist, dann gibt es die fünf gezeigten Funktionen. Jede Linearkombination heißt dann eine „l = 2“- oder eine „d-Wellen“-Amplitude. Nun können Sie raten, was der nächste Buchstabe ist – was sollte nach s, p, d kommen? Nun ja: f, g, h und so weiter nach dem Alphabet! Die Buchstaben bedeuten gar nichts. (Sie hatten einmal eine Bedeutung – sie bedeuteten „scharfe“ Linien, „Haupt-(principal)“-Linien, „diffuse“ Linien und „fundamentale“ Linien der optischen Atomspektren. Aber diese Nomenklatur stammt aus einer Zeit, als man noch nicht wusste, woher die Linien kamen. Nach f gab es keine speziellen Namen, daher fahren wir jetzt einfach mit g, h usw. fort.) Die Wellenfunktionen in der Tabelle haben verschiedene Namen und es gibt auch unterschiedliche Konventionen für die vorn erscheinenden Zahlenfaktoren. Manchmal werden sie „Kuimφ gelfunktionen“ genannt und Yl,m (θ, φ) geschrieben. Manchmal werden Sie Pm gel (cos θ)e schrieben, und wenn m = 0 ist, einfach als Pl (cos θ). Die Funktionen Pl (cos θ) werden die „Legendre-Polynome“ in cos θ genannt und die Funktionen Pm l (cos θ) heißen die „assoziierten Legendre-Funktionen.“ Sie werden Tabellen dieser Funktionen in vielen Büchern finden. Beachten Sie auch, dass alle Funktionen für ein gegebenes l die Eigenschaft haben, dass sie dieselbe Parität besitzen – bei ungeradem l ändern sie bei einer Inversion das Vorzeichen und bei geradem l nicht. Wir können daher schreiben, dass die Parität eines Zustands vom Bahndrehimpuls l gleich (−1)l ist. z
θ
Wahrscheinlichkeit
Abb. 19.5: Eine Darstellung von cos2 θ in Polarkoordinaten, die die relative Wahrscheinlichkeit dafür ist, ein Elektron bei verschiedenen Winkeln θ mit der zAchse (bei vorgegebenem r) in einem Atomzustand mit l = 1 und m = 0 zu finden.
408
19 Das Wasserstoffatom und das Periodensystem
Wie wir gesehen haben, können sich diese Winkelverteilungen auf einen Kernzerfall oder auf einen anderen Prozess beziehen oder auf die Verteilung der Amplitude, ein Elektron an einem bestimmten Ort im Wasserstoffatom zu finden. Wenn zum Beispiel ein Elektron in einem pZustand (l = 1) ist, dann kann die Amplitude, es zu finden, auf viele mögliche Arten von den Winkeln abhängen – aber alle sind Linearkombinationen der drei Funktionen für l = 1 in Tabelle 19.1. Nehmen wir den Fall cos θ. Das ist interessant. Es bedeutet, dass die Amplitude im, sagen wir, oberen Teil (θ < π/2) positiv, im unteren Teil (θ > π/2) negativ ist und null, wenn θ gleich 90◦ ist. Wenn wir diese Amplitude quadrieren, sehen wir, dass die Wahrscheinlichkeit, das Elektron zu finden, sich wie in Abbildung 19.5 mit θ ändert – und unabhängig von φ ist. Diese Winkelverteilung ist der Grund dafür, dass in der molekularen Bindung die Anziehungskraft eines Elektrons in einem Zustand l = 1 auf ein anderes Atom von der Richtung abhängt – das ist der Ursprung der gerichteten Valenzen der chemischen Bindung.
19.4
Die allgemeine Lösung für Wasserstoff
In (19.35) haben wir die Wellenfunktion für das Wasserstoffatom geschrieben als ψl,m ( r) = aYl,m (θ, φ)Fl (r) .
(19.37)
Diese Wellenfunktionen müssen Lösungen der Differentialgleichung (19.7) sein. Sehen wir uns an, was das bedeutet. Wir setzen (19.37) in (19.7) ein und erhalten ∂Yl,m Yl,m d2 ∂ Fl sin θ (rF ) + l r dr2 ∂θ r2 sin θ ∂θ ∂2 Yl,m Fl e2 2m + Yl,m Fl . E + = − r 2 r2 sin2 θ ∂φ2
(19.38)
Nun multiplizieren wir mit r2 /Fl und ordnen die Terme neu. Das Ergebnis ist
∂Yl,m 1 ∂2 Yl,m 1 ∂ sin θ + sin θ ∂θ ∂θ sin2 θ ∂φ2 r 2 1 d2 e2 2m Fl Yl,m . =− (rFl ) + 2 E + 2 Fl r dr r
(19.39)
Die linke Seite dieser Gleichung hängt zwar von θ und φ, aber nicht von r ab. Ganz gleich, welchen Wert wir für r wählen, die linke Seite ändert sich nicht. Dies muss dann auch für die rechte Seite gelten. Obwohl in der eckigen Klammer überall r’s stehen, kann der Ausdruck insgesamt nicht von r abhängen, denn sonst hätten wir keine für alle r gültige Gleichung. Wie Sie sehen können, hängt der Ausdruck auch nicht von θ oder φ ab. Er muss eine Konstante sein. Ihr Wert kann durchaus von den l-Werten der untersuchten Zustände abhängen, da die Funktion Fl die für diesen Zustand gültige Funktion sein muss. Wir wollen die Konstante Kl , nennen. Gleichung (19.39) ist dann äquivalent mit zwei Gleichungen: ∂Yl,m 1 ∂ 1 ∂2 Yl,m sin θ + = −Kl Yl,m , (19.40) sin θ ∂θ ∂θ sin2 θ ∂φ2 1 d2 Fl e2 2m Fl = Kl 2 . E + (rF ) + (19.41) l r dr2 r 2 r
19.4 Die allgemeine Lösung für Wasserstoff
409
Für jeden durch l und m beschriebenen Zustand kennen wir die Funktion Yl,m . Wir können daher aus (19.40) die Konstante Kl bestimmen. Wenn wir dieses Kl in (19.41) einsetzen, erhalten wir eine Differentialgleichung für die Funktion Fl (r). Wenn wir diese Gleichung für Fl (r) lösen können, kennen wir alles, was wir in (19.37) einsetzen müssen, um ψ(r) zu erhalten. Was ist Kl ? Beachten Sie zunächst, dass es für alle m (die zu einem speziellen l gehören) dasselbe sein muss. Daher können wir für Yl,m jedes beliebige m nehmen und es in (19.40) einsetzen, um nach Kl aufzulösen. Vielleicht lässt sich am leichtesten Yl,l handhaben. Gemäß (18.24) ist Rz (φ) | l, l � = eilφ | l, l � .
(19.42)
Das Matrixelement für Ry (θ) ist auch ganz einfach: � l, 0 | Ry (θ) | l, l � = b(sin θ)l ,
(19.43)
wobei b irgendeine Zahl ist.3 Wenn wir die zwei Drehungen kombinieren, erhalten wir Yl,l ∝ eilφ sinl θ .
(19.44)
Wenn wir diese Funktion in (19.40) einsetzen, ergibt sich Kl = l(l + 1) .
(19.45)
Nun, da wir Kl bestimmt haben, liefert uns (19.41) die Radialfunktion Fl (r). Wir erhalten natürlich genau die Schrödinger-Gleichung, wobei der Winkelanteil durch sein Äquivalent Kl Fl /r2 ersetzt ist. Schreiben wir (19.41) noch einmal in der Form, die wir in Gleichung (19.8) hatten: e2 l(l + 1)2 1 d2 2m − E + Fl , . (rF ) = − l r dr2 r 2 2mr2
(19.46)
Zur potentiellen Energie ist ein mysteriöser Term hinzugekommen. Zwar haben wir diesen Term durch einige mathematische Tricks erhalten, doch er hat einen einfachen physikalischen Ursprung. Mit einem semiklassischen Argument können wir uns klarmachen, woher er kommt. Dann werden Sie ihn vielleicht nicht mehr ganz so mysteriös finden. Denken Sie an ein klassisches Teilchen, das sich um ein Kraftzentrum bewegt. Die Gesamtenergie bleibt erhalten, und sie ist die Summe aus potentieller und kinetischer Energie: U = V(r) + 21 mv2 = konstant. Im Allgemeinen kann v in eine radiale Komponente vr und eine tangentiale Komponente rθ˙ zerlegt werden; dann ist ˙ 2. v2 = v2r + (rθ) 3
Sie können mit einigem Aufwand zeigen, dass dies aus (18.35) folgt, aber man kann es auch leicht aus den Grundprinzipien herleiten, indem man den Argumenten von Abschnitt 18.4 folgt. Ein Zustand |l, l� kann aus 2l Spin- 12 -Teilchen, die alle Spin up haben, gebildet werden; der Zustand | l, 0 � hat dagegen l Spin up und l Spin down. Bei der Drehung um die y-Achse ist die Amplitude dafür, dass ein up-Spin up bleibt, gemäß Tabelle 17.1 cos θ/2 und dafür, dass ein up-Spin umklappt, − sin θ/2. Wir fragen nach der Amplitude dafür, dass l up-Spins up bleiben, während die anderen l up-Spins umklappen. Die Amplitude dafür ist (− cos(θ/2) sin(θ/2))l , was proportional ist zu sinl θ.
410
19 Das Wasserstoffatom und das Periodensystem
Wie wir wissen, bleibt auch der Drehimpuls mr2 θ˙ erhalten; sagen wir, er ist gleich L. Wir können daher schreiben mr2 θ˙ = L ,
rθ˙ =
L , mr
und die Energie ist U = 12 mv2r + V(r) +
L2 . 2mr2
Wenn es keinen Drehimpuls gäbe, gäbe es nur die ersten beiden Terme. Das Hinzufügen des Drehimpulses L wirkt sich auf die Energie genauso aus wie das Hinzufügen eines Terms L2 /2mr2 zur potentiellen Energie. Das ist fast genau der zusätzliche Term in (19.46). Der einzige Unterschied ist, dass l(l + 1)2 für den Drehimpuls steht, und nicht l2 2 , wie wir vielleicht erwartet hätten. Wir haben aber bereits festgestellt (zum Beispiel in Band IV, Abschnitt 5.7), dass dies gerade die Substitution ist, die gewöhnlich erforderlich ist, um ein quasiklassisches Argument mit einer korrekten quantenmechanischen Berechnung in Übereinstimmung zu bringen. Wir können dann den neuen Term als „Pseudopotential“ verstehen, der den Term für die „Zentrifugalkraft“ liefert, der in den radialen Bewegungsgleichungen für ein rotierendes System erscheint. (Siehe auch die Diskussion der „Scheinkräfte“ in Band I, Abschnitt 12.5.) Wir sind jetzt so weit, dass wir Gleichung (19.46) nach Fl (r) auflösen können. Sie ähnelt sehr der Gleichung (19.8), sodass wir sicher wieder mit derselben Methode Erfolg haben werden. Alles geht wie vorher, bis wir zu Gleichung (19.19) gelangen, die den Zusatzterm −l(l + 1)
∞
ak ρk−2
(19.47)
k=1
enthält. Dieser Term kann auch geschrieben werden als −l(l + 1)
a
1
ρ
+
∞ k=1
ak+1 ρk−1 .
(19.48)
(Wir haben den ersten Term aus der Summe herausgenommen und dann den laufenden Index k um 1 nach unten verschoben.) Anstelle von Gleichung (19.20) erhalten wir ∞ l(l + 1)a1 = 0. k(k + 1) − l(l + 1) ak+1 − 2(αk − 1)ak ρk−1 − ρ k=1
(19.49)
Es gibt nur einen Term mit ρ−1 , er muss daher null sein. Der Koeffizient a1 muss null sein (außer für den Fall l = 0, für den unsere vorhergehende Lösung gilt). Jeder der anderen Terme wird zu null gemacht, indem man die eckige Klammer für jedes k null werden lässt. Diese Bedingung ersetzt Gleichung (19.22) durch ak+1 =
2(αk − 1) ak . k(k + 1) − l(l + 1)
Dies ist die einzige bedeutsame Änderung gegenüber dem kugelsymmetrischen Fall.
(19.50)
19.5 Die Wasserstoff-Wellenfunktionen
411
Wie vorher muss die Reihe abbrechen, wenn die Lösungen gebundene Elektronen darstellen sollen. Die Reihe bricht bei k = n ab, wenn αn = 1 ist. Wir erhalten wieder dieselbe Bedingung für α, nämlich, dass es gleich 1/n sein muss, wobei n eine positive ganze Zahl ist. Jedoch liefert (19.50) außerdem eine neue Einschränkung. Der Index k kann nicht gleich l sein, denn dann wäre der Nenner null und al+1 würde unendlich. Da a1 = 0 ist, besagt Gleichung (19.50), dass alle folgenden ak null sind, bis wir zu al+1 kommen, das von null verschieden sein kann. Dies bedeutet, dass k bei l + 1 anfangen und bei n aufhören muss. Unser Endresultat ist, dass es für jedes l viele mögliche Lösungen gibt, die wir Fn,l nennen können, wobei n ≥ l + 1 ist. Jede Lösung hat die Energie me4 1 . 22 n2
(19.51)
ψn,l,m = aYl,m (θ, φ) Fn,l(ρ)
(19.52)
En = −
Die Wellenfunktion für den Zustand dieser Energie mit den Drehimpulsquantenzahlen l und m ist
mit ρFn,l (ρ) = e−αρ
n
ak ρk .
(19.53)
k=l+1
Die Koeffizienten ak sind durch (19.50) gegeben. Damit haben wir schließlich eine vollständige Beschreibung der Zustände eines Wasserstoffatoms.
19.5
Die Wasserstoff-Wellenfunktionen
Schauen wir uns noch einmal an, was wir entdeckt haben. Die Zustände, die die SchrödingerGleichung für ein Elektron im Coulomb-Feld erfüllen, sind durch die drei Quantenzahlen n, l, m, die alle ganze Zahlen sind, charakterisiert. Die Winkelverteilung der Elektronen-Amplitude kann nur bestimmte Formen annehmen, die wir Yl,m nennen. Sie sind gekennzeichnet durch l, die Quantenzahl des Gesamtdrehimpulses, und durch m, die „magnetische“ Quantenzahl, die von −l bis +l laufen kann. Für jede Winkelkonfiguration sind verschiedene radiale Verteilungen Fn,l (r) für die Elektronen-Amplitude möglich; sie werden durch die Hauptquantenzahl n gekennzeichnet, die von l + 1 nach ∞ laufen kann. Die Energie des Zustands hängt nur von n ab und wächst mit wachsendem n. Der Zustand mit der niedrigsten Energie, der Grundzustand, ist ein s-Zustand. Er hat l = 0, n = 1 und m = 0. Er ist ein „nichtentarteter“ Zustand, d. h., es gibt nur einen Zustand mit dieser Energie, und seine Wellenfunktion ist kugelsymmetrisch. Die Amplitude, das Elektron zu finden, ist im Mittelpunkt maximal und fällt mit wachsendem Abstand vom Mittelpunkt monoton ab. Wir können uns die Elektronen-Amplitude als ein Klümpchen veranschaulichen, siehe Abbildung 19.6 (a). Es gibt andere s-Zustände mit höheren Energien, für n = 2, 3, 4, . . . Für jede Energie gibt es jeweils nur einen Zustand (m = 0), und sie sind alle kugelsymmetrisch. Diese Zustände haben
412
19 Das Wasserstoffatom und das Periodensystem z
z +
x
1s; m = 0
+
x
2s; m = 0 (a)
(b)
z
z +
x
+ −
− 2p; m = 0
− + (e)
x
(d)
z + −
−
+
3p; m = 0 (c)
3d; m = 0
−
z x
+
4d; m = 0
−
+
x − + − + − (f)
Abb. 19.6: Schematische Darstellung der allgemeinen Natur von einigen Wasserstoff-Wellenfunktionen. Die schraffierten Gebiete zeigen, wo die Amplituden groß sind. Die Plus- und Minuszeichen zeigen das relative Vorzeichen der Amplitude in jedem Gebiet.
Amplituden, die das Vorzeichen einmal bzw. mehrmals mit wachsendem r ändern. Es gibt n − 1 sphärische Knotenflächen (Flächen, auf denen ψ durch null geht). Der 2s-Zustand (l = 0, n = 2) hat zum Beispiel ein Aussehen wie in Abbildung 19.6 (b) gezeigt. (Die schraffierten Flächen geben Gebiete an, in denen die Amplitude groß ist, und die Plus- und Minuszeichen bezeichnen die relativen Vorzeichen der Amplitude.) Die Energieniveaus der s-Zustände sind in der ersten Spalte von Abbildung 19.7 angegeben. Dann gibt es die p-Zustände – mit l = 1. Für jedes n, das gleich 2 oder größer sein muss, gibt es drei Zustände von derselben Energie, je einen für m = +1, m = 0 und m = −1. Die Energieniveaus sind in Abbildung 19.7 dargestellt. Die Winkelabhängigkeiten dieser Zustände sind in Tabelle 19.1 angegeben. Während zum Beispiel für m = 0 die Amplitude positiv ist, wenn θ in der Nähe von null ist, ist sie negativ, wenn θ in der Nähe von 180◦ ist. Es gibt eine Knotenfläche, die mit der xy-Ebene zusammenfällt. Für n > 2 gibt es auch sphärische Knoten. Die Amplitude n = 2, m = 0 ist in Abbildung 19.6 (c) skizziert, und die Wellenfunktion n = 3, m = 0 in Abbildung 19.6 (d). Da m eine Art „Orientierung“ im Raum darstellt, denken Sie vielleicht, dass es ähnliche Verteilungen mit dem Amplitudenmaximum in Richtung der x-Achse oder in Richtung der y-Achse geben sollte. Sind dies vielleicht die Zustände m = +1 und m = −1? Nein. Da wir aber drei Zustände mit gleicher Energie haben, sind beliebige Linearkombinationen von ihnen ebenfalls stationäre Zustände mit derselben Energie. Es stellt sich heraus, dass der „x“-Zustand, der dem „z“-Zustand oder „m = 0“-Zustand von Abbildung 19.6 (c) entspricht, eine Linearkombina-
19.5 Die Wasserstoff-Wellenfunktionen √
413
E
0 und so weiter
−13,6 eV
4s
4p
4d
3s
3p
3d
2s
2p
4f
n 10 8 6 5 4 3
2
1s
1
s
p
d
f
l=0
1
2
3
Abb. 19.7: Das Energieniveau-Schema für Wasserstoff.
tion der Zustände m = +1 und m = −1 ist. Der entsprechende „y“-Zustand ist eine andere Linearkombination. Konkret heißt das „z“ =| 1, 0� , | 1, +1�− | 1, −1� „x“ = − , √ 2 | 1, +1�+ | 1, −1� „y“ = − . √ i 2 Diese Zustände sehen alle gleich aus, wenn man sie auf ihre jeweilige Achse bezieht. Die d-Zustände (l = 2) haben fünf mögliche m-Werte für jede Energie, die niedrigste Energie hat n = 3. Die Niveaus liegen wie in Abbildung 19.7 gezeigt. Die Winkelabhängigkeiten werden komplizierter. Zum Beispiel haben die Zustände m = 0 zwei konische Knoten, daher wechselt die Wellenfunktion ihr Vorzeichen von + über − nach + , wenn Sie vom Nordpol zum Südpol herumgehen. Die ungefähre Form der Amplitude ist in den Teilen (e) und (f) von Abbildung 19.6 für die Zustände m = 0 mit n = 3 bzw. n = 4 skizziert. Wieder haben die größeren n’s sphärische Knoten. Wir sehen davon ab, noch weitere der möglichen Zustände zu beschreiben. Sie werden die Wasserstoffwellenfunktionen in vielen Büchern ausführlicher beschrieben finden. Zwei gute Litera-
414
19 Das Wasserstoffatom und das Periodensystem
turstellen sind L. Rauling und E. B. Wilson, Introduction to Quantum Mechanics, McGraw-Hill (1935); und R. B. Leighton, Principles of Modern Physics, McGraw-Hill (1959). Sie finden dort Kurven von einigen der Funktionen und Diagramme vieler Zustände. Wir möchten eine besondere Eigenschaft der Wellenfunktionen für höhere l erwähnen, nämlich dass für l > 0 die Amplituden im Mittelpunkt null sind. Das ist nicht überraschend, da es für ein Elektron schwierig ist, einen Drehimpuls zu haben, wenn sein Radiusarm sehr kurz ist. Aus diesem Grund werden die Amplituden umso mehr vom Mittelpunkt „weggeschoben“, je größer das l ist. Aus (19.53) können Sie das Verhalten der Radialfunktionen Fn,l (r) für kleine r ableiten; Sie erhalten Fn,l (r) ≈ rl . Eine solche r-Abhängigkeit bedeutet, dass Sie für größere l weiter von r = 0 weggehen müssen, bevor Sie eine signifikante Amplitude erhalten. Dieses Verhalten wird übrigens durch den Zentrifugalterm in der radialen Gleichung hervorgerufen, daher wird dasselbe für jedes Potential zutreffen, das sich langsamer als 1/r2 für kleine r ändert – was für die meisten atomaren Potentiale der Fall ist.
19.6
Das Periodensystem
Wir möchten jetzt die Theorie des Wasserstoffatoms in einer Näherung verwenden, um einige Charakteristika des Periodensystems der Elemente zu erklären. Bei einem Element mit der Ordnungszahl Z gibt es Z Elektronen, die durch die elektrische Anziehungskraft einerseits an den Kern gebunden sind und sich andererseits gegenseitig abstoßen. Um eine exakte Lösung zu finden, müssten wir die Schrödinger-Gleichung für Z Elektronen in einem Coulomb-Feld lösen. Für Helium lautet die Gleichung i
2e2 2e2 2e2 ∂ψ 2 = − (∇21 ψ + ∇22 ψ) + − ψ, − + ∂t 2m r1 r2 r12
wobei ∇21 der Laplace-Operator ist, der auf r1 , die Koordinate des einen Elektrons, anzuwenden ist. ∇22 wird auf r2 angewandt, und es gilt r12 = |r1 − r2 |. (Wir lassen wieder den Spin der Elektronen unberücksichtigt.) Um die stationären Zustände und Energieniveaus zu finden, müssen wir nach Lösungen der Form ψ = f ( r1 , r2 ) e−(i/)Et suchen. Die räumliche Abhängigkeit steckt in der Funktion f , die eine Funktion von sechs Variablen ist – den Ortskoordinaten der beiden Elektronen. Für diese Gleichung ist keine analytische Lösung bekannt, doch wenigstens die Zustände niedrigster Energie konnten mit numerischen Verfahren bestimmt werden. Mit 3, 4 oder 5 Elektronen ist der Versuch aussichtslos, exakte Lösungen zu erhalten, und es wäre übertrieben zu sagen, dass die Quantenmechanik ein genaues Verständnis des Periodensystems gebracht hätte. Es ist jedoch mit einer weitgehenden Näherung – und einigen Anpassungen – möglich, viele chemische Eigenschaften, die sich im Periodensystem widerspiegeln, zumindest qualitativ zu verstehen.
19.6 Das Periodensystem
415
Die chemischen Eigenschaften der Atome sind vor allem durch ihre Zustände niedrigster Energie bestimmt. Mithilfe der folgenden Näherung können wir diese Zustände und ihre Energien bestimmen. Zunächst vernachlässigen wir den Elektronenspin, außer, dass wir das Ausschließungsprinzip anwenden und sagen, dass jeder Elektronenzustand nur von einem Elektron besetzt werden kann. Dies bedeutet, dass jede Bahnkonfiguration bis zu zwei Elektronen aufnehmen kann – eins mit Spin up, das andere mit Spin down. Als Nächstes lassen wir in unserer ersten Näherung die Einzelheiten der Wechselwirkung zwischen den Elektronen außer Acht und sagen, dass sich jedes Elektron in einem Zentralfeld bewegt, das das zusammengesetzte Feld des Kerns und aller anderen Elektronen ist. Bei Neon, das 10 Elektronen hat, sagen wir, dass ein Elektron ein mittleres Potential „sieht“, das vom Kern und den anderen neun Elektronen herrührt. Wir denken uns dann in die Schrödinger-Gleichung für jedes Elektron ein V(r) eingesetzt, das im Wesentlichen ein 1/r-Feld ist, modifiziert durch eine kugelsymmetrische Ladungsdichte, die von den anderen Elektronen stammt. In diesem Modell verhält sich jedes Elektron wie ein unabhängiges Teilchen. Die Winkelabhängigkeit seiner Wellenfunktion wird so sein wie beim Wasserstoffatom. Es wird s-Zustände, p-Zustände usw. geben und sie werden die verschiedenen möglichen m-Werte haben. Da V(r) nicht mehr genau die 1/r-Form hat, wird zwar der radiale Teil der Wellenfunktion etwas anders sein, aber er wird qualitativ derselbe sein, sodass wir dieselben radialen Quantenzahlen n haben werden. Die Energien der Zustände werden auch etwas anders sein.
H Ausgehend von diesen Vorstellungen wollen wir sehen, was wir erhalten. Im Grundzustand des Wasserstoffs ist l = m = 0 und n = 1. Wir sagen, die Elektronenkonfiguration ist 1s. Die Energie beträgt −13,6 eV. Dies bedeutet, dass man 13,6 Elektronenvolt braucht, um das Elektron vom Atom wegzuziehen. Wir nennen dies die „Ionisationsenergie“ WI . Eine hohe Ionisationsenergie bedeutet, dass es schwierig ist, das Elektron wegzuziehen und dass das Element im Allgemeinen chemisch wenig aktiv ist.
He Als Nächstes betrachten wir Helium. Beide Elektronen können in demselben niedrigsten Zustand sein (eins mit Spin up und das andere mit Spin down). In diesem niedrigsten Zustand bewegt sich das Elektron in einem Potential, das für kleine r wie ein Coulomb-Potential für Z = 2 und für große r wie ein Coulomb-Potential für Z = 1 ist. Das Ergebnis ist ein „wasserstoffähnlicher“ 1s-Zustand mit einer etwas niedrigeren Energie. Beide Elektronen besetzen den 1s-Zustand (l = 0, m = 0). Die beobachtete Ionisationsenergie (um ein Elektron zu entfernen) ist 24,6 Elektronenvolt. Da die 1s-„Schale“ jetzt aufgefüllt ist – nur zwei Elektronen sind erlaubt – zeigt ein Elektron praktisch keine Tendenz, von einem anderen Atom angezogen zu werden. Helium ist chemisch träge.
Li Der Lithiumkern hat die Ladung 3. Die Elektronenzustände sind wieder wasserstoffähnlich und die drei Elektronen besetzen die beiden niedrigsten Energieniveaus. Zwei Elektronen sind im 1s-Zustand und das dritte im Zustand n = 2. Aber mit l = 0 oder mit l = 1? Im Wasserstoff ha-
416
19 Das Wasserstoffatom und das Periodensystem
ben diese Zustände dieselbe Energie, aber in anderen Atomen ist das aus dem folgenden Grund nicht so. Erinnern Sie sich, dass ein 2s-Zustand eine Amplitude für das Elektron hat, in der Nähe des Kerns zu sein, der 2p-Zustand dagegen nicht. Das bedeutet, dass ein 2s-Elektron etwas von der dreifachen elektrischen Ladung des Li-Kerns spüren wird, dass aber ein 2p-Elektron weiter draußen bleiben wird, wo das Feld wie das Coulomb-Feld einer einzelnen Ladung aussieht. Die zusätzliche Anziehung vermindert die Energie des 2s-Zustandes relativ zum 2p-Zustand. Die Energieniveaus werden etwa so sein wie in Abbildung 19.8 – vergleichen Sie dieses Bild mit dem entsprechenden Diagramm für Wasserstoff (Abbildung 19.7). Daher hat das Lithiumatom zwei Elektronen im 1s-Zustand und eins in einem 2s-Zustand. Da das 2s-Elektron eine höhere Energie als jedes der 1s-Elektronen hat, ist es verhältnismäßig leicht zu entfernen. Die Ionisationsenergie des Lithiums beträgt nur 5,4 Elektronenvolt, und es ist chemisch recht aktiv. √
E
0
n
4s
4p
4d
4f
6 3
3d
3p
3s
2 2p
2s
1s s
1 p
d
f
Abb. 19.8: Energieniveau-Schema für ein im Atom gebundenes Elektron bei Anwesenheit anderer Elektronen. (Der Maßstab ist nicht derselbe wie in Abbildung 19.7.).
Tabelle 19.2 zeigt für die ersten 36 Elemente die im Grundzustand von den Elektronen besetzten Zustände. Angegeben ist die Ionisationsenergie für das am schwächsten gebundene Elektron sowie die Anzahl der Elektronen, die jede „Schale“ besetzen, womit wir Zustände mit demselben n meinen. Da die einzelnen l-Zustände unterschiedliche Energien haben, entspricht jeder l-Wert einer Unterschale mit 2(2l + 1) möglichen Zuständen (mit verschiedenem m und verschiedenem
19.6 Das Periodensystem
417
Elektronenspin). Diese haben alle dieselbe Energie – bis auf einige sehr kleine Effekte, die wir nicht berücksichtigen.
Be Beryllium ist ähnlich wie Lithium, nur dass es zwei Elektronen in der gefüllten 1s-Schale sowie zwei im 2s-Zustand hat.
B bis Ne Bor hat 5 Elektronen. Das fünfte muss in einen 2p-Zustand gehen. Da es 2 ×3 = 6 verschiedene 2p-Zustände gibt, können wir fortfahren, Elektronen hinzuzufügen, bis wir zu einer Gesamtzahl von 8 kommen. Das bringt uns zu Neon. Wenn wir diese Elektronen hinzufügen, vergrößern wir auch Z, sodass die gesamte Elektronenverteilung immer näher an den Kern gezogen wird und die Energie der 2p-Zustände sinkt. Wenn wir bei Neon angelangt sind, ist die Ionisationsenergie auf 21,6 Elektronenvolt gestiegen. Neon gibt nur schwer ein Elektron ab. Auch gibt es keine freien Plätze mit niedriger Energie, die gefüllt werden könnten, daher wird es auch nicht versuchen, ein zusätzliches Elektron einzufangen. Neon ist chemisch träge. Fluor dagegen hat tatsächlich einen unbesetzten Platz, wo ein Elektron in einen Zustand mit niedriger Energie hineinfallen kann. Es ist daher in chemischen Reaktionen sehr aktiv.
Na bis Ar Bei Natrium muss das elfte Elektron eine neue Schale anfangen, indem es in einen 3s-Zustand geht. Das Energieniveau dieses Zustands ist viel höher, die Ionisationsenergie springt nach unten, und Natrium ist eine aktive Chemikalie. Von Natrium nach Argon werden die s- und pZustände mit n = 3 in genau der gleichen Reihenfolge besetzt wie von Lithium nach Neon. Die Winkelkonfigurationen der Elektronen in der äußeren ungefüllten Schale haben dieselbe Reihenfolge, und der Verlauf der Ionisationsenergie ist recht ähnlich. Sie können erkennen, warum sich die chemischen Eigenschaften mit steigender Ordnungszahl wiederholen. Magnesium verhält sich chemisch sehr ähnlich wie Beryllium, Silizium wie Kohlenstoff und Chlor wie Fluor. Argon ist so träge wie Neon. Sie haben vielleicht bemerkt, dass es eine kleine Besonderheit in der Reihe der Ionisationsenergien zwischen Lithium und Neon und eine ähnliche zwischen Natrium und Argon gibt. Das letzte Elektron ist an das Sauerstoffatom etwas weniger stark gebunden, als wir erwarten würden. Und bei Schwefel ist es ähnlich. Warum ist das so? Wir können es verstehen, wenn wir zumindest einen Teil der Effekte der Wechselwirkungen zwischen den Elektronen berücksichtigen. Was geschieht, wenn wir das erste 2p-Elektron an das Boratom bringen? Es hat sechs Möglichkeiten – drei mögliche p-Zustände, jeder mit zwei verschiedenen Spins. Stellen Sie sich vor, dass das Elektron mit Spin up in den m = 0-Zustand geht, den wir auch den „z“-Zustand genannt haben, weil er die z-Achse umschlingt. Was wird nun beim Kohlenstoff passieren? Dort gibt es jetzt zwei 2p-Elektronen. Wenn eins davon in den „z“-Zustand geht, wohin wird dann das zweite gehen? Es wird eine niedrigere Energie haben, wenn es sich vom ersten Elektron fernhält, was es dadurch erreichen kann, dass es zum Beispiel in den x-Zustand der 2p-Schale geht. (Dieser Zustand ist eine Linearkombination des m = +1- und des m = −1-Zustands.) Wenn wir als Nächstes zum Stickstoff gehen, haben die 2p-Elektronen die niedrigste Energie gegenseitiger Abstoßung dann, wenn sie jeweils in die „x“-, „y“- und „z“-Konfiguration gehen.
418
19 Das Wasserstoffatom und das Periodensystem
Tabelle 19.2: Die Elektronenkonfigurationen der ersten 36 Elemente Z
Element
WI (eV)
1 2
H He
Wasserstoff Helium
13,6 24,6
3 4 5 6 7 8 9 10
Li Be B C N O F Ne
Lithium Beryllium Bor Kohlenstoff Stickstoff Sauerstoff Fluor Neon
5,4 9,3 8,3 11,3 14,5 13,6 17,4 21,6
11 12 13 14 15 16 17 18
Na Mg Al Si P S Cl Ar
Natrium Magnesium Aluminium Silizium Phosphor Schwefel Chlor Argon
5,1 7,6 6,0 8,1 10,5 10,4 13,0 15,8
19 20 21 22 23 24 25 26 27 28 29 30
K Ca Sc Ti V Cr Mn Fe Co Ni Cu Zn
Kalium Kalzium Scandium Titan Vanadium Chrom Mangan Eisen Kobalt Nickel Kupfer Zink
31 32 33 34 35 36
Ga Ge As Se Br Kr
Gallium Germanium Arsen Selen Brom Krypton
4,3 6,1 6,5 6,8 6,7 6,8 7,4 7,9 7,9 7,6 7,7 9,4 6,0 7,9 9,8 9,7 11,8 14,0
Elektronenkonfiguration 1s
2s
2p
1 2 2 2 2 2 2 2
1 2 3 4 5 6
3s
3p
3d
4s
4p
4d
1 2
GEFÜLLT (2)
– GEFÜLLT – (2)
(8)
Anzahl der Elektronen in jedem Zustand
1 2 2 2 2 2 2 2
1 2 3 4 5 6
– GEFÜLLT – (2)
(8)
(8)
– GEFÜLLT – (2)
(8)
(18)
.. .. .. .. .. .. .. ... ... .. .. .. .. .. .. .. ..
1 2 3 5 5 6 7 8 10 10
1 2 2 2 2 1 2 2 2 2 1 2 2 2 2 2 2 2
1 2 3 4 5 6
4f
19.6 Das Periodensystem
419
Beim Sauerstoff jedoch ist das Maß voll. Das vierte Elektron muss in einen der schon durch ein Elektron besetzten Zustände gehen – mit entgegengesetztem Spin. Es wird dann von dem Elektron, das schon in diesem Zustand ist, kräftig abgestoßen. Seine Energie wird daher nicht so niedrig sein, wie sie es sonst wäre, und es ist leichter zu entfernen. Das erklärt den Bruch in der Reihe der Bindungsenergien, der zwischen Stickstoff und Sauerstoff und zwischen Phosphor und Schwefel auftritt.
K bis Zn Man könnte vermuten, dass nach Argon die Elektronen damit beginnen, die 3d-Zustände aufzufüllen. Aber das tun sie nicht. Wie wir früher beschrieben und in Abbildung 19.8 illustriert haben, werden die Zustände mit größerem Drehimpuls in der Energie hochgetrieben. Wenn wir dann zu den 3d-Zuständen gelangen, sind sie zu einer Energie gedrängt worden, die etwas über der Energie des 4s-Zustandes liegt. Daher geht bei Kalium das letzte Elektron in den 4sZustand. Erst nachdem diese Schale bei Kalzium (mit zwei Elektronen) gefüllt ist, fangen die 3d-Zustände bei Scandium, Titan und Vanadium an aufgefüllt zu werden. Die Energien der 3d- und 4s-Zustände liegen so dicht beieinander, dass schon kleine Effekte das Gleichgewicht nach irgendeiner Seite verschieben können. Wenn wir so weit gekommen sind, dass wir das vierte Elektron in einen 3d-Zustand bringen, erhöht ihre Abstoßung die Energie des 4s-Zustands gerade um so viel, dass seine Energie etwas über der 3d-Energie ist, sodass ein Elektron aus dem 4s- in den 3d-Zustand hinüberwechselt. Bei Chrom erhalten wir deshalb keine Kombination 4, 2, wie wir erwartet hätten, sondern stattdessen eine Kombination 5, 1. Das neue Elektron, das hinzugefügt wird, um Mangan zu erhalten, füllt wieder die 4s-Schale auf, und die Zustände der 3d-Schale werden dann einer nach dem anderen besetzt, bis wir zum Kupfer gelangen. Da die äußersten Schalen von Mangan, Eisen, Kobalt und Nickel dieselbe Konfiguration haben, tendieren sie alle zu ähnlichen chemischen Eigenschaften. (Dieser Effekt ist noch viel ausgeprägter bei den seltenen Erden, die alle dieselbe äußere Schale, aber eine sich sukzessive auffüllende innere Schale haben, die viel weniger Einfluss auf ihre chemischen Eigenschaften hat.) Beim Kupfer wird ein Elektron aus der 4s-Schale geraubt, um endlich die 3d-Schale zu vervollständigen. Die Energie der Kombination 10, 1 liegt bei Kupfer jedoch so nahe bei der Konfiguration 9, 2, dass schon die Anwesenheit eines benachbarten Atoms das Gleichgewicht verschieben kann. Aus diesem Grund sind die letzten zwei Elektronen des Kupfers fast gleichwertig, und Kupfer kann die Wertigkeit 1 oder 2 haben. (Es verhält sich manchmal so, als ob seine Elektronen in der Kombination 9, 2 wären.) Analoge Verhältnisse liegen an anderen Stellen vor und sie sind dafür verantwortlich, dass sich andere Metalle wie Eisen chemisch mit einer von zwei Valenzen binden. Bei Zink ist sowohl die 3d- als auch die 4s-Schale ein für allemal aufgefüllt.
Ga bis Kr Von Gallium nach Krypton geht die Reihe wieder normal weiter, indem die 4p-Schale gefüllt wird. Die äußeren Schalen, die Energien und die chemischen Eigenschaften wiederholen sich in der gleichen Weise wie von Bor nach Neon und von Aluminium nach Argon.
420
19 Das Wasserstoffatom und das Periodensystem
Krypton gehört wie Argon und Neon zu den Edelgasen. Alle drei sind chemisch „träge“. Dies bedeutet lediglich, dass es, nachdem die Schalen mit relativ niedriger Energie aufgefüllt sind, nur wenige Situationen gibt, in denen es für sie einen energetischen Vorteil bedeutet, eine einfache Verbindung mit anderen Elementen einzugehen. Eine gefüllte Schale zu haben, genügt nicht. Beryllium und Magnesium haben zwar gefüllte s-Schalen, die Energie dieser Schalen ist aber zu hoch, um Stabilität zu erreichen. Ähnlich hätte man ein weiteres „edles“ Element bei Nickel erwartet, wenn die Energie der 3d-Schale niedriger gewesen wäre (oder die der 4s-Schale höher). Andererseits ist Krypton nicht vollkommen träge; es bildet eine schwach gebundene Verbindung mit Chlor. Da unsere Auswahl die meisten Hauptmerkmale des Periodensystems aufgezeigt hat, hören wir mit unserer Prüfung bei Element Nummer 36 auf – es gibt noch etwa siebzig weitere! Wir möchten nur noch einen weiteren Aspekt erwähnen – nämlich, dass wir nicht nur bis zu einem gewissen Grade die Wertigkeit verstehen können, sondern dass wir auch etwas über die Richtungseigenschaften der chemischen Bindungen sagen können. Betrachten Sie ein Atom wie Sauerstoff, das vier 2p-Elektronen hat. Die ersten drei gehen in die „x“-, „y“- und „z“Zustände und das vierte muss einen dieser Zustände verdoppeln und dabei zwei – zum Beispiel „x“ und „y“ – nur einmal belegt lassen. Betrachten Sie dann, was in H2 O geschieht. Jedes der beiden Wasserstoffatome möchte ein Elektron mit dem Sauerstoff teilen und dadurch dem Sauerstoff dazu verhelfen, eine Schale aufzufüllen. Diese Elektronen werden bestrebt sein, in die x- und y-„Frei“-Stellen zu gehen. Daher sollten im Wassermolekül die beiden Wasserstoffatome einen rechten Winkel bezüglich des Mittelpunkts des Sauerstoffatoms bilden. Der Winkel beträgt in Wirklichkeit 105◦ . Wir können sogar verstehen, warum der Winkel größer als 90◦ ist. Wenn sie ihre Elektronen teilen, haben die Wasserstoffatome schließlich eine positive Ladung. Die elektrostatische Abstoßung „spannt“ die Wellenfunktionen und treibt den Winkel auf 105◦. Dieselbe Situation tritt in H2 S auf. Weil aber das Schwefelatom größer ist, liegen die Wasserstoffatome weiter auseinander, es gibt eine geringere Abstoßung und der Winkel wird nur auf etwa 93◦ auseinandergedrückt. Selen ist noch größer, sodass im H2 Se der Winkel fast genau 90◦ beträgt. Dieselben Argumente können wir verwenden, um die Geometrie des Ammoniaks, NH3 , zu verstehen. Stickstoff hat Platz für drei weitere 2p-Elektronen, je eins für die Zustände vom „x“-, „y“- und „z“-Typ. Die drei Wasserstoffatome sollten sich in rechten Winkeln zueinander dransetzen. Die Winkel ergeben sich ein wenig größer als 90◦ – wieder wegen der elektrostatischen Abstoßung –, aber zumindest sehen wir, warum das NH3 -Molekül nicht flach ist. Die Winkel bei Phosphan, PH3 , sind nahe bei 90◦ und bei AsH3 noch näher. Als wir NH3 als Zweizustandssystem beschrieben haben, haben wir vorausgesetzt, dass es nicht flach ist. Und diese „Nichtflachheit“ ist es, was den Ammoniak-Maser erst möglich macht. Nun sehen wir, dass auch die Form der Moleküle auf der Grundlage der Quantenmechanik verstanden werden kann. Die Schrödinger-Gleichung war einer der großen Triumphe der Physik. Dadurch, dass sie den Schlüssel für die Vorgänge liefert, die der Atomstruktur zugrunde liegen, hat sie eine Erklärung für die Atomspektren, die Chemie und die Eigenschaften der Materie gegeben.
20
Operatoren
20.1
Operationen und Operatoren
Alles, was wir bisher in der Quantenmechanik getan haben, konnte mit den Mitteln der elementaren Algebra behandelt werden, auch wenn wir gelegentlich einige spezielle Notationen für die quantenmechanischen Größen und Gleichungen eingeführt haben. Wir möchten jetzt noch etwas näher auf einige interessante und nützliche mathematische Methoden der Quantenmechanik eingehen. Es gibt viele Wege, an den Stoff der Quantenmechanik heranzugehen, und die meisten Bücher gehen anders vor als wir. Wenn Sie andere Bücher lesen, sehen Sie vielleicht nicht direkt die Verbindungen zwischen dem, was Sie dort finden, und dem, was wir hier getan haben. Obwohl wir auch einige nützliche Ergebnisse erhalten werden, ist es doch das Hauptanliegen dieses Kapitels, Sie mit verschiedenen Notationen vertraut zu machen, die alle dieselbe Physik beschreiben. Wenn Sie diese Notationen kennen, sollten Sie in der Lage sein, das, was andere Leute sagen, besser zu verstehen. Als die klassische Mechanik entwickelt wurde, schrieb man anfangs alle Gleichungen in x-, y- und z-Komponenten. Dann kam jemand daher und erklärte, dass die ganze Schreiberei durch die Einführung der Vektornotation viel einfacher würde. Es stimmt, dass Sie, um eine Situation genau zu untersuchen, die Vektoren oftmals wieder in ihre Komponenten zerlegen müssen. Es ist aber im Allgemeinen leichter, den Überblick zu behalten, wenn Sie mit Vektoren arbeiten, und auch viele Berechnungen lassen sich bequemer mit Vektoren durchführen. In der Quantenmechanik konnten wir viele Dinge auf einfachere Art schreiben, indem wir den Begriff des „Zustandsvektors“ benutzt haben. Der Zustandsvektor | ψ � hat natürlich nichts mit geometrischen Vektoren im dreidimensionalen Raum zu tun, sondern er ist lediglich ein abstraktes Symbol, das für einen physikalischen Zustand steht, der durch das „Kennzeichen“ oder den „Namen“ ψ identifiziert wird. Der Begriff ist nützlich, weil die Gesetze der Quantenmechanik als algebraische Gleichungen in diesen Symbolen geschrieben werden können. Zum Beispiel wird unser fundamentales Gesetz, dass jeder Zustand | ψ � aus einer Linearkombination der Basiszustände gebildet werden kann, geschrieben als |ψ� = Ci | i � , (20.1) i
wobei die Ci gewöhnliche (komplexe) Zahlen – die Amplituden Ci = � i | ψ � – sind, während | 1 �, | 2 �, | 3 � usw. für die Basiszustände in einer Basis oder Darstellung stehen.
Wenn Sie an einem physikalischen Zustand eine Operation ausführen – zum Beispiel ihn drehen oder eine Zeitspanne Δt warten –, dann erhalten Sie einen anderen Zustand. Wir sagen: „Das Ausführen einer Operation an einem Zustand erzeugt einen neuen Zustand.“ Diesen Gedanken können wir durch eine Gleichung ausdrücken: | φ � = Aˆ | ψ � .
(20.2)
422
20 Operatoren
Die Ausführung einer Operation an einem Zustand erzeugt einen anderen Zustand. Der Operator Aˆ steht für eine spezielle Operation. Wenn diese Operation an einem Zustand | ψ � ausgeführt wird, erzeugt sie einen anderen Zustand | φ �.
Was bedeutet die Gleichung (20.2)? Wir definieren das so: Wenn Sie die Gleichung mit � i | multiplizieren und | ψ � gemäß (20.1) entwickeln, erhalten Sie �i|φ� = � i | Aˆ | j � � j | ψ � . (20.3) j
(Die Zustände | j � stammen aus demselben Basissystem wie die Zustände | i �.) Dies ist jetzt einfach eine algebraische Gleichung. Die Zahlen � i | φ � geben den Anteil jedes Basiszustands an, den Sie in | φ � finden werden, und sie sind gegeben als lineare Superposition der Amplituden � j | ψ �, dass Sie | ψ � in jedem Basiszustand finden. Die Zahlen � i | Aˆ | j � sind die Koeffizienten, die angeben, wie viel von � j | ψ � in jede Summe eingeht. Der Operator Aˆ wird numerisch beschrieben durch das Zahlensystem oder die „Matrix“ Ai j ≡ � i | Aˆ | j � .
(20.4)
Somit ist (20.2) eine Kurznotation für Gleichung (20.3). Eigentlich ist es aber etwas mehr als das; es steckt etwas mehr dahinter. In (20.2) nehmen wir nicht Bezug auf ein System von Basiszuständen. Gleichung (20.3) ist ein Abbild von (20.2), ausgedrückt durch ein System von Basiszuständen. Aber wie Sie wissen, dürfen Sie jedes beliebige Basissystem verwenden. Und dieser Gedanke ist in (20.2) enthalten. Die Operatornotation kommt ohne eine spezielle Wahl des Basissystems aus. Wenn Sie konkret werden wollen, müssen Sie natürlich irgendein Basissystem wählen. Wenn Sie Ihre Wahl getroffen haben, benutzen Sie Gleichung (20.3). Daher ist die Operatorgleichung (20.2) eine abstraktere Notation für die algebraische Gleichung (20.3). Es ist analog zum Unterschied zwischen der Notation c= a× b anstelle von c x = ay bz − az by ,
cy = a z b x − a x b z ,
cz = a x b y − a y b x .
Die erste Notation ist viel handlicher. Wenn Sie jedoch Ergebnisse erhalten wollen, müssen Sie schließlich doch die Komponenten in Bezug auf irgendein Koordinatensystem angeben. Ebenso müssen Sie imstande sein, die Matrix Ai j durch ein System von Basiszuständen anzugeben, wenn Sie konkret angeben wollen, was genau Sie mit Aˆ meinen. Solange Sie ein Basissystem | i � im Sinn haben, bedeutet (20.2) genau dasselbe wie (20.3). (Beachten Sie auch, dass Sie, wenn Sie erst einmal eine Matrix für ein spezielles System von Basiszuständen kennen, immer die entsprechende Matrix ausrechnen können, die zu einem anderen Basissystem gehört. Sie können die Matrix von einer „Darstellung“ in eine andere transformieren.) Die Operatorgleichung in (20.2) erlaubt auch eine neue Denkweise. Wenn wir uns einen Operator Aˆ vorstellen, können wir ihn auf einen Zustand | ψ � anwenden, um einen neuen Zustand Aˆ | ψ � zu erzeugen. Manchmal kann ein „Zustand“, den wir auf diese Art erhalten, sehr sonderbar sein – er braucht keine physikalische Situation darzustellen, die wir vielleicht in der Natur antreffen können. (Wir können zum Beispiel einen Zustand erhalten, der nicht so normiert ist,
20.1 Operationen und Operatoren
423
dass er ein Elektron beschreibt.) Mit anderen Worten, wir können mitunter „Zustände“ erhalten, die mathematisch künstlich sind. Solche künstlichen „Zustände“ können dennoch nützlich sein, zum Beispiel als Zwischenschritt in einer Berechnung. Wir haben schon viele Beispiele für quantenmechanische Operatoren kennengelernt. Wir haben den Drehoperator Rˆ y (θ) besprochen, der einen Zustand | ψ � in einen neuen Zustand überführt, der der von einem gedrehten Koordinatensystem aus betrachtete alte Zustand ist. Wir haben den Paritäts- (oder Inversions-)Operator Pˆ besprochen, der einen neuen Zustand bildet, indem er bei allen Koordinaten das Vorzeichen umkehrt. Wir haben die Operatoren σ ˆ x , σˆ y und σ ˆ z für Spin- 21 -Teilchen besprochen. Der Operator Jˆz wurde in Kapitel 17 durch den Drehoperator für einen kleinen Winkel � definiert: i Rˆ z (�) = 1 + � Jˆz .
(20.5)
Dies bedeutet natürlich i Rˆ z (�) | ψ � = | ψ � + � Jˆz | ψ � .
(20.6)
In diesem Beispiel ist Jˆz | ψ � gleich /i � mal dem Zustand, den Sie erhalten, wenn Sie | ψ � um den kleinen Winkel � um die z-Achse drehen und dann den ursprünglichen Zustand subtrahieren. Das stellt einen „Zustand“ dar, der die Differenz zweier Zustände ist. Es folgt nun ein weiteres Beispiel. Wir hatten einen Operator pˆ x kennengelernt, der Impulsoperator genannt wird (für die x-Komponente) und der durch eine Gleichung wie (20.6) definiert ist. Wenn Dˆ x (L) der Operator ist, der einen Zustand um den Abstand L auf der x-Achse verschiebt, dann ist pˆ x definiert durch i Dˆ x (δ) = 1 + δ pˆ x ,
(20.7)
wobei δ eine kleine Verschiebung ist. Wenn wir den Zustand | ψ � längs der x-Achse um einen kleinen Abstand δ verschieben, ergibt sich ein neuer Zustand | ψ� �. Wir sagen, dass dieser neue Zustand der alte Zustand ist plus i δ pˆ x | ψ � . Die Operatoren, über die wir sprechen, wirken auf einen Zustandsvektor wie | ψ �, der eine abstrakte Beschreibung einer physikalischen Situation ist. Sie sind völlig verschieden von algebraischen Operatoren, die auf mathematische Funktionen wirken. Zum Beispiel ist d/dx ein „Operator“, der auf die Funktion f (x) wirkt, indem er sie in eine neue Funktion f � (x) = d f /dx überführt. Ein weiteres Beispiel ist der algebraische Operator ∇2 . Sie können erkennen, warum man in beiden Fällen dasselbe Wort benutzt, aber Sie sollten sich merken, dass die beiden Arten von Operatoren verschieden sind. Ein quantenmechanischer Operator Aˆ wirkt nicht auf eine algebraische Funktion, sondern auf einen Zustandsvektor wie | ψ �. Beide Arten von Operatoren werden in der Quantenmechanik verwendet und oft auch in ähnlich gearteten Gleichungen, wie Sie gleich sehen werden. Wenn Sie sich zum ersten Mal mit Operatoren beschäftigen, ist es
424
20 Operatoren
gut, den Unterschied immer im Auge zu behalten. Später, wenn Sie mit ihnen besser vertraut sind, werden Sie feststellen, dass es nicht so wichtig ist, eine scharfe Trennung zwischen den beiden Arten von Operatoren zu ziehen. In den meisten Büchern werden Sie dieselbe Notation für beide finden! Wir wollen nun fortfahren und uns einige nützliche Dinge ansehen, die man mit Operatoren ˆ machen kann. Zuvor aber noch eine Anmerkung. Angenommen, wir haben einen Operator A, ˆ dessen Matrix in irgendeiner Basis Ai j ≡ � i | A | j � ist. Die Amplitude dafür, dass der Zustand Aˆ | ψ � auch in einem anderen Zustand | φ � ist, ist � φ | Aˆ | ψ �. Hat das komplex Konjugierte dieser Amplitude irgendeine Bedeutung? Sie sollten zeigen können, dass � φ | Aˆ | ψ � = � ψ | Aˆ † | φ � ∗
(20.8)
ist, wobei Aˆ † (lies „A Kreuz“) ein Operator ist, dessen Matrixelemente A†i j = (A ji )∗
(20.9)
sind. Um das i, j-Element von A† zu erhalten, gehen Sie zum j, i-Element von Aˆ (die Indizes sind vertauscht) und bilden davon das komplex Konjugierte. Die Amplitude dafür, dass der Zustand Aˆ † | φ � in | ψ � ist, ist das komplex Konjugierte der Amplitude dafür, dass Aˆ | ψ � im Zuˆ Viele wichtige stand | φ � ist. Der Operator Aˆ † heißt „hermitesch adjungierter Operator“ von A. Operatoren der Quantenmechanik haben die spezielle Eigenschaft, dass Sie denselben Operator zurückerhalten, wenn Sie von ihm den hermitesch adjungierten Operator nehmen. Für einen solchen Operator Bˆ gilt Bˆ † = Bˆ , und er heißt ein „selbstadjungierter“ oder „hermitescher“ Operator.
20.2
Mittlere Energien
Bisher haben wir Sie hauptsächlich an das erinnert, was Sie schon wissen. Jetzt möchten wir eine neue Frage diskutieren. Wie würden Sie die mittlere Energie eines Systems – beispielsweise von einem Atom – ermitteln? Wenn ein Atom in einem gegebenen Zustand mit bestimmter Energie ist und Sie die Energie messen, werden Sie eine gewisse Energie E finden. Wenn Sie die Messungen an jedem von einer ganzen Reihe von Atomen wiederholen, die alle so ausgewählt sind, dass sie in demselben Zustand sind, werden alle Messungen E ergeben und der „Mittelwert“ Ihrer Messungen wird natürlich einfach E sein. Was passiert jetzt aber, wenn Sie die Messung an einem Zustand | ψ � vornehmen, der kein stationärer Zustand ist? Da das System keine bestimmte Energie hat, wird die eine Messung den einen Energiewert ergeben, die Messung an einem anderen Atom in demselben Zustand aber einen anderen Energiewert usw. Was werden Sie als Mittelwert für eine ganze Reihe von Energiemessungen erhalten? Wir können die Frage beantworten, indem wir den Zustand | ψ � auf das Basissystem der Zustände mit bestimmter Energie projizieren. Um daran zu erinnern, dass dies ein spezielles Ba-
20.2 Mittlere Energien
425
sissystem ist, wollen wir die Zustände | ηi � nennen. Jeder der Zustände | ηi � hat eine bestimmte Energie Ei . In dieser Darstellung ist |ψ� = Ci | ηi � . (20.10) i
Wenn Sie eine Energiemessung vornehmen und den Wert Ei erhalten, haben Sie herausgefunden, dass das System im Zustand ηi ist. Sie können aber bei jeder Messung einen anderen Wert erhalten. Manchmal werden Sie E1 erhalten, manchmal E2 , manchmal E3 usw. Die Wahrscheinlichkeit, dass Sie die Energie E1 erhalten, ist gerade die Wahrscheinlichkeit, das System im Zustand | η1 � zu finden, und diese ist natürlich einfach das Absolutquadrat der Amplitude C1 = � η1 | ψ �. Die Wahrscheinlichkeit, die Energie Ei zu erhalten, ist für jedes mögliche i Pi = |Ci |2 .
(20.11)
Wie sind diese Wahrscheinlichkeiten mit dem Mittelwert einer ganzen Folge von Energiemessungen verknüpft? Stellen wir uns vor, dass wir eine Reihe von Messergebnissen wie diese erhalten: E1 , E7 , E11 , E9 , E10 , E7 , E2 , E3 , E9 , E6 , E4 usw. Wir setzen das beispielsweise über tausend Messungen fort. Wenn wir fertig sind, addieren wir alle Energiewerte und dividieren durch tausend. Das ist es, was wir mit dem Mittelwert meinen. Sie können die Addition aller Zahlen auch abkürzen. Sie können zählen, wie oft Sie E1 erhalten, und das Ergebnis mit N1 bezeichnen. Dann zählen Sie, wie oft Sie E2 erhalten, und bezeichnen das Ergebnis mit N2 usw. Die Summe aller Energiewerte ist offensichtlich N1 E1 + N2 E2 + N3 E3 + · · · = Ni Ei . i
Um die mittlere Energie zu erhalten, dividieren Sie diese Summe durch die Gesamtzahl N der Messungen, die einfach die Summe aller Ni ’s ist: Ni Ei . (20.12) Emittel = i N Wir sind fast fertig. Was wir mit der Wahrscheinlichkeit, dass etwas geschieht, meinen, ist einfach die Anzahl der Fälle, bei denen wir erwarten, dass es geschieht, dividiert durch die Gesamtzahl der Versuche. Das Verhältnis Ni /N sollte – für große N – sehr nahe bei Pi liegen, der Wahrscheinlichkeit dafür, den Zustand | ηi � zu finden, obwohl es wegen der statistischen Schwankungen nicht genau Pi sein wird. Die vorhergesagte (oder „erwartete“) mittlere Energie �E�mittel ist �E�mittel = Pi E i . (20.13) i
Dieselben Argumente sind auf jede Messung anwendbar. Der Mittelwert einer gemessenen Größe A ist gleich �A�mittel = Pi Ai , i
wobei die Ai die verschiedenen möglichen Werte der beobachteten Größe sind und die Pi die Wahrscheinlichkeiten dafür, diesen Wert zu erhalten.
426
20 Operatoren
Kehren wir zu unserem quantenmechanischen Zustand | ψ � zurück. Seine mittlere Energie ist � � �E�mittel = |Ci |2 Ei = Ci∗Ci Ei . (20.14) i
i
Beachten Sie jetzt den Trick! Zuerst schreiben wir die Summe als � � ψ | ηi � Ei � ηi | ψ � .
(20.15)
i
Als Nächstes behandeln wir das linke � ψ | als gemeinsamen „Faktor“. Wir können diesen Faktor vor die Summe ziehen und schreiben ⎧ ⎫ ⎪ ⎪ ⎪ ⎪ ⎨� ⎬ �ψ| ⎪ | ηi � Ei � ηi | ψ �⎪ . ⎪ ⎪ ⎩ ⎭ i
Dieser Ausdruck hat die Form �ψ|φ� ,
wobei | φ � irgendein „kombinierter“ Zustand ist, der definiert ist durch � | ηi � Ei � ηi | ψ � . |φ� =
(20.16)
i
Mit anderen Worten, er ist der Zustand, den Sie erhalten, wenn Sie jeden Basiszustand | ηi � mit Ei � ηi | ψ � wichten.
Rufen Sie sich nun in Erinnerung, was wir mit den Zuständen | ηi � meinen. Wir haben vorausgesetzt, dass sie stationäre Zustände sind; das heißt, für jeden dieser Zustände gilt Hˆ | ηi � = Ei | ηi � . Da Ei einfach eine Zahl ist, ist die rechte Seite dasselbe wie | ηi � Ei und die Summe in (20.16) ist dasselbe wie � Hˆ | ηi � � ηi | ψ � . i
Nun erscheint i nur in der berühmten Kombination, die sich zu eins zusammenzieht. Wir haben also � � | ηi � � ηi | ψ � = Hˆ | ψ � . Hˆ | ηi � � ηi | ψ � = Hˆ i
i
Zauberei! Gleichung (20.16) ist dasselbe wie | φ � = Hˆ | ψ � .
(20.17)
Die mittlere Energie des Zustandes | ψ � kann sehr hübsch geschrieben werden als �E�mittel = � ψ | Hˆ | ψ �
(20.18)
20.2 Mittlere Energien
427
Um die mittlere Energie zu erhalten, wenden Sie Hˆ auf | ψ � an und multiplizieren dann mit � ψ | . Ein einfaches Ergebnis.
Unsere neue Formel für die mittlere Energie ist nicht nur hübsch, sie ist auch nützlich, weil wir nun nichts mehr über ein spezielles System von Basiszuständen sagen müssen. Wir müssen nicht einmal mehr alle möglichen Energieniveaus kennen. Wenn wir uns ans Ausrechnen machen, werden wir unseren Zustand durch irgendein System von Basiszuständen beschreiben müssen. Wenn wir aber die Hamilton-Matrix Hi j für dieses System kennen, so können wir die mittlere Energie ermitteln. Gleichung (20.18) besagt, dass für jedes System von Basiszuständen | i � die mittlere Energie berechnet werden kann aus �E�mittel =
ij
� ψ | i � � i | Hˆ | j � � j | ψ � ,
(20.19)
wobei die Amplituden � i | Hˆ | j � gerade die Matrixelemente Hi j sind.
Überprüfen wir dieses Ergebnis am Spezialfall, dass die Zustände | i � die Zustände mit bestimmter Energie sind. Für sie ist Hˆ | j � = E j | j �, sodass � i | Hˆ | j � = E j δi j ist und �E�mittel =
ij
� ψ | i � E j δi j � j | ψ � =
i
Ei � ψ | i � � i | ψ � ,
was richtig ist. Gleichung (20.19) kann übrigens auch auf andere physikalische Messungen, die Sie als Operator ausdrücken können, verallgemeinert werden. Zum Beispiel ist Lˆ z der Operator der zKomponente des Drehimpulses L. Der Mittelwert der z-Komponente für den Zustand | ψ � ist �Lz �mittel = � ψ | Lˆ z | ψ � . Eine Möglichkeit, das zu beweisen, besteht darin, dass man eine Situation betrachtet, in der die Energie proportional zum Drehimpuls ist. Dann lassen sich alle Beweise auf dieselbe Art durchführen. Zusammenfassend können wir sagen: Wenn eine physikalische Observable A mit einem geeigneten quantenmechanischen Operator Aˆ verknüpft ist, dann ist der Mittelwert von A für den Zustand | ψ � gegeben durch �A�mittel = � ψ | Aˆ | ψ � .
(20.20)
Damit meinen wir, dass �A�mittel = � ψ | φ �
(20.21)
| φ � = Aˆ | ψ � .
(20.22)
mit
428
20 Operatoren
20.3
Die mittlere Energie eines Atoms
Angenommen, wir möchten die mittlere Energie eines Atoms in einem durch eine Wellenfunktion ψ(r) beschriebenen Zustand wissen. Wie können wir sie berechnen? Betrachten wir zuerst eine eindimensionale Situation mit einem Zustand | ψ �, der durch die Amplitude � x | ψ � = ψ(x) definiert ist. Wir fragen nach dem Spezialfall von Gleichung (20.19), wenn sie auf die Ortsdarstellung angewendet wird. Wie gewohnt ersetzen wir die Zustände | i � und | j � durch | x � und | x� � und ändern die Summen in Integrale um. Wir erhalten �E�mittel = � ψ | x � � x | Hˆ | x� � � x� | ψ � dx dx� . (20.23) Dieses Integral können wir auch folgendermaßen schreiben: � ψ | x � � x | φ � dx
(20.24)
mit �x|φ� =
� x | Hˆ | x� � � x� | ψ � dx� .
(20.25)
Das Integral über x� in (20.25) ist dasselbe wie in Kapitel 16 – siehe (16.50) und (16.52) – und es ist gleich −
2 d2 ψ(x) + V(x) ψ(x) . 2m dx2
Wir können daher schreiben 2 d2 + V(x) ψ(x) . �x|φ� = − 2m dx2
(20.26)
Denken Sie daran, dass � ψ | x � = � x | ψ �∗ = ψ∗ (x) ist; wenn wir diese Gleichheit verwenden, kann die mittlere Energie in (20.23) geschrieben werden als �E�mittel =
2 d2 ψ∗ (x) − + V(x) ψ(x) dx . 2m dx2
(20.27)
Bei einer gegebenen Wellenfunktion ψ(x) können Sie die mittlere Energie durch Auswertung dieses Integrals erhalten. Sie können jetzt langsam erkennen, wie wir zwischen den Begriffen Zustandsvektor und Wellenfunktion hin und her wechseln können. Die Größe in den geschweiften Klammern von Gleichung (20.27) ist ein algebraischer Opera bezeichnen: tor.1 Wir wollen ihn mit H 1
2 2 = − d + V(x) . H 2m dx2
Der „Operator“ V(x) bedeutet „multipliziere mit V(x)“.
20.3 Die mittlere Energie eines Atoms Mit dieser Notation wird Gleicung (20.23) zu ψ(x) dx . �E�mittel = ψ∗ (x) H
429
(20.28)
ist natürlich nicht identisch mit dem quantenmeDer so definierte algebraische Operator H ˆ chanischen Operator H. Der neue Operator wirkt auf eine Funktion des Ortes ψ(x) = � x | ψ �, um daraus eine neue Funktion von x, φ(x) = � x | φ �, zu machen. Hˆ dagegen wirkt auf einen Zustandsvektor | ψ �, um einen neuen Zustandsvektor | φ � herzustellen, ohne die Ortsdarstel nicht einmal in der lung oder sonst irgendeine spezielle Darstellung einzubeziehen. Auch ist H ˆ Ortsdarstellung genau dasselbe wie H. Wenn wir uns entschließen, in der Ortsdarstellung zu arbeiten, würden wir Hˆ als eine Matrix � x | Hˆ | x� � interpretieren, die irgendwie von den zwei „Indizes“ x und x� abhängt; das heißt, wir erwarten – nach Gleichung (20.25) –, dass � x | φ � mit allen Amplituden � x | ψ � durch ein Integral verknüpft ist. Andererseits stellen wir fest, dass H � ˆ ein Differentialoperator ist. Den Zusammenhang zwischen � x | H | x � und dem algebraischen haben wir schon in Abschnitt 16.5 ermittelt. Operator H Eine Einschränkung müssen wir in Bezug auf unsere Ergebnisse machen. Wir haben vorausgesetzt, dass die Amplitude ψ(x) = � x | ψ � normiert ist. Damit meinen wir, dass die Skala so gewählt worden ist, dass |ψ(x)|2 dx = 1 ;
daher ist die Wahrscheinlichkeit, das Elektron irgendwo zu finden, gleich eins. Falls Sie nicht mit einem normierten ψ(x) arbeiten wollen, dann müssen Sie schreiben ψ(x) dx ψ∗ (x) H �E�mittel = . (20.29) ψ∗ (x)ψ(x) dx
Das ist dasselbe.
Beachten Sie die formale Ähnlichkeit zwischen (20.28) und (20.18). Diese beiden Notationen für dasselbe Ergebnis erscheinen oft, wenn Sie mit der x-Darstellung arbeiten. Sie können mit ˆ das ein lokaler Operator ist, von der ersten zur zweiten Form übergehen. Ein irgendeinem A, lokaler Operator ist einer, der in dem Integral � x | Aˆ | x� � � x� | ψ � dx�
als Aˆ ψ(x) geschrieben werden kann, wobei Aˆ ein algebraischer Differentialoperator ist. Es gibt jedoch Operatoren, für die dies nicht gilt. Dann müssen Sie mit den Grundgleichungen (20.21) und (20.22) arbeiten. Sie können unsere Herleitung leicht auf drei Dimensionen verallgemeinern. Das Ergebnis ist2 ψ( r) dVol �E�mittel = ψ∗ ( r) H (20.30) 2
Wir schreiben dVol für das Volumenelement. Es ist natürlich einfach dx dy dz, und das Integral erstreckt sich in allen drei Koordinaten von −∞ bis +∞.
430
20 Operatoren
mit 2
= − ∇2 + V( r) H 2m
und mit der Normierung |ψ|2 dVol = 1 .
(20.31)
(20.32)
Die Gleichungen können auf ziemlich offensichtliche Weise auf Systeme mit mehreren Elektronen erweitert werden, aber wir wollen uns nicht damit abgeben, die Ergebnisse hinzuschreiben. Mit (20.30) können wir die mittlere Energie eines atomaren Zustands berechnen, sogar ohne die Energieniveaus zu kennen. Wir müssen nur die Wellenfunktion kennen. Das ist ein wichtiges Gesetz. Im Folgenden wollen wir ein interessantes Anwendungsbeispiel betrachten. Angenommen, Sie möchten die Grundzustandsenergie eines Systems wissen – sagen wir, vom Heliumatom –, es ist aber zu schwierig, die Schrödinger-Gleichung für die Wellenfunktion zu lösen, weil es zu viele Variablen gibt. Also machen Sie eine Annahme über die Wellenfunktion – Sie nehmen irgendeine beliebige Funktion – und berechnen die mittlere Energie. Das heißt, Sie benutzen Gleichung (20.29) – auf drei Dimensionen verallgemeinert –, um herauszufinden, was die mittlere Energie wäre, wenn das Atom wirklich in dem durch diese Wellenfunktion beschriebenen Zustand wäre. Diese Energie wird sicherlich höher sein als die Energie des Grundzustands, die die niedrigste Energie ist, die das Atom haben kann.3 Nun nehmen Sie eine andere Funktion und berechnen für sie die mittlere Energie. Wenn sie niedriger ist als die, die Sie zuerst gewählt haben, kommen Sie näher an die wahre Grundzustandsenergie heran. Wenn Sie alle möglichen künstlichen Zustände ausprobieren, werden Sie immer niedrigere Energien erhalten können, die immer dichter an die Grundzustandsenergie herankommen. Wenn Sie schlau sind, werden Sie einige Funktionen ausprobieren, die ein paar veränderliche Parameter haben. Wenn Sie die Energie berechnen, wird sie durch diese Parameter ausgedrückt. Indem Sie die Parameter variieren, um die niedrigste Energie zu erhalten, probieren Sie eine ganze Klasse von Funktionen auf einmal aus. Schließlich werden Sie feststellen, dass es immer schwieriger wird, noch niedrigere Energien zu erhalten, und Sie werden immer mehr das Gefühl haben, dass Sie ziemlich nahe an der niedrigsten Energie sind. Die Energie des Heliumatoms wurde auf genau diese Art ermittelt – nicht durch Lösung einer Differentialgleichung, sondern durch Konstruktion einer speziellen Funktion mit einer Vielzahl veränderlicher Parameter, die schließlich so gewählt wurden, dass sie den niedrigsten Wert für die mittlere Energie ergaben.
20.4
Der Ortsoperator
Was ist der Mittelwert des Ortes eines Elektrons in einem Atom? Was ist in einem speziellen Zustand | ψ � der Mittelwert der Koordinate x? Wir wollen in einer Dimension arbeiten und es Ihnen überlassen, die Vorgehensweise auf drei Dimensionen oder auf Systeme mit mehr als 3
Sie können das auch so betrachten: Jede Funktion (das heißt jeder Zustand), die Sie wählen, kann als Linearkombination der Basiszustände geschrieben werden, die Zustände mit bestimmter Energie sind. Da in dieser Kombination der Zustand niedrigster Energie mit Zuständen höherer Energien gemischt ist, wird die mittlere Energie höher sein als die Grundzustandsenergie.
20.4 Der Ortsoperator
431
einem Teilchen zu verallgemeinern. Wir haben einen durch ψ(x) beschriebenen Zustand, und wir messen x immer und immer wieder. Was ist der Mittelwert? Er ist x P(x) dx , wobei P(x) dx die Wahrscheinlichkeit dafür ist, das Elektron in einem kleinen Element dx um x zu finden. Nehmen wir an, die Wahrscheinlichkeitsdichte P(x) ändert sich mit x wie in Abbildung 20.1 gezeigt. Das Elektron wird man am wahrscheinlichsten in der Nähe der Spitze der Kurve finden. Der Mittelwert von x ist auch irgendwo in der Nähe der Spitze. Er ist gerade der Schwerpunkt der Fläche unter der Kurve. P(x)
x
Abb. 20.1: Eine Kurve für die Wahrscheinlichkeitsdichte, die ein lokalisiertes Teilchen darstellt.
Wir haben früher gesehen, dass P(x) gerade |ψ(x)|2 = ψ∗ (x) ψ(x) ist, sodass wir den Mittelwert von x schreiben können als �x�mittel = ψ∗ (x) x ψ(x) dx . (20.33) Unsere Gleichung für �x�mittel hat dieselbe Form wie (20.28). Bei der mittleren Energie er zwischen den beiden ψ’s, bei dem mittleren Ort ist da einfach scheint der Energieoperator H x. (Wenn Sie wollen, können Sie x als den algebraischen Operator „multipliziere mit x“ ansehen.) Wir können die Parallelität noch weiterführen, indem wir den mittleren Ort in einer Form ausdrücken, die Gleichung (20.18) entspricht. Schreiben wir einfach mit
�x�mittel = � ψ | α �
(20.34)
| α � = xˆ | ψ �
(20.35)
und versuchen wir dann, den Operator xˆ zu finden, der den Zustand | α � erzeugt, sodass (20.34) im Einklang mit (20.33) steht. Das heißt, wir müssen ein | α � finden, für das gilt � ψ | α � = �x�mittel = � ψ | x � x � x | ψ � dx . (20.36)
Als Erstes wollen wir � ψ | α � in der x-Darstellung entwickeln. Es ist �ψ|α� = � ψ | x � � x | α � dx .
(20.37)
432
20 Operatoren
Nun vergleichen Sie die Integrale in den letzten beiden Gleichungen. Sie sehen, dass in der x-Darstellung gelten muss �x|α� = x�x|ψ� .
(20.38)
Eine Anwendung von xˆ auf | ψ �, um | α � zu bekommen, ist gleichbedeutend mit einer Multiplikation von ψ(x) = � x | ψ � mit x, um α(x) = � x | α � zu erhalten. Wir haben damit eine Definition von xˆ in der Ortsdarstellung gefunden.4 (Wir haben uns nicht darum bemüht, die x-Darstellung der Matrix des Operators xˆ zu erhalten. Wenn Sie Ehrgeiz in dieser Richtung entwickeln, können Sie versuchen, zu zeigen, dass � x | xˆ | x� � = x δ(x − x� ) .
(20.39)
Sie können dann das amüsante Ergebnis ausrechnen, dass xˆ | x � = x | x � .
(20.40)
Der Operator xˆ hat die interessante Eigenschaft, dass er bei einer Anwendung auf die Basiszustände | x � gleichbedeutend mit einer Multiplikation mit x ist.) Möchten Sie den Mittelwert von x2 wissen? Er ist ψ∗ (x) x2 ψ(x) dx . �x2 �mittel =
(20.41)
Alternativ können Sie schreiben
�x2 �mittel = � ψ | α� � mit | α� � = xˆ2 | ψ � .
(20.42)
Mit xˆ2 meinen wir xˆ xˆ – die beiden Operatoren werden nacheinander angewendet. Mit der zweiten Form können Sie �x2 �mittel unter Verwendung jeder beliebigen Darstellung (Basiszustände) berechnen. Wenn Sie den Mittelwert von xn oder von irgendeinem Polynom in x haben möchten, können Sie jetzt sehen, wie man ihn berechnen kann.
20.5
Der Impulsoperator
Nun möchten wir den mittleren Impuls eines Elektrons berechnen – wieder werden wir uns auf eine Dimension beschränken. Sei P(p) dp die Wahrscheinlichkeit dafür, dass eine Messung einen Impuls zwischen p und p + dp ergibt. Dann ist �p�mittel = p P(p) dp . (20.43) 4
Gleichung (20.38) bedeutet nicht, dass | α � = x | ψ � ist. Sie können das � x | nicht nach vorn ziehen, weil der Multiplikator x vor � x | ψ � eine Zahl ist, die für jeden Zustand � x | verschieden ist. Sie ist der Koordinatenwert des Elektrons im Zustand | x �; siehe (20.40).
20.5 Der Impulsoperator
433
Nun sei � p | ψ � die Amplitude dafür, dass der Zustand | ψ � in einem Zustand | p � mit bestimmtem Impuls ist. Dies ist dieselbe Amplitude, die wir in Abschnitt 16.3 � mom p | ψ � genannt haben, und sie ist eine Funktion von p, ebenso wie � x | ψ � eine Funktion von x ist. Damals hatten wir beschlossen, die Amplitude so zu normieren, dass P(p) =
1 |� p | ψ �|2 . 2π
(20.44)
Wir haben damit �p�mittel =
�ψ| p� p� p|ψ�
dp . 2π
(20.45)
Die Form ähnelt dem Ausdruck für �x�mittel .
Wir können nun das Spiel wiederholen, das wir mit �x�mittel gemacht haben. Zuerst können wir das obige Integral schreiben als dp . (20.46) �ψ| p�� p|β� 2π
Sie sollten nun erkennen, dass diese Gleichung gerade die entwickelte Form der Amplitude � ψ | β � ist – entwickelt nach den Basiszuständen mit bestimmtem Impuls. Nach (20.45) ist der Zustand | β � in der Impulsdarstellung definiert durch � p|β� = p� p|ψ� .
(20.47)
Das heißt, wir können jetzt schreiben �p�mittel = � ψ | β �
(20.48)
| β � = pˆ | ψ � ,
(20.49)
mit
wobei der Operator pˆ durch Gleichung (20.47) in der p-Darstellung definiert ist. (Wieder können Sie zeigen, dass die Matrixform von pˆ � p | pˆ | p� � = p δ(p − p� )
(20.50)
pˆ | p � = p | p � .
(20.51)
ist und dass
Es ergibt sich genauso wie bei x.) Jetzt kommt eine interessante Frage. Wir können �p�mittel schreiben, wie wir es in den Gleichungen (20.45) und (20.48) getan haben, und wir kennen dann die Bedeutung des Operators pˆ in der Impulsdarstellung. Aber wie sollen wir pˆ in der Ortsdarstellung interpretieren? Das ist es, was wir wissen müssen, wenn wir eine Wellenfunktion ψ(x) haben und ihren mittleren Impuls berechnen wollen. Wir wollen deutlich machen, was wir meinen. Wenn wir davon
434
20 Operatoren
ausgehen, dass �p�mittel durch (20.48) gegeben ist, können wir diese Gleichung in Termen der p-Darstellung entwickeln, um wieder auf (20.46) zurückzukommen. Wenn die p-Darstellung des Zustands gegeben ist – nämlich die Amplitude � p | ψ �, die eine algebraische Funktion des Impulses p ist –, können wir � p | β � aus (20.47) erhalten und fortfahren, das Integral auszuwerten. Die Frage ist jetzt: Was machen wir aber, wenn eine Beschreibung des Zustands in der x-Darstellung gegeben ist, nämlich die Wellenfunktion ψ(x) = � x | ψ �?
Nun ja, fangen wir damit an, dass wir (20.48) in der x-Darstellung entwickeln. Wir erhalten �p�mittel = � ψ | x � � x | β � dx . (20.52) Jetzt müssen wir jedoch wissen, wie der Zustand | β � in der x-Darstellung aussieht. Wenn wir das wissen, können wir die Integration ausführen. Unser Problem ist also, die Funktion β(x) = � x | β � zu finden.
Wir können sie auf folgende Weise finden. In Abschnitt 16.3 haben wir gesehen, wie � p | β � mit � x | β � verknüpft ist. Nach (16.24) ist � p|β� = e−ipx/ � x | β � dx . (20.53)
Wenn wir � p | β � kennen, können wir die Gleichung nach � x | β � auflösen. Wir möchten natürlich das Ergebnis irgendwie durch ψ(x) = � x | ψ � ausdrücken, was wir als bekannt voraussetzen. Angenommen, wir beginnen mit (20.47) und benutzen wieder (16.24), um zu schreiben � p | β � = p � p | ψ � = p e−ipx/ ψ(x) dx . (20.54) Da die Integration über x geht, können wir p in das Integral hineinnehmen und schreiben (20.55) � p|β� = e−ipx/ pψ(x) dx .
Vergleichen Sie dies mit (20.53). Man könnte meinen, dass � x | β � gleich pψ(x) ist. Aber das ist ein Trugschluss! Die Wellenfunktion � x | β � = β(x) kann nur von x abhängen – nicht von p. Das ist das ganze Problem.
Ein kluger Kopf entdeckte jedoch, dass das Integral in (20.55) partiell integriert werden kann. Die Ableitung von e−ipx/ nach x ist (−i/) p e−ipx/, daher ist der Integrand in (20.55) gleichwertig mit d −ipx/ (e )ψ(x) dx . i dx Wenn wir partiell integrieren, wird das Integral zu +∞ dψ −ipx/ e−ipx/ dx . − e ψ(x) + −∞ i i dx −
Solange wir gebundene Zustände betrachten, bei denen ψ(x) für x gegen ±∞ gegen null geht, ist der Ausdruck in den eckigen Klammern null, und wir erhalten dψ e−ipx/ dx . (20.56) � p|β� = i dx
20.5 Der Impulsoperator
435
Jetzt vergleichen Sie dieses Ergebnis mit (20.53). Sie sehen, dass �x|β� =
dψ dx . i dx
(20.57)
Wir haben das nötige Stück, um (20.52) vervollständigen zu können. Das Ergebnis ist dψ �p�mittel = ψ(x) dx . (20.58) ψ∗ (x) i dx
Wir haben herausbekommen, wie (20.48) in der Ortsdarstellung aussieht.
Sie sollten jetzt allmählich das interessante Bild erkennen, das sich abzeichnet. Als wir nach der mittleren Energie des Zustands | ψ � gefragt haben, sagten wir, sie wäre �E�mittel = � ψ | φ �
mit
| φ � = Hˆ | ψ � .
Das wird in der Koordinatenwelt geschrieben als ψ(x) . �E�mittel = ψ∗ (x) φ(x) dx mit φ(x) = H
ein algebraischer Operator, der auf eine Funktion von x wirkt. Wir hatten festgestellt, Hier ist H dass der Mittelwert von x auch in der Form �x�mittel = � ψ | α �
mit
| α � = xˆ | ψ �
geschrieben werden kann. In der Koordinatenwelt lauten die entsprechenden Gleichungen ψ∗ (x) α(x) dx mit α(x) = xψ(x) . �x�mittel =
Für den Mittelwert von p hatten wir gefunden �p�mittel = � ψ | β �
mit
| β � = pˆ | ψ � .
In der Koordinatenwelt waren die äquivalenten Gleichungen d ψ(x) . ψ∗ (x)β(x) dx mit β(x) = �p�mittel = i dx
In jedem unserer drei Beispiele beginnen wir mit dem Zustand | ψ � und bilden einen anderen (hypothetischen) Zustand mithilfe eines quantenmechanischen Operators. In der Ortsdarstellung erzeugen wir die entsprechende Wellenfunktion durch Anwendung eines algebraischen Operators auf die Wellenfunktion ψ(x). Es gibt die folgenden umkehrbar eindeutigen Entsprechungen (für eindimensionale Probleme): 2 2 = − d + V(x) , Hˆ → H 2m dx2 xˆ → x , ∂ . pˆ → Pˆ x = i ∂x
(20.59)
436
20 Operatoren
In dieser Aufstellung haben wir das Symbol Pˆ x für den algebraischen Operator (/i) ∂/∂x eingeführt: ∂ Pˆ x = , i ∂x
(20.60)
und wir haben den Index x am Pˆ angebracht, um anzuzeigen, dass wir nur die x-Komponente des Impulses berücksichtigt haben. Sie können die Ergebnisse leicht auf drei Dimensionen erweitern. Für die anderen Komponenten des Impulses gilt pˆ y → Pˆy = i pˆ z → Pˆz = i
∂ , ∂y ∂ , ∂z
Sie können sogar an einen Operator des vektoriellen Impulses denken und schreiben ˆ = e x ∂ + ey ∂ + ez ∂ , ˆp → P i ∂x ∂y ∂z
wobei e x , ey und ez die Einheitsvektoren in den drei Richtungen sind. Es sieht sogar noch eleganter aus, wenn wir schreiben ˆ = ∇. ˆp → P i
(20.61)
Unser allgemeines Ergebnis ist, dass es zumindest für einige quantenmechanische Operatoren entsprechende algebraische Operatoren in der Ortsdarstellung gibt. Wir fassen unsere bisherigen Ergebnisse – erweitert auf drei Dimensionen – in Tabelle 20.1 zusammen. Für jeden Operator haben wir die zwei äquivalenten Formen:5 | φ � = Aˆ | ψ �
(20.62)
ˆ r) . φ( r) = Aψ(
(20.63)
und
Wir wollen jetzt ein paar Anwendungsbeispiele für diese Konzepte betrachten. Im ersten wollen klarmachen. Wenn wir Pˆ x zweimal anwenwir uns einfach die Beziehung zwischen Pˆ und H den, erhalten wir ∂2 Pˆ x Pˆ x = −2 2 . ∂x
5
In vielen Büchern wird für Aˆ und A dasselbe Symbol benutzt, weil sie beide für dieselbe Physik stehen und weil es angenehm ist, wenn man nicht zwei verschiedene Buchstaben schreiben muss. Sie können gewöhnlich aus dem Zusammenhang entnehmen, welcher Operator gemeint ist.
20.5 Der Impulsoperator
437
Tabelle 20.1: Quantenmechanische Operatoren
physikalische Größe
Operator
Energie
Hˆ
Ort
xˆ yˆ
Impuls
Koordinatenform 2 = − ∇2 + V( r) H 2m x
y
zˆ
z
pˆ x
Pˆ x = i Pˆy = i Pˆz = i
pˆ y pˆ z
∂ ∂x ∂ ∂y ∂ ∂z
Dies bedeutet, dass wir die folgende Gleichheitsbeziehung schreiben können: = 1 Pˆ x Pˆ x + Pˆy Pˆy + Pˆz Pˆz + V( r) . H 2m
Oder in Vektorschreibweise,
= 1 P ˆ ·P ˆ + V( r) . H 2m
(20.64)
(Bei einem algebraischen Operator bedeutet jeder Term ohne das Operatorsymbol (ˆ) einfach eine direkte Multiplikation.) Diese Gleichung ist hübsch, weil sie leicht zu merken ist, sofern man die klassische Physik nicht vergessen hat. Jeder weiß, dass die Energie (im nichtrelativisti ist der schen Fall) einfach die kinetische Energie p2 /2m plus die potentielle Energie ist, und H Operator der Gesamtenergie. Dieses Ergebnis hat die Physiker so stark beeindruckt, dass sie immer noch versuchen, den Studenten vor der Quantenmechanik alles über die klassische Physik beizubringen. (Wir denken anders!) Aber solche Parallelen sind oft irreführend, und zwar deshalb, weil für Operatoren die Reihenfolge der Faktoren wichtig ist, für die Faktoren in einer klassischen Gleichung dagegen nicht. In Kapitel 17 hatten wir einen Operator p(x) ˆ durch den Translationsoperator Dˆ x definiert: i (20.65) | ψ� � = Dˆ x (δ) | ψ � = 1 + pˆ x δ | ψ � , wobei δ eine kleine Verschiebung ist (siehe (17.27)). Wir wollen nun zeigen, dass dies zu unserer neuen Definition äquivalent ist. Nach dem, was wir gerade ausgerechnet haben, sollte diese Gleichung dasselbe bedeuten wie ψ� (x) = ψ(x) +
∂ψ δ. ∂x
438
20 Operatoren
Aber die rechte Seite ist gerade die Taylorentwicklung von ψ(x + δ), was sicherlich das ist, was Sie erhalten, wenn Sie den Zustand um δ nach links verschieben (oder die Koordinaten um denselben Betrag nach rechts). Unsere beiden Definitionen von pˆ stimmen also überein! Wir wollen nun diese Tatsache benutzen, um etwas anderes zu zeigen. Angenommen, wir betrachten in einem komplizierten System eine Gruppe von Teilchen, die wir mit 1, 2, 3, . . . kennzeichnen. (Um die Dinge einfach zu halten, beschränken wir uns auf eine Dimension.) Die den Zustand beschreibende Wellenfunktion ist eine Funktion aller Koordinaten x1 , x2 , x3 , . . . Wir können sie als ψ(x1 , x2 , x3 , . . .) schreiben. Verschieben wir nun das System (nach links) um δ. Die neue Wellenfunktion ψ� (x1 , x2 , x3 , . . .) = ψ(x1 + δ, x2 + δ, x3 + δ, . . .) kann geschrieben werden als ∂ψ ∂ψ ∂ψ ψ� (x1 , x2 , x3 , . . .) = ψ(x1 , x2 , x3 , . . .) + δ +δ +δ + ··· . ∂x1 ∂x2 ∂x3
(20.66)
Gemäß (20.65) ist der Operator des Impulses des Zustands | ψ � (nennen wir ihn den Gesamtimpuls) gleich ∂ ∂ ∂ Pˆgesamt = + + +··· . i ∂x1 ∂x2 ∂x3
Dies ist aber dasselbe wie
Pˆgesamt = Pˆ x1 + Pˆ x2 + Pˆ x3 + . . . .
(20.67)
Die Impulsoperatoren genügen dem Gesetz, dass der Gesamtimpuls der Teilchen die Summe der Impulse aller Teilchen ist. Alles passt schön zusammen, und viele Dinge, die wir gesagt haben, stimmen miteinander überein.
20.6
Drehimpuls
Schauen wir uns spaßeshalber noch einen weiteren Operator an – den Operator des Bahndrehimpulses. In Kapitel 17 hatten wir einen Operator Jˆz durch Rˆ z (ϕ) definiert, den Operator der Drehung um den Winkel ϕ um die z-Achse. Wir betrachten im Folgenden ein System, das durch eine Wellenfunktion ψ(r) beschrieben wird, die eine Funktion allein der Koordinaten ist, wobei wir die Tatsache, dass das Elektron entweder Spin up oder Spin down hat, nicht berücksichtigen. Das heißt, wir wollen hier den intrinsischen Drehimpuls unberücksichtigt lassen und nur an den Bahnanteil denken. Damit der Unterschied klar ist, wollen wir den Bahnoperator Lˆ z nennen und ihn mit Hilfe des Drehoperators um einen infinitesimalen Winkel � definieren durch i Rˆ z (�) | ψ � = 1 + � Lˆ z | ψ � .
(Denken Sie daran, dass diese Definition nur für einen Zustand | ψ � gilt, der keine inneren Spinvariablen hat, sondern nur vom Ort r = (x, y, z) abhängt.) Wenn wir uns den Zustand | ψ �
20.6 Drehimpuls
439
y� y � P
�
x� x Abb. 20.2: Drehung des Koordinatensystems um die zAchseum den kleinen Winkel �.
in einem neuen Koordinatensystem ansehen, das um die z-Achse um den kleinen Winkel � gedreht ist, dann sehen wir einen neuen Zustand | ψ� � = Rˆ z (�) | ψ � .
Wenn wir den Zustand | ψ � in der Ortsdarstellung beschreiben – das heißt, durch seine Wellenfunktion ψ(r) –, dann würden wir erwarten, dass wir schreiben können i ψ� ( r) = 1 + � Lˆ z ψ( r) .
(20.68)
Was ist Lˆ z ? Nun ja, ein Punkt P bei x und y in dem neuen Koordinatensystem (eigentlich x� und y� , aber wir wollen die Striche weglassen) war vorher bei x − �y und y + � x, wie Sie aus Abbildung 20.2 ersehen können. Da die Amplitude dafür, dass das Elektron bei P ist, nicht durch eine Drehung des Koordinatensystems geändert wird, können wir schreiben ψ� (x, y, z) = ψ(x − �y, y + � x, z) = ψ(x, y, z) − �y
∂ψ ∂ψ + �x , ∂x ∂y
(wobei wir daran denken müssen, dass � ein kleiner Winkel ist). Dies bedeutet ∂ ∂ Lˆ z = x −y . i ∂y ∂x
(20.69)
Das ist unsere Antwort. Doch beachten Sie, sie ist gleichbedeutend mit Lˆ z = x Pˆy − y Pˆ x .
(20.70)
Lˆ z = x pˆ y − y pˆ x .
(20.71)
L = r × p.
(20.72)
Wenn wir zu unseren quantenmechanischen Operatoren zurückgehen, können wir schreiben
Diese Formel ist leicht zu behalten, weil sie wie die wohlbekannte Formel der klassischen Mechanik aussieht; es ist die z-Komponente von
440
20 Operatoren
Bei der Arbeit mit den quantenmechanischen Operatoren fällt auf, dass viele klassische Gleichungen in eine quantenmechanische Form überführt werden. Es wäre allerdings besser, wenn es einige gäbe, für die das nicht zutrifft, denn wenn alles übereinstimmte, würde die Quantenmechanik physikalisch nichts Neues bringen. Welche Gleichungen lassen sich denn nicht übertragen? Es folgt eine Gleichung, die verschieden ist. In der klassischen Physik ist xp x − p x x = 0 .
Wie lautet die entsprechende Gleichung in der Quantenmechanik? xˆ pˆ x − pˆ x xˆ = ?
Rechnen wir es in der x-Darstellung aus. Damit wir genau wissen, was wir tun, setzen wir eine Wellenfunktion ψ(x) ein. Wir erhalten dann x Pˆ x ψ(x) − Pˆ x x ψ(x)
oder
∂ ∂ xψ(x) . ψ(x) − i ∂x i ∂x Bedenken Sie jetzt, dass die Ableitungen auf alles wirken, was rechts von ihnen steht. Wir erhalten ∂ψ ∂ψ x − ψ(x) − x = − ψ(x) . (20.73) i ∂x i i ∂x i Das Ergebnis ist nicht null. Die ganze Operation ist einfach äquivalent mit einer Multiplikation mit −/i: (20.74) xˆ pˆ x − pˆ x xˆ = − . i Wenn das plancksche Wirkungsquantum null wäre, dann wären die klassischen und quantenmechanischen Ergebnisse gleich, und die Quantenmechanik würde nichts Neues bringen! Wenn man für zwei beliebige Operatoren Aˆ und Bˆ die zusammengesetzte Operation x
Aˆ Bˆ − Bˆ Aˆ
bildet und diese dann nicht null ergibt, sagen wir, dass die „Operatoren nicht vertauschbar“ sind, und eine Gleichung wie (20.74) heißt eine „Vertauschungsregel“. Sie können sehen, dass für p x und y die Vertauschungsregel pˆ x yˆ − yˆ pˆ x = 0 .
gilt. Es gibt noch eine sehr wichtige Vertauschungsregel, die mit dem Drehimpuls zu tun hat. Sie lautet (20.75) Lˆ x Lˆ y − Lˆ y Lˆ x = iLˆ z . Sie können sich im Umgang mit xˆ- und p-Operatoren ˆ üben, indem Sie das beweisen.
Es ist interessant, dass nichtvertauschbare Operatoren auch in der klassischen Physik auftreten können. Wir haben dies schon gesehen, als wir uns mit Drehungen im Raum befasst haben. Wenn Sie ein Objekt, zum Beispiel ein Buch, um 90◦ um x und dann um 90◦ um y drehen, erhalten Sie etwas anderes, als wenn Sie es zuerst um 90◦ um y und dann um 90◦ um x drehen. Es ist in der Tat nur diese Eigenschaft des Raumes, die für die Vertauschungsregel (20.75) verantwortlich ist.
20.7 Die zeitliche Änderung der Mittelwerte
20.7
441
Die zeitliche Änderung der Mittelwerte
Zum Schluss wollen wir der Frage nachgehen, wie sich Mittelwerte mit der Zeit ändern. Beˆ der die Zeit nicht explizit enthält. Wir meinen einen Operator trachten wir einen Operator A, wie xˆ oder p. ˆ (Wir schließen zum Beispiel den Operator eines äußeren Potentials aus, das sich mit der Zeit ändert.) Nun nehmen wir an, wir berechnen �A�mittel für einen Zustand | ψ �: �A�mittel = � ψ | Aˆ | ψ � .
(20.76)
Wie hängt �A�mittel von der Zeit ab? Warum sollte es überhaupt zeitabhängig sein? Ein Grund dafür könnte sein, dass der Operator explizit von der Zeit abhängt – zum Beispiel, wenn er ein zeitlich veränderliches Potential wie V(x, t) enthält. Aber selbst wenn der Operator nicht explizit von t abhängt, wie zum Beispiel der Operator Aˆ = xˆ, kann der entsprechende Mittelwert dennoch von der Zeit abhängen. Sicherlich kann sich der mittlere Ort eines Teilchens ändern. Wie ergibt sich aber aus (20.76) eine solche Änderung, wenn Aˆ nicht zeitabhängig ist? Nun ja, der Zustand | ψ � könnte sich mit der Zeit ändern. Bei nichtstationären Zuständen haben wir oft eine Zeitabhängigkeit explizit angeben, indem wir den Zustand als | ψ(t) � geschrieben haben. Wir möchten zeigen, dass die Änderungsgeschwindigkeit von �A�mittel durch einen neuen Operator gegeben ist, den wir Aˆ˙ nennen wollen. Bedenken Sie, dass Aˆ ein Operator ist. Wenn man also einen Punkt über das A setzt, bedeutet das nicht, dass man die Ableitung nach der Zeit ˆ˙ der definiert ist durch bilden soll, sondern es ist nur eine Notation für einen neuen Operator A, d �A�mittel = � ψ | Aˆ˙ | ψ � . dt
(20.77)
Unsere Aufgabe besteht darin, den Operator Aˆ˙ zu finden. Zunächst einmal wissen wir, dass die Änderungsrate eines Zustands durch den HamiltonOperator gegeben ist. Es gilt i
d | ψ(t) � = Hˆ | ψ(t) � . dt
(20.78)
Dies ist nur die abstrakte Notation unserer ursprünglichen Definition des Hamilton-Operators: i
dCi = Hi j C j . dt j
(20.79)
Wenn wir das komplex Konjugierte von (20.78) bilden, ist es äquivalent mit −i
d � ψ(t) | = � ψ(t) | Hˆ . dt
(20.80)
Sehen wir uns als Nächstes an, was passiert, wenn wir in (20.76) die Ableitung nach t bilden. Da jedes ψ von t abhängt, erhalten wir d d d �A�mittel = � ψ | Aˆ | ψ � + � ψ | Aˆ |ψ� . dt dt dt
(20.81)
442
20 Operatoren
Wenn wir die Gleichungen (20.78) und (20.80) verwenden, um die Ableitungen zu ersetzen, erhalten wir schließlich d i �A�mittel = {� ψ | Hˆ Aˆ | ψ � − � ψ | Aˆ Hˆ | ψ �} . dt Diese Gleichung ist dieselbe wie d i �A�mittel = � ψ | Hˆ Aˆ − Aˆ Hˆ | ψ � . dt
Ein Vergleich dieser Gleichung mit (20.77) zeigt i ˆ . Aˆ˙ = (Hˆ Aˆ − Aˆ H)
(20.82)
ˆ Das ist unser interessantes Ergebnis, und es gilt für jeden Operator A. Wenn übrigens der Operator Aˆ explizit zeitabhängig sein sollte, würden wir erhalten i ˆ ˆ ˆ ˆ ∂ Aˆ Aˆ˙ = . H A − AH + ∂t
(20.83)
Testen wir Gleichung (20.82) an einem Beispiel, um zu sehen, ob sie wirklich sinnvoll ist. Welcher Operator entspricht zum Beispiel xˆ˙? Wir erhalten i ˆ xˆ˙ = H xˆ − xˆ Hˆ .
(20.84)
Was bedeutet diese Gleichung? Eine Methode, es herauszufinden, besteht darin, dass man es durchrechnet. In in der Ortsdarstellung unter Verwendung des algebraischen Operators für H dieser Darstellung ist der Kommutator 2 2 2 2 x − xH = − d + V(x) x − x − d + V(x) . H 2m dx2 2m dx2
Wenn Sie dies auf eine Wellenfunktion ψ(x) anwenden und, immer wenn Sie können, die Ableitungen ausrechnen, dann werden Sie nach ein wenig Arbeit −
2 dψ m dx
erhalten. Dies ist aber genau dasselbe wie −i
ˆ Px ψ , m
sodass wir also finden Hˆ xˆ − xˆ Hˆ = −i pˆ x m
(20.85)
20.7 Die zeitliche Änderung der Mittelwerte
443
oder pˆ x . xˆ˙ = m
(20.86)
Ein hübsches Ergebnis. Es bedeutet, dass, wenn sich der Mittelwert von x mit der Zeit ändert, die Geschwindigkeit des Schwerpunkts gleich dem durch m dividierten mittleren Impuls ist. Genau wie in der klassischen Mechanik. Nehmen wir ein anderes Beispiel. Was ist die Änderungsgeschwindigkeit des mittleren Impulses eines Zustands? Dasselbe Spiel. Der Operator ist pˆ˙ =
i ˆ H pˆ − pˆ Hˆ .
(20.87)
Wieder können Sie es in der x-Darstellung ausrechnen. Bedenken Sie, dass pˆ zu d/dx wird. Und bilden müssen – aber das bedeutet, dass Sie die Ableitung der potentiellen Energie V (im H) nur im zweiten Term. Es ergibt sich, dass dies der einzige Term ist, der sich nicht wegkürzt, und Sie erhalten
oder
pˆ − pˆ H = i dV H dx dV . pˆ˙ = − dx
(20.88)
Wieder das klassische Ergebnis. Die rechte Seite ist die Kraft, d. h., wir haben das newtonsche Gesetz hergeleitet! Doch bedenken Sie – dies sind die Gesetze für die Operatoren, die die mittleren Größen ergeben. Sie beschreiben nicht, was im Innern eines Atoms im Einzelnen vorgeht. Der wesentliche Unterschied zwischen der Quantenmechanik und der klassischen Mechanik besteht darin, dass pˆ xˆ nicht gleich xˆ pˆ ist. Sie unterscheiden sich ein wenig – um den kleinen Betrag i. Doch die ganzen wundersamen Komplikationen, wie Interferenz, Wellen usw., resultieren aus der unscheinbaren Tatsache, dass xˆ pˆ − pˆ xˆ nicht ganz null ist.
Auch die Geschichte dieser Entdeckung ist interessant. Innerhalb von wenigen Monaten des Jahres 1926 fanden Heisenberg und Schrödinger unabhängig voneinander richtige Gesetze zur Beschreibung des Atoms. Schrödinger führte seine Wellenfunktion ψ(x) ein und fand seine Gleichung. Heisenberg fand heraus, dass die Natur in atomaren Dimensionen durch klassische Gleichungen beschrieben werden kann, sofern xp − px gleich i ist, was er dadurch erreichen konnte, dass er sie durch spezielle Matrizen definierte. In unserer Terminologie verwendete er die Energiedarstellung mit ihren Matrizen. Sowohl Heisenbergs Matrizenalgebra als auch Schrödingers Differentialgleichung konnten das Wasserstoffatom erklären. Wenige Monate später konnte Schrödinger zeigen, dass die beiden Theorien äquivalent sind – wie wir hier gesehen haben. Doch die beiden verschiedenen mathematischen Formulierungen der Quantenmechanik wurden unabhängig voneinander entdeckt.
21 Die Schrödinger-Gleichung in einem klassischen Kontext: Ein Seminar zur Supraleitfähigkeit 21.1
Die Schrödinger-Gleichung im Magnetfeld
Diese Vorlesung ist nur zu Ihrer Unterhaltung gedacht. Ich möchte die Vorlesung gern einmal in einem etwas anderen Stil halten – nur um zu sehen, was dabei herauskommt. Diese Vorlesung ist nicht Bestandteil des Kurses – in dem Sinne, dass sie nicht beabsichtigt, Ihnen etwas Neues beizubringen. Sondern ich möchte mir lieber vorstellen, dass ich ein Seminar oder einen Forschungsbericht vor einer fortgeschrittenen Hörerschaft halte, vor Physikern, die mit der Quantenmechanik vertraut sind. Der Hauptunterschied zwischen einem Seminar und einer regulären Vorlesung besteht darin, dass der Vortragende in einem Seminar nicht alle Schritte vorführt. Er sagt: „Wenn Sie das und das tun, kommt dies heraus,“ anstatt alle Einzelheiten zu zeigen. Daher werde ich in dieser Vorlesung zwar die Ideen nacheinander beschreiben, aber jeweils nur die Ergebnisse der Berechnungen angeben. Es ist nicht zu erwarten, dass Sie alles auf Anhieb verstehen. Vielmehr sollten Sie mir einfach glauben, dass die Ergebnisse so herauskommen, wenn Sie alle Schritte durchgehen. Ganz abgesehen davon ist dies ein Thema, über das ich sprechen möchte. Es ist neu und modern und wäre durchaus als Vortrag in einem Forschungsseminar geeignet. Mein Thema ist die Schrödinger-Gleichung in einem klassischen Rahmen – das Phänomen der Supraleitfähigkeit. Gewöhnlich bezieht sich die Wellenfunktion in der Schrödinger-Gleichung nur auf ein oder zwei Teilchen. Die Wellenfunktion selbst hat keine klassische Bedeutung – im Gegensatz etwa zum elektrischen Feld oder zum Vektorpotential. Die Wellenfunktion für ein einzelnes Teilchen ist zwar ein „Feld“ – in dem Sinne, dass sie eine Funktion des Ortes ist –, aber sie hat im Allgemeinen keine klassische Bedeutung. Nichtsdestoweniger gibt es einige Situationen, in denen eine quantenmechanische Wellenfunktion durchaus eine klassische Bedeutung hat, und über diese Situation möchte ich jetzt sprechen. Das sonderbare quantenmechanische Verhalten der Materie im atomaren Maßstab macht sich gewöhnlich in einem makroskopischen Maßstab nicht bemerkbar, abgesehen von der Standardmethode, nach der es in die newtonschen Gesetze einmündet – in die Gesetze der so genannten klassischen Mechanik. Aber es gibt gewisse Situationen, in denen die Besonderheiten der Quantenmechanik auf spezielle Art in einem makroskopischen Maßstab in Erscheinung treten. Bei tiefen Temperaturen, wenn die Energie eines Systems auf sehr niedrige Werte reduziert worden ist, enthält das System statt einer großen Anzahl von Zuständen nur sehr wenige Zustände nahe beim Grundzustand. Unter diesen Umständen kann sich der quantenmechanische Charakter des Grundzustands in einem makroskopischen Maßstab zeigen. Es ist das Ziel dieser
446
21 Die Schrödinger-Gleichung in einem klassischen Kontext b Γ
a
Abb. 21.1: Die Amplitude, auf dem Weg Γ von a nach b zu laub fen, ist proportional zu exp (iq/) a A · ds .
Vorlesung, eine Verbindung zwischen der Quantenmechanik und makroskopischen Effekten aufzuzeigen. Dies ist etwas anderes als die übliche Aussage, dass die Quantenmechanik im Mittel die newtonsche Mechanik reproduziert. Vielmehr haben wir es hier mit einer speziellen Situation zu tun, in der die Quantenmechanik ihre eigenen charakteristischen Effekte in einem großen oder „makroskopischen“ Maßstab offenbart. Ich will zunächst an einige Eigenschaften der Schrödinger-Gleichung erinnern.1 Ich möchte das Verhalten eines Teilchens in einem Magnetfeld unter Verwendung der Schrödinger-Gleichung beschreiben, weil die Phänomene der Supraleitfähigkeit mit magnetischen Feldern zusammenhängen. Ein äußeres Magnetfeld wird durch ein Vektorpotential beschrieben, und das Problem besteht darin herauszufinden, wie die Gesetze der Quantenmechanik in Anwesenheit eines Vektorpotentials lauten. Das Prinzip, welches das Verhalten der Quantenmechanik in Anwesenheit eines Vektorpotentials beschreibt, ist sehr einfach. Die Amplitude dafür, dass sich ein Teilchen auf einem bestimmten Pfad von einem Ort zum anderen bewegt, wenn ein Feld vorhanden ist, ist gleich der Amplitude dafür, dass es auf diesem Pfad entlangläuft, wenn kein Feld da ist, multipliziert mit dem Exponential des Linienintegrals des Vektorpotentials und der elektrischen Ladung dividiert durch das plancksche Wirkungsquantum2 (siehe Abbildung 21.1): iq b A·ds . (21.1) � b | a �mit A = � b | a �A=0 · exp a Das ist eine grundlegende Feststellung der Quantenmechanik.
Nun lautet ohne das Vektorpotential die Schrödinger-Gleichung eines geladenen Teilchens (nichtrelativistisch, kein Spin) ∂ψ ψ = 1 ∇ · ∇ ψ + qφψ , =H (21.2) − i ∂t 2m i i
wobei φ das elektrostatische Potential und somit qφ die potentielle Energie ist.3 Gleichung (21.1) ist äquivalent mit der Feststellung, dass in einem Magnetfeld jeder Gradient im HamiltonOperator durch den Gradienten minus q A ersetzt werden muss. Damit wird Gleichung (21.2) zu ∂ψ ψ = 1 ∇ − q A · ∇ − q A ψ + qφψ , − =H (21.3) i ∂t 2m i i
Dies ist die Schrödinger-Gleichung für ein Teilchen mit der Ladung q, das sich in einem elektromagnetischen Feld A, φ bewegt (nichtrelativistisch, kein Spin). 1 2 3
Ich erinnere Sie nicht wirklich daran, weil ich Ihnen vorher noch keine von diesen Gleichungen gezeigt habe; aber bedenken Sie die Zielstellung dieses Seminars. Band III, Abschnitt 15.5. Nicht zu verwechseln mit unserer früheren Verwendung von φ als Bezeichnung für einen Zustand!
21.1 Die Schrödinger-Gleichung im Magnetfeld
447
Um zu zeigen, dass diese Gleichung richtig ist, möchte ich sie durch ein einfaches Beispiel veranschaulichen, in dem wir anstelle einer kontinuierlichen Verteilung eine Reihe von Atomen auf der x-Achse mit dem Abstand b betrachten. Es gibt eine Amplitude −K dafür, dass ein Elektron von einem Atom zum anderen springt, wenn kein Feld vorhanden ist.4 Wenn ein Vektorpotential in x-Richtung A x (x, t) vorhanden ist, wird sich nun gemäß (21.1) die Amplitude für den Sprung gegenüber dem, was sie vorher war, um den Faktor exp[(iq/)A xb] ändern, wobei der Exponent iq/ mal dem Vektorpotential integriert von einem Atom zum nächsten ist. Der Einfachheit halber schreiben wir (q/)A x ≡ f (x), da A x im Allgemeinen von x abhängt. Wenn C(x) ≡ Cn die Amplitude dafür ist, das Elektron beim Atom „n“ zu finden, welches sich bei x befindet, dann ist die Änderungsrate dieser Amplitude durch die folgende Gleichung gegeben: −
∂ C(x) = E0C(x) − Ke−ib f (x+b/2) C(x + b) i ∂t − Ke+ib f (x−b/2) C(x − b)
(21.4)
Sie besteht aus drei Termen. Zuerst ist da die Energie E0 , wenn sich das Elektron bei x befindet. Wie gewöhnlich ergibt das den Term E0C(x). Als Nächstes ist da der Term −KC(x + b), der die Amplitude dafür ist, dass das Elektron einen Schritt rückwärts vom Atom „n + 1“, das sich bei x + b befindet, gesprungen ist. Wenn es das jedoch in einem Vektorpotential macht, muss die Phase der Amplitude gemäß (21.1) verschoben werden. Wenn sich A x über einen Atomabstand nicht merklich ändert, kann das Integral einfach als der Wert von A x in der Mitte zwischen zwei Atomen mal dem Abstand b geschrieben werden. Daher ist (iq/) mal dem Integral einfach ib f (x + b/2). Da das Elektron rückwärts springt, habe ich diese Phasenverschiebung mit einem Minuszeichen versehen. Das ergibt den zweiten Term. Analog dazu gibt es eine gewisse Amplitude dafür, dass das Elektron von der anderen Seite gesprungen ist, aber diesmal benötigen wir das Vektorpotential in einem Abstand (b/2) auf der anderen Seite von x mal dem Abstand b. Das ergibt den dritten Term. Die Summe der Terme ergibt die Amplitude, dass das Elektron in einem Vektorpotential am Ort x ist. Jetzt wissen wir, dass Gleichung (21.4), wenn die Funktion C(x) hinreichend glatt ist (wir betrachten den Grenzfall großer Wellenlängen) und wenn wir die Atome näher zusammenrücken lassen, dem Verhalten eines Elektrons im freien Raum näherkommen wird. Daher besteht der nächste Schritt darin, die rechte Seite von (21.4) nach Potenzen von b zu entwickeln, wobei wir b als sehr klein annehmen. Wenn b zum Beispiel null ist, dann ist die rechte Seite einfach (E0 − 2K)C(x), sodass in der nullten Näherung die Energie E0 − 2K ist. Als Nächstes kommen die Terme linear in b. Weil aber die beiden Exponentialausdrücke entgegengesetzte Vorzeichen haben, bleiben nur gerade Potenzen von b übrig. Wenn Sie daher eine Taylor-Entwicklung von C(x), f (x) und den Exponentialfunktionen machen und dann die Terme mit b2 sammeln, erhalten Sie −
∂C(x) = E0 C(x) − 2KC(x) i ∂t − Kb2 C �� (x) − 2i f (x)C � (x) − i f � (x)C(x) − f 2 (x)C(x) .
(Die Striche bedeuten Ableitungen nach x.) 4
K ist dieselbe Größe, die wir beim linearen Gitter ohne Vektorpotential A hatten (siehe Kapitel 13).
(21.5)
448
21 Die Schrödinger-Gleichung in einem klassischen Kontext
Das sieht alles recht kompliziert aus. Aber mathematisch ist es genau dasselbe wie −
∂ ∂ ∂C(x) = (E0 − 2K) C(x) − Kb2 − i f (x) − i f (x) C(x) . i ∂t ∂x ∂x
(21.6)
Die zweite Klammer auf C(x) angewendet, ergibt C � (x) minus i f (x) C(x). Die erste Klammer angewendet auf diese beiden Terme, ergibt den C �� -Term sowie Terme mit der ersten Ableitung von f (x) und der ersten Ableitung von C(x). Nun bedenken Sie, dass die Lösungen bei verschwindendem Magnetfeld5 ein Teilchen darstellen, dessen effektive Masse meff gegeben ist durch Kb2 =
2 2meff
Wenn Sie dann E0 = −2K setzen und wieder f (x) = (q/)A x einsetzen, können Sie leicht nachprüfen, dass (21.6) dasselbe ist wie der erste Teil von (21.3). (Der Ursprung des Terms der potentiellen Energie ist wohlbekannt, daher habe ich mir nicht die Mühe gemacht, ihn in die Diskussion miteinzubeziehen.) Die in (21.1) formulierte Behauptung, dass das Vektorpotential alle Amplituden um den Exponentialfaktor ändert, ist also gleichbedeutend mit der Regel, dass der Impulsoperator (/i)∇ ersetzt wird durch ∇ − q A, i wie Sie es in der Schrödinger-Gleichung (21.3) sehen.
21.2
Die Kontinuitätsgleichung für Wahrscheinlichkeiten
Ich komme jetzt auf einen zweiten Aspekt zu sprechen. Ein wichtiger Zusatz zur SchrödingerGleichung für ein einzelnes Teilchen ist die Aussage, dass die Wahrscheinlichkeit, das Teilchen an einem Ort zu finden, durch das Absolutquadrat der Wellenfunktion gegeben ist. Charakteristisch für die Quantenmechanik ist außerdem, dass die Wahrscheinlichkeit in einem lokalen Sinne erhalten bleibt. Wenn die Wahrscheinlichkeit, das Elektron an der einen Stelle zu finden, abnimmt, während die Wahrscheinlichkeit, das Elektron woanders zu finden, größer wird (wobei die Gesamtwahrscheinlichkeit konstant bleibt), muss zwischen den beiden Orten irgendetwas vorgehen. Mit anderen Worten, die Wahrscheinlichkeit besitzt eine Kontinuität in dem Sinne, dass, wenn sie an einer Stelle abnimmt und an einer anderen zunimmt, es dazwischen eine Art Strömung geben muss. Wenn Sie zum Beispiel eine Wand in den Weg stellen, wird sie einen Einfluss ausüben, und die Wahrscheinlichkeiten werden nicht mehr dieselben sein. Daher ist die globale Erhaltung der Wahrscheinlichkeit nicht die vollständige Aussage des Erhaltungssatzes, ebenso wie die globale Erhaltung der Energie nicht so tiefgreifend und wichtig ist wie die lokale Erhaltung der Energie6. Wenn Energie an einem Ort verschwindet, muss es einen entsprechenden Energiefluss geben. Analog dazu möchten wir einen „Wahrscheinlichkeitsstrom“ 5 6
Siehe Abschnitt 13.3. Siehe Band III, Abschnitt 27.1.
21.2 Die Kontinuitätsgleichung für Wahrscheinlichkeiten
449
finden, der die Eigenschaft hat, dass eine irgendwo auftretende Änderung der Wahrscheinlichkeitsdichte als Zufluss oder Abfluss infolge eines Stromes betrachtet werden kann. Dieser Strom ist ein Vektor, dessen x-Komponente die Gesamtwahrscheinlichkeit pro Sekunde und pro Einheitsfläche dafür ist, dass ein Teilchen in x-Richtung durch eine Ebene parallel zur yz-Ebene läuft. Ein Fluss in +x-Richtung wird dabei als positiver Fluss definiert und ein Fluss in die entgegengesetzte Richtung als negativer Fluss. Gibt es einen solchen Strom? Nun ja, Sie wissen, dass die Wahrscheinlichkeitsdichte P(r, t) folgendermaßen durch die Wellenfunktion ausgedrückt werden kann: P( r, t) = ψ∗ ( r, t) ψ( r, t) .
(21.7)
Die Frage ist also: Gibt es einen Strom J, der die Gleichung ∂P = −∇ · J ∂t
(21.8)
erfüllt? Wenn wir die zeitliche Ableitung von (21.7) bilden, erhalten wir zwei Terme: ∂P ∂ψ ∂ψ∗ = ψ∗ +ψ . ∂t ∂t ∂t
(21.9)
Nun verwenden wir für ∂ψ/∂t den durch die Schrödinger-Gleichung (21.3) gegebenen Ausdruck und für ∂ψ∗ /∂t das komplex Konjugierte (d. h., wir kehren bei jedem i das Vorzeichen um). Wir erhalten ∂P i 1 = − ψ∗ ∇−qA · ∇ − q A ψ + qφψ∗ ψ ∂t 2m i i 1 − ∇ − q A · − ∇ − q A ψ∗ − qφψψ∗ . −ψ 2m i i
(21.10)
Die Potentialterme und weitere Terme heben sich auf. Und es stellt sich heraus, dass das, was übrigbleibt, tatsächlich als vollständige Divergenz geschrieben werden kann. Die Gleichung (21.8) ist äquivalent mit 1 ∂P 1 = −∇ · ψ∗ ∇−qA ψ+ ψ − ∇ − q A ψ∗ . ∂t 2m i 2m i
(21.11)
Diese Gleichung ist gar nicht so kompliziert, wie sie scheint. Auf der rechten Seite steht eine symmetrische Kombination von ψ∗ mal einer gewissen Operation auf ψ plus ψ mal der komplex konjugierten Operation auf ψ∗ . Es ist eine Größe plus ihr eigenes komplex Konjugiertes, sodass der ganze Ausdruck reell ist – wie das auch sein sollte. Die Operation kann man sich folgendermaßen merken: Sie ist einfach der Impulsoperator Pˆ minus q A. Wir können den Strom in (21.8) auch schreiben als J=
Pˆ − q A ∗ 1 ∗ Pˆ − q A ψ ψ ψ+ψ ψ∗ . 2 m m
Es gibt also einen Strom J, der die Gleichung (21.8) erfüllt.
(21.12)
450
21 Die Schrödinger-Gleichung in einem klassischen Kontext
Gleichung (21.11) zeigt, dass die Wahrscheinlichkeit lokal erhalten bleibt. Wenn ein Teilchen aus einem Gebiet verschwindet, kann es nicht einfach in einem anderen erscheinen, ohne dass dazwischen etwas vorgeht. Stellen Sie sich vor, dass das erste Gebiet von einer geschlossenen Fläche umgeben ist, die weit genug entfernt ist, sodass die Wahrscheinlichkeit, das Elektron auf dieser Fläche zu finden, null ist. Die Gesamtwahrscheinlichkeit dafür, das Elektron irgendwo im eingeschlossenen Volumen zu finden, ist gleich dem Volumenintegral von P. Aber nach dem gaußschen Satz ist das Volumenintegral der Divergenz von J gleich dem Oberflächenintegral von J. Gleichung (21.12) besagt somit, dass J null sein muss, wenn ψ auf der Oberfläche null ist, sodass sich die Gesamtwahrscheinlichkeit, das Teilchen im eingeschlossenen Volumen zu finden, nicht ändern kann. Nur wenn sich ein Teil der Wahrscheinlichkeit der Grenzfläche nähert, kann etwas davon durchsickern. Wir können sagen, dass die Wahrscheinlichkeit nur hinauskommt, indem sie sich durch die Oberfläche bewegt – und das bedeutet lokale Erhaltung.
21.3
Zwei Arten von Impuls
Die Gleichung für den Wahrscheinlichkeitsstrom ist recht interessant und verursacht mitunter einigen Ärger. Sie könnten vermuten, dass der Strom so etwas wie die Teilchendichte mal der Geschwindigkeit ist. Die Wahrscheinlichkeitsdichte sollte so etwas sein wie ψψ∗ , was in Ordnung ist. Und jeder Term in (21.12) sieht aus wie die typische Form für den Mittelwert des Operators Pˆ − q A . m
(21.13)
Daher sollten wir ihn vielleicht als Strömungsgeschwindigkeit betrachten. Es scheint so, dass wir zwei Vorschläge für die Beziehung zwischen Geschwindigkeit und Impuls unterbreiten könˆ nen, denn es scheint gleichermaßen vernünftig, dass der Impuls dividiert durch die Masse, P/m eine Geschwindigkeit ist. Die beiden Möglichkeiten unterscheiden sich durch das Vektorpotential. Es trifft sich gut, dass diese beiden Möglichkeiten auch in der klassischen Physik entdeckt wurden, als man herausfand, dass der Impuls auf zwei Arten definiert werden kann.7 Einer davon heißt „kinematischer Impuls“, aber im Interesse der Klarheit werde ich ihn in dieser Vorlesung „mv-Impuls“ nennen. Dies ist der Impuls, den man durch Multiplikation der Masse mit der Geschwindigkeit erhält. Der andere ist ein eher mathematischer, abstrakter Impuls, der manchmal „dynamischer Impuls“ genannt wird und den ich „p-Impuls“ nennen werde. Die beiden Möglichkeiten sind mv-Impuls = m u , p-Impuls = m u + q A.
(21.14) (21.15)
Es stellt sich heraus, dass es in der Quantenmechanik mit Magnetfeld der p-Impuls ist, der ˆ verknüpft ist. Daraus folgt, dass (21.13) der Operator einer mit dem Gradientenoperator P Geschwindigkeit ist. 7
Siehe zum Beispiel: J. D. Jackson, Classical Electrodynamics, John Wiley and Sons, Inc. New York (1962), S. 408.
21.3 Zwei Arten von Impuls
451
B I
E q
I
B
Abb. 21.2: Das elektrische Feld außerhalb einer Spule mit zunehmendem Strom.
Ich möchte kurz abschweifen, um Ihnen zu zeigen, worum es hier geht – warum es so etwas wie (21.15) in der Quantenmechanik geben muss. Die Wellenfunktion ändert sich mit der Zeit gemäß der Schrödinger-Gleichung (21.3). Wenn ich das Vektorpotential plötzlich ändern würde, würde sich die Wellenfunktion im ersten Moment nicht ändern; nur ihre Änderungsgeschwindigkeit ändert sich. Nun überlegen Sie, was unter folgenden Umständen passieren würde. Angenommen, ich betrachte eine lange Spule, in der ich einen magnetischen Fluss (B-Feld) erzeugen kann (siehe Abbildung 21.2). Und es ist da ein geladenes Teilchen, das in der Nähe sitzt. Angenommen, dieser Fluss wächst fast instantan von null auf irgendeinen Wert an. Ich beginne ohne Vektorpotential, und dann stelle ich plötzlich ein Vektorpotential an. Das bedeutet, dass ich plötzlich ein Vektorpotential A in Umfangsrichtung erzeuge. Sie werden sich erinnern, dass das Linienintegral von A um eine Schleife dasselbe ist wie der Fluss von B durch die Schleife.8 Was passiert nun, wenn ich plötzlich ein Vektorpotential anstelle? Nach der quantenmechanischen Gleichung verursacht die plötzliche Änderung von A keine plötzliche Änderung von ψ; die Wellenfunktion ist immer noch dieselbe. Daher bleibt auch der Gradient unverändert. Aber bedenken Sie, was elektromagnetisch geschieht, wenn ich plötzlich einen Fluss anstelle. Während der kurzen Zeit, in der der Fluss anwächst, wird ein elektrisches Feld erzeugt, dessen Linienintegral die zeitliche Änderungsrate des Flusses ist: E=−
∂A ∂t
(21.16)
Das elektrische Feld ist enorm stark, wenn sich der Fluss schnell ändert, und es wirkt eine Kraft auf das Teilchen. Die Kraft ist gleich der Ladung mal dem elektrischen Feld, und daher erhält das Teilchen, während der Fluss aufgebaut wird, einen Gesamtimpuls (das heißt, eine Änderung 8
Band III, Kapitel 14, Abschnitt 14.1.
452
21 Die Schrödinger-Gleichung in einem klassischen Kontext
in mu), der gleich −q A ist. Wenn Sie also in der Nähe einer Ladung plötzlich ein Vektorpotential einschalten, nimmt diese Ladung sofort einen mv-Impuls gleich −q A auf. Aber es gibt etwas, was sich nicht sofort ändert, und das ist die Differenz zwischen mu und −q A. Und daher ist die Summe p = mu + q A etwas, was sich nicht sofort ändert, wenn Sie eine plötzliche Änderung des Vektorpotentials vornehmen. Es ist diese Größe p, die wir den p-Impuls genannt haben, und sie ist in der klassischen Mechanik für die Dynamik von Bedeutung. Sie hat aber auch in der Quantenmechanik eine direkte Bedeutung. Sie hängt vom Charakter der Wellenfunktion ab, und es ist diejenige, die mit dem Operator ˆ = ∇ P i zu identifizieren ist.
21.4
Die Bedeutung der Wellenfunktion
Als Schrödinger seine Gleichung aufstellte, fand er als eine Folge seiner Gleichung den Erhaltungssatz von (21.8). Aber er glaubte fälschlicherweise, dass P die elektrische Ladungsdichte des Elektrons und J die elektrische Stromdichte wäre. Er dachte daher, dass die Elektronen durch diese Ladungen und Ströme mit dem elektromagnetischen Feld wechselwirken würden. Als er seine Gleichung für das Wasserstoffatom löste und ψ berechnete, berechnete er seiner Ansicht nach keine Wahrscheinlichkeit (das Konzept der Amplitude gab es damals noch nicht). Seine Interpretation war eine ganz andere. Der Atomkern war demnach stationär, aber es bewegten sich Ströme um ihn herum; die Ladungen P und die Ströme J müssten elektromagnetische Felder erzeugen und das Objekt müsste Licht ausstrahlen. Bei der Lösung einer Reihe von Problemen stellte er schon bald fest, dass das nicht ganz stimmen konnte. Zu diesem Zeitpunkt lieferte Born einen wesentlichen Beitrag zu unseren Vorstellungen über die Quantenmechanik. Born war es, der das ψ der Schrödinger-Gleichung richtig interpretierte (soweit wir das heute wissen) als eine Wahrscheinlichkeitsamplitude – jenes sehr schwierige Konzept, wonach das Quadrat der Amplitude nicht die Ladungsdichte ist, sondern nur die Wahrscheinlichkeit pro Volumeneinheit, ein Elektron dort zu finden, und dass, wenn Sie das Elektron irgendwo finden, die gesamte Ladung dort konzentriert ist. Dieser ganze Gedankengang stammt von Born. Die Wellenfunktion ψ(r) für ein Elektron in einem Atom beschreibt somit also nicht ein verschmiertes Elektron mit einer verteilten Ladungsdichte. Das Elektron ist entweder hier oder dort oder woanders, aber wo es auch sei, es ist eine Punktladung. Stellen Sie sich aber eine Situation vor, in der es eine enorme Zahl von Teilchen in genau demselben Zustand gibt, von denen eine große Zahl genau dieselbe Wellenfunktion hat. Was dann? Eins von ihnen ist hier und eins von ihnen ist dort und die Wahrscheinlichkeit, irgendeins von ihnen an einem gegebenen Ort zu finden, ist proportional zu ψψ∗ . Aber da es so viele Teilchen gibt, werde ich, wenn ich in irgendein Raumelement dx dy dz schaue, im Allgemeinen eine Anzahl finden, die nahe bei ψψ∗ dx dy dz liegt. Daher kann in einer Situation, in der ψ die Wellenfunktion für jedes einzelne aus einer enorm großen Menge von Teilchen ist, die alle in demselben Zustand sind, ψψ∗ als Teilchendichte interpretiert werden. Wenn dann jedes Teilchen dieselbe Ladung q trägt, können wir in der Tat ψ∗ ψ als Dichte der elektrischen Ladung interpretieren. Normalerweise ist ψψ∗ in der Dimension einer Wahrscheinlichkeitsdichte gegeben. Um die Dimension einer Ladungsdichte zu erhalten, muss ψψ∗ mit q multipliziert werden. Für unsere Zwecke können
21.5 Supraleitfähigkeit
453
wir diesen konstanten Faktor in ψ hineinziehen und ψψ∗ selbst als elektrische Ladungsdichte verwenden. Mit dieser Vereinbarung wird J (der Wahrscheinlichkeitsstrom, den ich berechnet habe) direkt zur elektrischen Stromdichte. Daher ist in einer Situation, in der wir sehr viele Teilchen in genau demselben Zustand vorfinden, eine neue physikalische Interpretation der Wellenfunktionen möglich. Die Ladungsdichte und die elektrische Stromdichte können direkt aus der Wellenfunktion berechnet werden, und die Wellenfunktion erhält eine physikalische Bedeutung, die sich bis in klassische makroskopische Verhältnisse hinein erstreckt. Etwas Ähnliches kann auch mit neutralen Teilchen passieren. Wenn wir die Wellenfunktion eines einzelnen Photons betrachten, dann ist sie die Amplitude dafür, das Photon an einem bestimmten Ort zu finden. Obwohl wir sie an keiner Stelle aufgeschrieben haben, gibt es doch analog zur Schrödinger-Gleichung für das Elektron eine Gleichung für die PhotonenWellenfunktion. Die Photonengleichung ist einfach gleich den Maxwell-Gleichungen für das elektromagnetische Feld, und die Wellenfunktion ist gleich dem Vektorpotential A. Die Wellenfunktion stellt sich einfach als das Vektorpotential heraus. Die Quantenphysik liefert dasselbe wie die klassische Physik, weil Photonen nichtwechselwirkende Bose-Teilchen sind und viele von ihnen in demselben Zustand sein können – wie Sie wissen, sind sie gern in demselben Zustand. In dem Moment, wo Sie Milliarden von Photonen in demselben Zustand haben (das heißt, in derselben elektromagnetischen Welle), können Sie die Wellenfunktion messen, die direkt das Vektorpotential ist. Natürlich verlief die Entwicklung historisch umgekehrt. Die ersten Beobachtungen machte man an Vorgängen mit vielen Photonen im selben Zustand, und wir konnten daher die richtige Gleichung für ein einzelnes Photon entdecken, indem wir die Natur der Wellenfunktionen auf makroskopischer Ebene direkt beobachteten. Die Schwierigkeit mit den Elektronen besteht nun darin, dass Sie nicht mehr als ein Elektron in denselben Zustand bringen können. Daher glaubte man lange, dass die Wellenfunktion der Schrödinger-Gleichung niemals eine makroskopische Darstellung besitzen würde, die zur makroskopischen Darstellung der Amplitude für Photonen analog ist. Später hat man jedoch erkannt, dass das Phänomen der Supraleitfähigkeit uns mit eben dieser Situation konfrontiert.
21.5
Supraleitfähigkeit
Wie Sie wissen, werden sehr viele Metalle unterhalb einer gewissen Temperatur supraleitend,9 wobei die Temperaturschwelle vom konkreten Metall abhängt. Wenn die Temperatur nur weit genug gesenkt wird, leiten diese Metalle die Elektrizität ohne jeden Widerstand. Dieses Phänomen ist bei sehr vielen Metallen beobachtet worden, aber nicht bei allen, und bei der Entwicklung einer Theorie für dieses Phänomen hatte man mit vielen Schwierigkeiten zu kämpfen. Es hat sehr lange gedauert, bis man verstand, was im Inneren eines Supraleiters vorgeht, und ich will davon nur so viel beschreiben, wie für unser jetziges Ziel nötig ist. Es stellt sich heraus, dass es infolge der Wechselwirkungen zwischen den Elektronen und den Schwingungen der Atome im Gitter eine geringe effektive Anziehungskraft zwischen den Elektronen 9
Zuerst entdeckt von Kamerlingh-Onnes 1911; H. Kamerlingh-Onnes, Comm. Phys. Lab., Univ. Leyden, Nos. 119, 120, 122 (1911). Eine moderne Abhandlung des Themas finden Sie in E. A. Lynton, Superconductivity, John Wiley and Sons, Inc., New York, 1962.
454
21 Die Schrödinger-Gleichung in einem klassischen Kontext
gibt. Das Ergebnis ist, dass die Elektronen, um es sehr qualitativ und grob auszudrücken, gebundene Paare bilden. Wie Sie wissen, sind Elektronen Fermi-Teilchen. Ein gebundenes Paar von Elektronen aber verhält sich wie ein Bose-Teilchen, weil bei einem Austausch beider Elektronen in einem Paar das Vorzeichen der Wellenfunktion zweimal geändert wird, und das bedeutet, dass sich gar nichts ändert. Ein Elektronenpaar ist ein Bose-Teilchen. Die Paarungsenergie – das heißt, die Gesamtanziehung – ist sehr schwach. Eine winzige Temperatur genügt, um die Elektronen durch die Wärmebewegung auseinander zu brechen und sie wieder zu „normalen“ Elektronen zu machen. Aber wenn die Temperatur so niedrig ist, dass die Elektronen gezwungen sind, in den absolut niedrigsten Zustand zu gehen, dann finden sie sich in Paaren zusammen. Ich möchte nicht die Vorstellung erwecken, dass die Paare räumlich sehr eng zusammenhalten wie ein punktförmiges Teilchen. In der Tat war es ursprünglich eines der größten Probleme beim Verständnis dieser Phänomene, dass die Dinge sich nicht so verhalten. Die beiden Elektronen, die das Paar bilden, sind in Wirklichkeit über eine beträchtliche Entfernung voneinander entfernt; und die mittlere Entfernung zwischen den Elektronenpaaren ist klein im Verhältnis zur Größe eines einzelnen Paares. Mehrere Paare besetzen zur selben Zeit denselben Raum. Sowohl die Begründung, warum Elektronen in einem Metall Paare bilden, als auch eine Abschätzung der Energie, die bei der Paarbildung frei wird, sind erst später geliefert worden. Dieser fundamentale Aspekt in der Theorie der Supraleitfähigkeit konnte erstmals von Bardeen, Cooper und Schrieffer theoretisch erklärt werden10 , doch das ist nicht das Thema dieses Seminars. Wir wollen einfach die Vorstellung akzeptieren, dass die Elektronen auf die eine oder andere Art paarweise zusammenhängen und dass wir diese Paare so betrachten können, als würden sie sich mehr oder weniger wie Teilchen verhalten. Daher werden wir von der Wellenfunktion eines „Paares“ sprechen. Nun sieht die Schrödinger-Gleichung für das Paar mehr oder weniger wie Gleichung (21.3) aus. Es gibt nur den einen Unterschied, dass die Ladung q das Doppelte der Ladung eines Elektrons ist. Auch kennen wir nicht die Trägheit – oder effektive Masse – für das Paar im Kristallgitter, sodass wir nicht wissen, welcher Wert für m einzusetzen ist. Auch dürfen wir nicht glauben, dass beim Übergang zu sehr hohen Frequenzen (oder kurzen Wellenlängen) dies genau die richtigen Verhältnisse beschreibt, weil die hohe kinetische Energie, die sehr schnell veränderlichen Wellenfunktionen entspricht, so groß sein kann, dass sie die Paare auseinander bricht. Bei endlichen Temperaturen gibt es immer einige Paare, die nach der Boltzmann-Theorie auseinander gebrochen sind. Die Wahrscheinlichkeit dafür, dass ein Paar auseinander gebrochen ist, ist proportional zu exp(−EPaar /kT ). Die Elektronen, die nicht in Paaren gebunden sind, heißen „Normalelektronen“ und sie bewegen sich in gewohnter Weise im Kristall umher. Ich will jedoch nur die Situation betrachten, in der die Temperatur fast null ist – oder jedenfalls die Schwierigkeiten unberücksichtigt lassen, die durch jene Elektronen hervorgerufen werden, die nicht in Paaren vorliegen. Da Elektronenpaare Bosonen sind, gibt es, wenn viele von ihnen in einem gebundenen Zustand vorliegen, für andere Paare eine besonders große Amplitude, in denselben Zustand zu gehen. Daher werden sich fast alle Paare bei der niedrigsten Energie in genau demselben Zustand befinden – es wird nicht leicht sein, eins von ihnen in einen anderen Zustand zu bringen. Die 10
J. Bardeen, L. N. Cooper und J. R. Schrieffer, Phys. Rev. 108, 1175 (1957).
21.6 Der Meissner-Effekt
455
√ Amplitude, in denselben Zustand zu gehen, ist um den bekannten Faktor n größer als die Amplitude, in einen unbesetzten Zustand zu gehen, wobei n − 1 die bisherige Besetzungszahl des niedrigsten Zustands ist. Wir erwarten daher, dass sich alle Paare in denselben Zustand begeben. Wie wird dann unsere Theorie aussehen? Ich will die Wellenfunktion eines Paares im niedrigsten Energiezustand mit ψ bezeichnen. Da jedoch ψψ∗ proportional zur Ladungsdichte ρ ist, kann ich genauso gut ψ als die Quadratwurzel aus der Ladungsdichte mal einem Phasenfaktor schreiben: ψ( r) = ρ1/2 ( r) eiθ(r) ,
(21.17)
wobei ρ und θ reelle Funktionen von r sind. (Jede komplexe Funktion kann natürlich so geschrieben werden.) Es ist klar, was wir meinen, wenn wir über die Ladungsdichte sprechen. Aber welche physikalische Bedeutung hat die Phase θ der Wellenfunktion? Schauen wir, was passiert, wenn wir ψ(r) in (21.12) einsetzen und die Stromdichte durch die neuen Variablen ρ und θ ausdrücken. Es ist einfach eine Variablentransformation, und ich möchte mir die Details der Rechnung sparen. Das Ergebnis ist jedenfalls q J= ∇θ − A ρ . (21.18) m
Da sowohl die Stromdichte als auch die Ladungsdichte eine direkte physikalische Bedeutung für das supraleitende Elektronengas hat, sind ρ und θ reale Größen. Die Phase ist genauso beobachtbar wie ρ; sie bestimmt ebenfalls die Stromdichte J. Die absolute Phase ist zwar nicht beobachtbar, aber wenn der Gradient der Phase überall bekannt ist, ist auch die Phase bis auf eine Konstante bekannt. Sie können die Phase an einem Punkt festlegen, sodass sie dann überall bestimmt ist. Übrigens kann die Gleichung für die Stromdichte etwas eleganter analysiert werden, wenn Sie daran denken, dass die Stromdichte J tatsächlich die Ladungsdichte mal der Geschwindigkeit der Bewegung der Elektronenflüssigkeit oder ρu ist. Gleichung (21.18) ist dann äquivalent mit m u = ∇θ − q A .
(21.19)
Beachten Sie, dass der mv-Impuls zwei Anteile hat; der eine ist der Beitrag des Vektorpotentials und der andere ist der Beitrag der Wellenfunktion. Mit anderen Worten, die Größe ∇θ ist genau das, was wir den p-Impuls genannt haben.
21.6
Der Meissner-Effekt
Nun können wir einige Phänomene der Supraleitfähigkeit beschreiben. Das Offensichtlichste ist, dass es keinen elektrischen Widerstand gibt. Es gibt keinen Widerstand, weil alle Elektronen im selben Zustand sind. Beim gewöhnlichen Stromfluss stoßen sie mit dem einen oder anderen Elektron aus dem regulären Fluss zusammen, wodurch sie allmählich den allgemeinen Impuls herabsetzen. Aber hier ist es wegen der Tendenz aller Bose-Teilchen, in denselben Zustand zu gehen, sehr schwierig, ein Elektron von dem, was alle anderen tun, abzubringen. Ein einmal gestarteter Strom fließt für immer weiter.
456
21 Die Schrödinger-Gleichung in einem klassischen Kontext
Es ist auch leicht verständlich, dass, wenn Sie ein Stück Metall im supraleitenden Zustand betrachten und ein nicht zu starkes Magnetfeld einschalten, das Magnetfeld nicht in das Metall eindringen kann. Wenn beim Aufbau des Magnetfeldes sich auch irgendetwas davon im Innern des Metalls aufbauen würde, gäbe es eine Änderungsrate des Flusses, die ein elektrisches Feld erzeugen würde, und ein elektrisches Feld würde sofort einen Strom hervorrufen, der nach der lenzschen Regel den Fluss hemmen würde. Da sich alle Elektronen gemeinsam bewegen, erzeugt schon ein infinitesimales elektrisches Feld genügend Strom, um jedes angelegte magnetische Feld vollständig zu hemmen. Wenn Sie daher ein Feld einschalten, nachdem Sie ein Metall bis zum supraleitenden Zustand abgekühlt haben, wird das Magnetfeld aus dem Metall verdrängt. Noch interessanter ist ein verwandtes Phänomen, das experimentell von Meissner entdeckt wurde.11 Wenn Sie in einem Metall bei einer hohen Temperatur (sodass es ein normaler Leiter ist) ein Magnetfeld erzeugen und dann die Temperatur unter die kritische Temperatur senken (wodurch das Metall ein Supraleiter wird), wird das Feld hinausgedrängt. Mit anderen Worten, das Magnetfeld induziert einen Strom – und genau in der richtigen Größe, um das Feld hinauszudrängen. Den Grund dafür können wir in den Gleichungen sehen. Betrachten wir einen Block aus einem supraleitenden Material. Dann muss in jeder stationären Situation die Divergenz des Stroms null sein, weil es keinen Ort gibt, wohin er fließen kann. Es ist bequem, die Divergenz von A als null zu wählen. (Man kann zeigen, warum diese Wahl keine Beschränkung der Allgemeinheit bedeutet, ich möchte mir aber dafür nicht die Zeit nehmen.) Wenn wir die Divergenz von (21.18) bilden, dann ergibt sich, dass der Laplace-Operator, angewendet auf θ, null ist. Moment mal. Was ist mit der Änderung von ρ? Ich vergaß, einen wichtigen Aspekt zu erwähnen. Es gibt ja auch noch einen Hintergrund positiver Ladung in diesem Metall infolge der atomaren Gitterionen. Wenn die Ladungsdichte ρ homogen ist, gibt es keine Gesamtladung und kein elektrisches Feld. Wenn es in einem Gebiet eine Anhäufung von Elektronen gäbe, wäre die Ladung nicht neutralisiert und es gäbe eine gewaltige Abstoßung, die die Elektronen auseinander treiben würde.12 Daher ist unter gewöhnlichen Umständen die Ladungsdichte der Elektronen in dem Supraleiter fast vollkommen homogen – wir können ρ als konstant annehmen. Nun ist die einzige Möglichkeit dafür, dass ∇2 θ überall innerhalb des Metallblocks null ist, dass θ eine Konstante ist. Und das bedeutet, dass der p-Impuls keinen Beitrag zu J liefert. Gleichung (21.18) besagt dann, dass der Strom proportional zu ρ mal A ist. Daher ist überall in einem Block aus supraleitendem Material der Strom notwendigerweise proportional zum Vektorpotential: J = −ρ
q A. m
(21.20)
Da ρ und q dasselbe (negative) Vorzeichen haben und da ρ eine Konstante ist, setze ich −ρq/m = −(eine positive Konstante). Daraus folgt J = −(eine positive Konstante) A . 11 12
(21.21)
W. Meissner und R. Ochsenfeld, Naturwiss. 21, 787 (1933). Tatsächlich würden, wenn das elektrische Feld zu stark ist, Paare auseinandergebrochen werden, und die entstandenen „normalen“ Elektronen würden einspringen, um den Überschuss an positiven Ladungen zu neutralisieren. Doch es ist Energie nötig, um diese normalen Elektronen hervorzurufen. Der entscheidende Punkt ist daher, dass eine fast homogene Dichte ρ energetisch stark begünstigt ist.
21.6 Der Meissner-Effekt
457
B B
(a)
(b)
r Abb. 21.3: (a) Ein supraleitender Zylinder in einem Magnetfeld; (b) die magnetische Feldstärke B als Funktion von r.
Diese Gleichung wurde ursprünglich von London und London13 vorgeschlagen, um die experimentellen Beobachtungen der Supraleitfähigkeit zu erklären – lange bevor die quantenmechanische Natur dieses Effekts erkannt wurde. Nun können wir das durch (21.20) gegebene J in den Gleichungen des Elektromagnetismus verwenden, um Lösungen für die Felder zu finden. Das Vektorpotential ist mit der Stromdichte verknüpft durch ∇2 A = −
1 J. �0 c2
(21.22)
Wenn wir (21.21) für J benutzen, erhalten wir ∇2 A = λ2 A ,
(21.23)
wobei λ2 eine neue Konstante ist: λ2 = ρ
q . �0 mc2
(21.24)
Wir können jetzt versuchen, diese Gleichung für A zu lösen, und sehen, was genau geschieht. Zum Beispiel hat die Gleichung (21.23) in einer Dimension Exponentiallösungen der Form e−λx und e+λx . Diese Lösungen bedeuten, dass das Vektorpotential im Material mit zunehmendem Abstand von der Oberfläche exponentiell abnehmen muss. (Zunehmen kann es nicht, weil es sonst eine Explosion geben würde.) Wenn das Metallstück sehr groß im Vergleich zu 1/λ ist, dringt das Feld nur in eine dünne Schicht unter der Oberfläche ein – in eine Schicht, die etwa 1/λ dick ist. Das gesamte übrige Innere ist feldfrei, wie in Abbildung 21.3 skizziert. Dies ist die Erklärung des Meissner-Effekts. 13
F. London und H. London, Proc. Roy. Soc. (London) A149, 71 (1935); Physica 2, 341 (1935).
458
21 Die Schrödinger-Gleichung in einem klassischen Kontext
Wie groß ist der Abstand λ? Nun ja, bedenken Sie, dass r0 , der „elektromagnetische Radius“ des Elektrons (2,8 × 10−13 cm), gegeben ist durch mc2 =
q2e . 4π�0 r0
Bedenken Sie auch, dass q in (21.24) das Doppelte der Ladung eines Elektrons ist, sodass gilt q2 8πr0 = . qe �0 mc2 Wenn wir ρ als qe N schreiben, wobei N die Zahl der Elektronen je Kubikzentimeter ist, erhalten wir λ2 = 8πNr0 .
(21.25)
Bei einem Metall wie Blei gibt es etwa 3 × 1022 Atome pro cm3 . Wenn jedes nur ein Leitungselektron beisteuert, wäre 1/λ etwa 2×10−6 cm. Damit haben Sie die ungefähre Größenordnung.
21.7
Flussquantisierung
Die London-Gleichung (21.21) wurde vorgeschlagen, um den experimentellen Ergebnissen zur Supraleitfähigkeit, einschließlich des Meissner-Effekts, Rechnung zu tragen. In neuerer Zeit hat es sogar noch dramatischere Vorhersagen gegeben. Eine Vorhersage von London war so seltsam, dass sie bis vor kurzem niemand stark beachtete. Um diese Vorhersage soll es im Folgenden gehen. Diesmal betrachten wir anstatt eines einzelnen Blocks einen Ring, dessen Dicke im Vergleich zu 1/λ groß ist. Was würde passieren, wenn wir mit einem Magnetfeld durch den Ring beginnen, ihn dann auf den supraleitenden Zustand abkühlen und danach die ursprüngliche Quelle von B entfernen? Die Folge der Ereignisse ist in Abbildung 21.4 skizziert. Im normalen Zustand gibt es ein Feld im Inneren des Ringes, wie in Teil (a) der Abbildung skizziert. Wenn der Ring in den supraleitenden Zustand versetzt wurde, wird das Feld aus dem Material hinausgedrängt, wie wir im vorherigen Abschnitt gesehen haben. Es wird dann einen Fluss durch die Öffnung des Ringes geben, wie in Teil (b) skizziert. Wenn jetzt das äußere Feld abgeschaltet wird, sind die durch die Öffnung gehenden Feldlinien „eingefangen“, wie in Teil (c) gezeigt. Der Fluss Φ durch die Mitte kann nicht abnehmen, weil ∂Φ/∂t gleich dem Linienintegral von E um den Ring sein muss, das in einem Supraleiter null ist. Während das äußere Feld abgeschaltet wird, beginnen Supraströme um den Ring zu fließen, um den Fluss durch den Ring konstant zu halten. (Es ist das alte Wirbelstrom-Prinzip, nur ohne Widerstand.) Diese Ströme werden jedoch alle dicht unter der Oberfläche fließen (bis hinunter zu einer bestimmten Tiefe 1/λ), was durch eine Untersuchung der gleichen Art gezeigt werden kann, wie wir sie zuvor für den massiven Block durchgeführt haben. Diese Ströme können das Magnetfeld aus dem Ringkörper heraushalten und das permanent gefangene Magnetfeld erzeugen. Nun gibt es aber einen wesentlichen Unterschied zur vorher betrachteten Situation, und unsere Gleichungen sagen einen überraschenden Effekt vorher. Das zuvor herangezogene Argument, dass θ in einem massiven Block eine Konstante sein muss, trifft für einen Ring nicht zu, wie Sie aus folgenden Überlegungen erkennen können.
21.7 Flussquantisierung
459
B
B
(a)
(b)
B
Abb. 21.4: Ein Ring im Magnetfeld: (a) im normalen Zustand; (b) im supraleitenden Zustand; (c) nachdem das äußere Feld abgeschaltet wurde.
(c)
Im Inneren des Ringkörpers ist die Stromdichte J null; daher ergibt (21.18) ∇θ = q A .
(21.26)
Schauen wir uns nun an, was wir erhalten, wenn wir das Linienintegral von A längs einer Kurve Γ bilden, die durch den Ring nahe dem Mittelpunkt seines Querschnitts verläuft, sodass sie niemals in die Nähe der Oberfläche kommt (siehe Abbildung 21.5). Nach (21.26) ist ∇θ · d s = q A · ds. (21.27)
Sie wissen jetzt aber, dass das Linienintegral von A um eine Schleife gleich dem Fluss von B durch die Schleife ist, d. h. A·ds = Φ.
Γ
Abb. 21.5: Die Kurve Γ in einem supraleitenden Ring.
460
21 Die Schrödinger-Gleichung in einem klassischen Kontext
Gleichung (21.27) wird dann zu q ∇θ · d s = Φ .
(21.28)
Das Linienintegral eines Gradienten von einem Punkt 1 zu einem Punkt 2 ist die Differenz der Werte der Funktion an den beiden Endpunkten, also 2 ∇θ · d s = θ2 − θ1 . 1
Wenn wir die beiden Endpunkte 1 und 2 zusammenführen, sodass wir eine geschlossene Schleife erhalten, werden Sie vielleicht zuerst denken, dass θ2 gleich θ1 wird und deshalb das Integral in (21.28) null ergibt. Das wäre richtig bei einer geschlossenen Schleife in einem einfach zusammenhängenden Stück Supraleiter, aber es muss bei einem ringförmigen Stück nicht unbedingt richtig sein. Die einzige physikalische Forderung, die wir stellen können, ist, dass es für jeden Punkt nur einen Wert der Wellenfunktion geben kann. Was immer das θ auch macht, während Sie um den Ring gehen, – wenn Sie wieder an den Anfangspunkt zurückkommen, muss das θ, das Sie erhalten, denselben Wert für die Wellenfunktion √ ψ = ρ eiθ liefern. Dies ist der Fall, wenn sich θ um 2πn ändert, wobei n eine ganze Zahl ist. Wenn wir daher einen ganzen Umlauf um den Ring machen, muss die linke Seite von Gleichung (21.27) gleich · 2πn sein. Unter Verwendung von (21.28) erhalten wir 2πn = qΦ .
(21.29)
Der eingefangene Fluss muss immer eine ganze Zahl mal 2π/q sein! Wenn Sie den Ring als klassisches Objekt mit idealer (das heißt unendlich großer) Leitfähigkeit betrachten, dann würden Sie schlussfolgern, dass jeder Fluss, der ursprünglich hindurchging, einfach dableibt – jede beliebige Flussmenge könnte so eingefangen werden. Aber die quantenmechanische Theorie der Supraleitung besagt, dass der Fluss null sein kann oder 2π/q, 4π/q, 6π/q usw.; er kann jedoch keine Zwischenwerte annehmen. Er muss ein Vielfaches einer quantenmechanischen Grundeinheit sein. London14 sagte vorher, dass der von einem supraleitenden Ring eingefangene Fluss quantisiert sein muss, und er sagte, dass die möglichen Werte des Flusses durch (21.29) gegeben sind, wobei q die Ladung des Elektrons ist. Nach London sollte die Grundeinheit des Flusses 2π/qe sein, was etwa 4 × 10−7 Gauß · cm2 ist. Um sich einen solchen Fluss zu veranschaulichen, denken Sie an einen winzigen Zylinder mit einem Durchmesser von 1/10 mm. Wenn er diese Flussmenge enthält, dann beträgt das Magnetfeld in ihm etwa ein Prozent des Magnetfelds der Erde. Es sollte möglich sein, diesen Fluss durch eine empfindliche magnetische Messung zu beobachten. Im Jahre 1961 wurde von Deaver und Fairbank15 an der Stanford University nach einem solchen quantisierter Fluss gesucht und er wurde gefunden; ebenso etwa zur selben Zeit von Doll und Näbauer16 in Deutschland. 14 15 16
F. London, Superfluids; John Wiley and Sons, Inc., New York, 1950, Bd. I, S. 152. B. S. Deaver, Jr., und W. M. Fairbank, Phys. Rev. Letters 7, 43 (1961). R. Doll und M. Näbauer, Phys. Rev. Letters 7, 51 (1961).
21.8 Die Dynamik der Supraleitfähigkeit
461
Im Versuch von Deaver und Fairbank wurde ein winziger Zylinder aus supraleitendem Material hergestellt, indem eine dünne Zinnschicht auf einen ein Zentimeter langen Kupferdraht von 1,3×10−3 cm Durchmesser galvanisch aufgebracht wurde. Zinn wird unterhalb von 3,8 K supraleitend, während Kupfer bei dieser Temperatur noch normalleitend bleibt. Der Draht wurde in ein schwaches Magnetfeld gebracht und die Temperatur so weit gesenkt, bis das Zinn supraleitend wurde. Dann wurde die Quelle des äußeren Feldes abgeschaltet. Nach der lenzschen Regel muss dies einen Strom erzeugen, sodass sich der innere Fluss nicht ändert. Der kleine Zylinder muss jetzt ein magnetisches Moment proportional zum inneren Fluss haben. Das magnetische Moment wurde gemessen, indem man den Draht im Inneren eines Paares kleiner Spulen an den Enden des Zinnzylinders rasch auf und ab bewegte (wie die Nadel einer Nähmaschine, aber mit einer Geschwindigkeit von 100 Schwingungen pro Sekunde). Die in den Spulen induzierte Spannung ist dann ein Maß für das magnetische Moment. Als Deaver und Fairbank den Versuch durchführten, stellten sie fest, dass der Fluss zwar quantisiert ist, dass aber die Grundeinheit nur halb so groß ist wie von London vorhergesagt. Doll und Näbauer erhielten dasselbe Resultat. Das war anfangs ziemlich rätselhaft,17 inzwischen aber verstehen wir, warum es so sein muss. Nach der Theorie der Supraleitfähigkeit von Bardeen, Cooper und Schrieffer ist das in (21.29) auftretende q die Ladung eines Elektronenpaares und daher gleich 2qe . Die Grundeinheit des Flusses ist somit Φ0 =
π ≈ 2 × 10−7 Gauß · cm qe
(21.30)
oder die Hälfte des von London vorhergesagten Wertes. Alles passt jetzt zusammen, und viele Messungen haben die Existenz des vorhergesagten, rein quantenmechanischen Effekts belegt.
21.8
Die Dynamik der Supraleitfähigkeit
Der Meissner-Effekt und die Flussquantisierung sind zwei Bestätigungen unserer allgemeinen Vorstellungen. Nur der Vollständigkeit halber möchte ich zeigen, wie von diesem Standpunkt aus die vollständigen Gleichungen einer supraleitenden Flüssigkeit aussehen. Es ist recht interessant. Bis jetzt habe ich nur den Ausdruck für ψ in die Gleichungen für Ladungsdichte und Strom eingesetzt. Wenn ich ihn in die vollständige Schrödinger-Gleichung einsetze, erhalte ich Gleichungen für ρ und θ. Es dürfte interessant sein, einmal zu sehen, was herauskommt, weil wir hier eine „Flüssigkeit“ von Elektronenpaaren haben mit einer Ladungsdichte ρ und einem mysteriösen θ – wir können herauszufinden versuchen, welche Art Gleichungen wir für eine solche „Flüssigkeit“ erhalten! Wir setzen also die Wellenfunktion (21.17) in die SchrödingerGleichung (21.3) ein und beachten, dass ρ und θ reelle Funktionen von x, y, z und t sind. Wenn wir Real- und Imaginärteil trennen, dann erhalten wir zwei Gleichungen. Gleichung (21.19) folgend, können wir sie in einer kürzeren Form schreiben: q ∇θ − A = u. m m 17
(21.31)
Es ist einmal von Onsager angedeutet worden, dass dies eintreten könnte (siehe Deaver und Fairbank, Ref. 11), aber niemand verstand, warum das so sein sollte.
462
21 Die Schrödinger-Gleichung in einem klassischen Kontext
Eine der resultierenden Gleichungen ist dann ∂ρ = −∇ · ρu. ∂t
(21.32)
Da ρu zuerst einmal J ist, ist dies einfach wieder die Kontinuitätsgleichung. Die andere resultierende Gleichung beschreibt die zeitliche Änderung von θ; sie lautet
∂θ m 2 1 2 √ = − v2 − qφ + ρ . √ ∇ ∂t 2 2m ρ
(21.33)
Diejenigen unter Ihnen, die mit der Hydrodynamik gründlich vertraut sind, werden dies als die Bewegungsgleichung für eine elektrisch geladene Flüssigkeit erkennen, sofern wir θ mit dem „Geschwindigkeitspotential“ identifizieren – abgesehen davon, dass der letzte Term, der die Kompressionsenergie der Flüssigkeit sein sollte, eine recht eigenartige Abhängigkeit von der Dichte ρ hat. Jedenfalls besagt die Gleichung, dass die Änderungsrate der Größe θ gegeben ist durch einen Term für die kinetische Energie − 21 mv2 plus einen Term für die potentielle Energie −qφ mit einem zusätzlichen Term, der den Faktor 2 enthält, sodass wir ihn als „quantenmechanische Energie“ bezeichnen können. Wir haben gesehen, dass ρ im Inneren eines Supraleiters durch die elektrostatischen Kräfte sehr homogen gehalten wird. Daher kann dieser Term sicherlich in jeder praktischen Anwendung vernachlässigt werden, vorausgesetzt, dass wir nur ein supraleitendes Gebiet haben. Wenn es eine Grenze zwischen zwei Supraleitern gibt (oder andere Verhältnisse vorliegen, bei denen sich der Wert von ρ plötzlich ändern kann), dann kann dieser Term wichtig werden. Für diejenigen unter Ihnen, die mit den Gleichungen der Hydrodynamik nicht so vertraut sind, kann ich Gleichung (21.33) in eine Form umschreiben, in der die Physik klarer wird. Hierzu verwende ich (21.31), um θ durch u auszudrücken. Wenn ich den Gradienten der Gleichung (21.33) bilde und ∇θ unter Benutzung von (21.31) durch A und u ausdrücke, erhalte ich ∂u q ∂A 2 1 2 √ = − ∇φ − − u × ( ∇ × u) − ( u · ∇) u + ∇ √ ∇ ρ . ∂t m ∂t ρ 2m2
(21.34)
Was bedeutet diese Gleichung? Erinnern Sie sich zunächst daran, dass − ∇φ −
∂A = E. ∂t
(21.35)
Dann beachten wir, dass wir ∇× u=−
q ∇× A m
(21.36)
erhalten, wenn wir die Rotation von (21.31) bilden, da die Rotation eines Gradienten immer null ist. Aber ∇ × A ist das Magnetfeld B, daher können die ersten beiden Terme geschrieben werden als q ( E + u × B) . m Schließlich müssen wir beachten, dass du/dt die Änderungsrate der Geschwindigkeit der Flüssigkeit an einem Punkt bedeutet. Wenn Sie sich auf ein spezielles Teilchen konzentrieren, dann
21.8 Die Dynamik der Supraleitfähigkeit
463
ist dessen Beschleunigung die totale Ableitung von u (oder, wie es manchmal in der Dynamik der Flüssigkeiten heißt, die „mitbewegte Beschleunigung“), die mit du/dt verknüpft ist durch18 ∂u du + ( u · ∇) u . (21.37) = dt mitbewegt ∂t Dieser zusätzliche Term erscheint als dritter Term auf der rechten Seite von (21.34). Wenn wir ihn auf die linke Seite bringen, können wir (21.34) folgendermaßen schreiben: du 2 1 2 √ m = q ( E + u × B) + ∇ (21.38) √ ∇ ρ . dt mitbewegt 2m ρ
Aus Gleichung (21.36) erhalten wir außerdem q (21.39) ∇ × u = − B. m Diese zwei Gleichungen sind die Bewegungsgleichungen der supraleitenden Elektronenflüssigkeit. Die erste Gleichung ist einfach das newtonsche Gesetz für eine geladene Flüssigkeit in einem elektromagnetischen Feld. Sie besagt, dass die Beschleunigung für jedes Flüssigkeitsteilchen mit der Ladung q durch die übliche Lorentz-Kraft q (E + u × B) plus eine zusätzliche Kraft zustande kommt, die der Gradient eines mysteriösen quantenmechanischen Potentials ist – eine Kraft, die außer an der Übergangsstelle zwischen zwei Supraleitern nicht sehr groß ist. Die zweite Gleichung besagt, dass die Flüssigkeit „ideal“ ist – die Rotation von u hat die Divergenz null (die Divergenz von B ist immer null). Das bedeutet, dass die Geschwindigkeit durch ein Geschwindigkeitspotential ausgedrückt werden kann. Gewöhnlich schreibt man für eine ideale Flüssigkeit ∇ × u = 0, was aber für eine ideale geladene Flüssigkeit in einem Magnetfeld in Gleichung (21.39) abgeändert werden muss. Somit liefert uns die Schrödinger-Gleichung für Elektronenpaare in einem Supraleiter die Bewegungsgleichungen einer elektrisch geladenen idealen Flüssigkeit. Supraleitfähigkeit ist analog zum Problem der Hydrodynamik einer geladenen idealen Flüssigkeit. Wenn Sie ein Problem über Supraleiter lösen wollen, nehmen Sie diese Gleichungen für die Flüssigkeit (oder das äquivalente Gleichungspaar (21.32) und (21.33)) und kombinieren sie diese mit den MaxwellGleichungen für die Felder. (Die Ladungen und Ströme, die Sie benutzen, um die Felder zu erzeugen, müssen natürlich sowohl die Ladungen und Ströme aus dem Supraleiter als auch die aus den äußeren Quellen enthalten.) Übrigens vermute ich, dass Gleichung (21.38) nicht ganz richtig ist, sondern noch einen zusätzlichen Term für die Dichte enthalten müsste. Dieser zusätzliche Term ist nicht durch die Quantenmechanik begründet, sondern stammt aus der gewöhnlichen Energie, die mit Variationen der Dichte zusammenhängt. Ebenso wie in einer gewöhnlichen Flüssigkeit sollte es eine potentielle Energiedichte geben, die proportional ist zum Quadrat der Abweichung ρ von ρ0 , der ungestörten Dichte (die hier auch gleich der Ladungsdichte des Kristallgitters ist). Da es Kräfte geben wird, die proportional zum Gradienten dieser Energie sind, sollte es in (21.38) noch einen Term von der Form (konst.)∇(ρ − ρ0 )2 geben. Dieser Term konnte sich aus der Rechnung nicht ergeben, weil er aus den Wechselwirkungen zwischen Teilchen stammt, die ich nicht berücksichtigt habe, indem ich die Näherung unabhängiger Teilchen verwendet habe. Es ist jedoch gerade diese Kraft, auf die ich mich bezog, als ich die qualitative Behauptung aufstellte, dass elektrostatische Kräfte das Bestreben haben, ρ innerhalb eines Supraleiters nahezu konstant zu halten. 18
Siehe Band IV, Abschnitt 11.2.
464
21 Die Schrödinger-Gleichung in einem klassischen Kontext
21.9
Der Josephson-Übergang
Als Nächstes möchte ich eine sehr interessante Situation besprechen, auf die Josephson19 aufmerksam wurde, als er untersuchte, was an einem Übergang zwischen zwei Supraleitern passiert. Angenommen, wir betrachten zwei Supraleiter, die durch eine dünne Schicht aus isolierendem Material getrennt sind, siehe Abbildung 21.6. Eine solche Anordnung wird heute „Josephson-Übergang“ genannt. Wenn die isolierende Schicht dick ist, können die Elektronen nicht hindurchgehen; wenn aber die Schicht dünn genug ist, kann es eine signifikante quantenmechanische Amplitude dafür geben, dass die Elektronen sie durchdringen. Dies ist einfach ein weiteres Beispiel für den quantenmechanischen Tunneleffekt. Josephson untersuchte diese Situation und entdeckte, dass dabei eine Reihe seltsamer Phänomene auftreten kann. Isolator
1
2
Supraleiter
Abb. 21.6: Zwei durch einen dünnen Isolator getrennte Supraleiter.
Sei ψ1 die Amplitude, das Elektron auf der einen Seite zu finden, und ψ2 die Amplitude, es auf der anderen Seite zu finden. Im supraleitenden Zustand ist die Wellenfunktion ψ1 die gemeinsame Wellenfunktion aller Elektronen auf der einen Seite und ψ2 die entsprechende Funktion auf der anderen Seite. Ich könnte dieses Problem für verschiedene Arten von Supraleitern in den beiden Bereichen behandeln, doch ich will die einfache Situation annehmen, dass das Material auf beiden Seiten dasselbe ist, sodass der Übergang symmetrisch und einfach ist. Auch sei im Moment kein Magnetfeld vorhanden. Dann sind die beiden Amplituden folgendermaßen miteinander verknüpft: ∂ψ1 = U1 ψ1 + Kψ2 , ∂t ∂ψ2 = U2 ψ2 + Kψ1 . i ∂t
i
Die Konstante K ist ein Charakteristikum des Übergangs. Wenn K null wäre, dann würden diese beiden Gleichungen einfach den Zustand niedrigster Energie der Supraleiter – mit der Energie U – beschreiben. Aber es gibt eine Kopplung zwischen den zwei Seiten durch die Amplitude K dafür, dass etwas von der einen Seite zur anderen hinübersickert. (Das ist einfach die „Umklappamplitude“ eines Zweizustandssystems.) Wenn die beiden Seiten identisch sind, ist U1 gleich U2 , und ich kann sie durch Subtraktion eliminieren. Aber nehmen wir jetzt an, dass wir die beiden supraleitenden Gebiete mit den zwei Polen einer Batterie verbinden, sodass es quer 19
B. D. Josephson, Physics Letters 1, 251 (1962).
21.9 Der Josephson-Übergang
465
zur Übergangszone eine Potentialdifferenz V gibt. Dann ist U1 − U2 = qV. Der Bequemlichkeit halber kann ich den Energienullpunkt in die Mitte legen und erhalte dann die Gleichungen ∂ψ1 qV = ψ1 + Kψ2 , ∂t 2 qV ∂ψ2 =− ψ2 + Kψ1 . i ∂t 2 i
(21.40)
Dies sind die Standardgleichungen für zwei miteinander gekoppelte quantenmechanische Zustände. Untersuchen wir diese Gleichungen nun auf eine andere Art. Dazu substituieren wir √ ρ1 eiθ1 √ ψ2 = ρ2 eiθ2 ,
ψ1 =
(21.41)
wobei θ1 , θ2 die Phasen auf der jeweiligen Seite der Übergangszone sind und ρ1 , ρ2 die entsprechenden Elektronendichten. Bedenken Sie, dass in der Praxis ρ1 und ρ2 fast genau gleich sind, und zwar gleich ρ0 , der normalen Elektronendichte in dem supraleitenden Material. Wenn Sie jetzt diese Gleichungen für ψ1 und ψ2 in (21.40) einsetzen, erhalten Sie durch Gleichsetzen der Real- und Imaginärteile vier Gleichungen. Mit der Abkürzung (θ2 − θ1 ) = δ erhalten wir 2 √ ρ˙ 1 = + K ρ2 ρ1 sin δ , K ρ2 qV , cos δ − θ˙1 = − ρ1 2
2 √ ρ˙ 2 = − K ρ2 ρ1 sin δ , K ρ1 qV θ˙2 = − . cos δ + ρ2 2
(21.42) (21.43)
Aus den oberen beiden Gleichungen folgt ρ˙ 1 = −ρ˙ 2 . „Aber“, werden Sie einwenden, „sie müssen beide null sein, wenn ρ1 und ρ2 beide konstant und gleich ρ0 sind.“ Nicht ganz. Diese Gleichungen sind nicht alles. Sie besagen, was ρ˙ 1 und ρ˙ 2 wären, falls keine zusätzlichen elektrischen Kräfte vorhanden wären, die aus einem Ungleichgewicht zwischen der Elektronenflüssigkeit und dem Hintergrund der positiven Ionen herrühren. Sie besagen, wie die Dichten anfangen würden, sich zu ändern, und beschreiben daher die Art des Stromes, der zu fließen beginnen würde. Dieser Strom von der Seite 1 zur Seite 2 wäre gerade ρ˙ 1 (oder −ρ˙ 2 ) oder J=
2K √ ρ1 ρ2 sin δ .
(21.44)
Ein solcher Strom würde die zweite Seite schnell aufladen, doch wir haben nicht bedacht, dass die beiden Seiten mit Drähten an eine Batterie angeschlossen sind. Der fließende Strom wird das Gebiet 2 nicht aufladen (oder das Gebiet 1 entladen), weil Ströme fließen werden, um das Potential konstant zu halten. Diese Ströme aus der Batterie haben wir in unsere Gleichungen nicht mit einbezogen. Wenn wir sie berücksichtigen, ändern sich ρ1 und ρ2 tatsächlich nicht, aber der Strom durch die Übergangszone ist immer noch durch (21.44) gegeben. Da ρ1 und ρ2 den konstanten Wert ρ0 beibehalten, wollen wir 2Kρ0 / = J0 setzen und schreiben J = J0 sin δ . J0 ist dann wie K eine Zahl, die ein Charakteristikum des speziellen Übergangs ist.
(21.45)
466
21 Die Schrödinger-Gleichung in einem klassischen Kontext
Das andere Gleichungspaar (21.43) gibt uns über θ1 und θ2 Auskunft. Uns interessiert die Differenz δ = θ2 − θ1 , um sie in (21.45) verwenden zu können; was wir (mit ρ1 = ρ2 ) erhalten, ist qV . δ˙ = θ˙2 − θ˙1 = Wir können daher schreiben q δ(t) = δ0 + V(t) dt ,
(21.46)
(21.47)
wobei δ0 der Wert von δ bei t = 0 ist. Beachten Sie auch, dass q die Ladung eines Elektronenpaares ist, nämlich q = 2qe . Mit den Gleichungen (21.45) und (21.47) haben wir ein wichtiges Resultat, nämlich die allgemeine Theorie des Josephson-Übergangs. Was sind nun die Konsequenzen? Betrachten wir zunächst den Fall einer Gleichspannung. Wenn Sie eine Gleichspannung V0 anlegen, dann wird das Argument der Sinusfunktion zu (δ0 + (q/)V0t). Da eine kleine Zahl ist (im Vergleich zu üblichen Spannungen und Zeiten), oszilliert der Sinus ziemlich schnell, und der Gesamtstrom verschwindet. (Da in der Praxis die Temperatur nicht null ist, würden Sie einen kleinen Strom aufgrund der Leitung durch „normale“ Elektronen erhalten.) Wenn Sie dagegen quer zur Übergangszone keine Spannung anlegen, können Sie einen Strom erhalten! Ohne Spannung kann der Strom einen Betrag zwischen +J0 und −J0 haben (in Abhängigkeit von dem Wert von δ0 ). Versuchen Sie aber, eine Spannung anzulegen, dann geht der Strom gegen null. Dieses seltsame Verhalten ist tatsächlich experimentell beobachtet worden.20 Es gibt noch eine andere Möglichkeit, einen Strom zu erhalten, und zwar indem Sie eine Spannung mit einer sehr hohen Frequenz zusätzlich zu einer Gleichspannung anlegen. Sei V = V0 + v cos ωt mit v � V0 . Dann ist δ(t) δ0 +
q q v V0 t + sin ωt . ω
Für kleines Δx gilt näherungsweise sin(x + Δx) ≈ sin x + Δx cos x . Wenn wir diese Näherung für sin δ benutzen, erhalten wir q v q q sin ωt cos δ0 + V0 t . J = J0 sin δ0 + V0 t + ω
Der erste Term ist im Mittel null, aber der zweite Term ist es nicht, falls ω= 20
q V0 .
P. W. Andersen und J. M. Rowell, Phys. Rev. Letters 10, 230 (1963).
21.9 Der Josephson-Übergang Schleife Γ
Jgesamt
a
467
Isolator
Q
P
b Supraleiter
Abb. 21.7: Zwei parallelgeschaltete Josephson-Übergänge.
Es sollte einen Strom geben, wenn die Wechselspannung gerade diese Frequenz hat. Shapiro21 hat einen solchen Resonanzeffekt beschrieben. In Publikationen zu diesem Thema werden Sie die Formel für den Strom oft in der Form 2qe J = J0 sin δ0 + A·ds (21.48) geschrieben finden, wobei das Integral quer durch den Übergang genommen werden muss. Der Grund dafür ist, dass bei Anwesenheit eines Vektorpotentials quer zum Übergang die Umklappamplitude eine Phasenänderung erfährt, wie wir sie früher beschrieben haben. Wenn Sie diese zusätzliche Phase weiter verfolgen, kommt das heraus, was oben angegeben ist. Zum Schluss möchte ich ein sehr spannendes und interessantes Experiment beschreiben, bei dem es um die Interferenz der Ströme von zwei Übergängen geht. In der Quantenmechanik sind wir mit der Interferenz zwischen Amplituden aus zwei verschiedenen Spalten vertraut. Nun wollen wir die Interferenz zwischen zwei Übergängen behandeln, die entsteht, wenn die Ströme auf zwei verschiedenen Wegen ankommen. Abbildung 21.7 zeigt zwei verschiedene Übergänge „a“ und „b“, die parallel geschaltet sind. Die Enden P und Q sind mit elektrischen Instrumenten verbunden, die jeden Stromfluss messen. Der äußere Strom Jgesamt ist die Summe der Ströme durch die beiden Übergänge. Seien Ja und Jb die Ströme durch die Übergänge und seien ihre Phasen δa und δb . Nun muss die Phasendifferenz der Wellenfunktionen zwischen P und Q unabhängig vom Weg sein. Auf dem Weg durch Übergang „a“ ist die Phasendifferenz zwischen P und Q gleich δa plus dem Linienintegral des Vektorpotentials entlang des oberen Weges: 2qe ΔPhaseP→Q = δa + A · ds. (21.49) oberer Weg Warum? Weil die Phase θ mit A durch (21.26) verknüpft ist. Wenn Sie diese Gleichung auf irgendeinem Weg integrieren, ergibt die linke Seite die Phasenänderung, die dann direkt proportional zum Linienintegral von A ist, wie wir hier geschrieben haben. Die Phasenänderung 21
S. Shapiro, Phys. Rev. Letters 11, 80 (1963).
468
21 Die Schrödinger-Gleichung in einem klassischen Kontext
auf dem unteren Weg kann analog dazu geschrieben werden als 2qe A · ds. ΔPhaseP→Q = δb + unterer Weg
(21.50)
Diese zwei Phasendifferenzen müssen gleich sein, und wenn ich sie voneinander subtrahiere, erhalte ich, dass die Differenz der Deltas das Linienintegral von A entlang des Kreises sein muss: 2qe δb − δa = A · ds. Γ Hier erstreckt sich das Integral über die geschlossene Schleife Γ von Abbildung 21.7, die durch beide Übergänge verläuft. Das Integral über A ist der magnetische Fluss Φ durch die Schleife. Daher unterscheiden sich δa und δb um 2qe / mal den magnetischen Fluss Φ, der zwischen den beiden Zweigen des Stromkreises hindurchgeht: δb − δa =
2qe Φ.
(21.51)
Man kann diese Phasendifferenz regeln, indem man das Magnetfeld durch den Stromkreis verändert. Damit ist es möglich, die Phasendifferenz einzustellen und zu sehen, ob der Gesamtstrom, der durch die zwei Übergänge fließt, eine Interferenz der zwei Anteile zeigt oder nicht. Der Gesamtstrom ist die Summe von Ja und Jb . Der Bequemlichkeit halber will ich schreiben δa = δ0 −
qe Φ,
δb = δ0 +
qe Φ.
Dann ist qe qe qe Φ . Jgesamt = J0 sin δ0 − Φ + sin δ0 + Φ = 2J0 sin δ0 cos
(21.52)
Nun wissen wir über δ0 gar nichts, und die Natur kann es sich den Umständen entsprechend einrichten, wie sie will. Insbesondere hängt δ0 von der äußeren Spannung ab, die wir an die Übergangszone anlegen. Doch ganz gleich, was wir machen, sin δ0 kann nie größer als eins werden. Daher ist für jedes gegebene Φ der maximale Strom gegeben durch qe Φ . Jmax = 2J0 cos
Dieser maximale Strom ändert sich mit Φ und hat jedes Mal ein Maximum, wenn gilt Φ=n
π , qe
wobei n eine ganze Zahl ist. Das heißt, dass der Strom dort seine maximalen Werte annimmt, wo der Fluss gerade jene quantisierten Werte hat, die wir in (21.30) gefunden haben! Der Josephson-Strom durch einen zweifachen Übergang wurde als Funktion des Magnetfeldes im Gebiet zwischen den Übergängen gemessen.22 Die Ergebnisse sind in Abbildung 21.8 22
Jaklevic, Lambe, Silver und Mercereau, Phys. Rev. Letters 12, 159 (1964).
469
Josephson-Strom (Einheiten willkürlich)
21.9 Der Josephson-Übergang
−500
−400
−300
−200
−100
0
100
200
300
400
500
Magnetfeld (Milligauß)
Abb. 21.8: Eine Aufzeichnung des Stroms durch ein Paar von Josephson-Übergängen als Funktion des Magnetfeldes im Gebiet zwischen den beiden Übergängen (siehe Abbildung 21.7). (Diese Aufzeichnung stammt von R. C. Jaklevic, J. Lambe, A. H. Silver und J. E. Mercereau vom Scientific Laboratory, Ford Motor Company.)
gezeigt. Es gibt einen allgemeinen Hintergrundstrom von verschiedenen Phänomenen, die wir nicht berücksichtigt haben, doch sind die schnellen Oszillationen des Stroms mit den Änderungen im Magnetfeld eine Folge des Interferenzterms cos(qe Φ/) in (21.52). Eine höchst interessante Frage der Quantenmechanik ist die, ob das Vektorpotential auch an einem feldfreien Ort existiert.23 Dieses Experiment, das ich gerade beschrieben habe, ist auch mit einer kleinen Spule zwischen den beiden Übergängen ausgeführt worden, sodass das einzige bedeutende magnetische B-Feld innerhalb der Spule ist und nur ein vernachlässigbarer Anteil auf den supraleitenden Drähten selbst. Es wurde jedoch beobachtet, dass die Stromstärke oszillatorisch von dem Fluss des Magnetfeldes innerhalb dieser Spule abhängt, obwohl das Feld niemals die Drähte berührt – wieder eine Demonstration der „physikalischen Realität“ des Vektorpotentials.24 Ich weiß nicht, was die Zukunft bringt, aber wir können uns überlegen, was möglich ist. Zunächst einmal könnte die Interferenz zwischen zwei Josephson-Übergängen verwendet werden, um ein empfindliches Magnetometer herzustellen. Wenn ein Paar von Übergängen mit einem umschlossenen Gebiet von 1 mm2 verwendet werden, liegen die Maxima der Kurve in Abbildung 21.8 um 2 × 10−6 Gauß auseinander. Es ist sicherlich möglich anzugeben, wann sie bei 1/10 des Weges zwischen zwei Maxima sind; daher sollte es möglich sein, mit einem solchen Übergang schwache Magnetfelder in der Größenordnung von 2 × 10−7 Gauß zu messen, ebenso stärkere Felder mit der genannten Genauigkeit. Man sollte sogar noch weiter gehen können. Nehmen wir zum Beispiel an, wir setzen ein System von 10 oder 20 Übergängen mit gleichem Abstand eng zusammen. Dann können wir die Interferenz zwischen 10 oder 20 Spalten erhalten und werden, wenn wir das Magnetfeld ändern, sehr scharfe Maxima und Minima erhalten. 23 24
Jaklevic, Lambe, Silver und Mercereau, Phys. Rev. Letters 12, 274 (1964). Siehe Band III, Kapitel 15, Abschnitt 15.5.
470
21 Die Schrödinger-Gleichung in einem klassischen Kontext
Anstelle einer Zweispaltinterferenz können wir ein 20- oder sogar ein 100-Spalt-Interferometer zur Messung des Magnetfeldes konstruieren. Vielleicht können wir vorhersagen, dass die Messung der Magnetfelder – unter Benutzung quantenmechanischer Interferenz – schließlich fast so genau werden wird wie die Messung der Wellenlänge des Lichts. Dies sind Schilderungen von einigen Entwicklungen, die sich in neuerer Zeit abspielen – der Transistor, der Laser und nun diese Übergänge, deren konkreten praktischen Anwendungen noch nicht bekannt sind. Die Quantenmechanik, die im Jahre 1926 formuliert wurde, hat eine Entwicklung von fast 40 Jahren hinter sich, und es fing recht plötzlich an, dass man sie in vielen praktischen und realen Fällen ausnutzte. Wir erhalten die Kontrolle über die Natur auf einem sehr feinen und nützlichen Niveau. Allerdings muss ich Sie darauf hinweisen, dass Sie, um an dieser faszinierenden Entwicklung teilhaben zu können, so schnell wie möglich die Quantenmechanik erlernen müssen. Es war unser Anliegen, mit dieser Vorlesung einen Weg zu ebnen, der Ihnen möglichst früh einen Zugang zu diesem Gebiet der Physik verschafft.
Feynmans Epilog Nun habe ich zwei Jahre lang zu Ihnen gesprochen und werde jetzt damit aufhören. Einerseits möchte ich mich entschuldigen und andererseits wieder nicht. Ich hoffe – ja, ich weiß –, dass zwei oder drei Dutzend von Ihnen allem mit großer Spannung folgen konnten und eine angenehme Zeit damit verbracht haben. Aber ich weiß auch, dass „die Kräfte der Lehre von sehr geringer Wirksamkeit sind, außer unter jenen glücklichen Umständen, in denen sie praktisch überflüssig sind.“ Daher darf ich im Hinblick auf die zwei oder drei Dutzend, die alles verstanden haben, sagen, dass ich nichts anderes getan habe, als Ihnen die Physik nahezubringen. Was die anderen betrifft, tut es mir leid, wenn ich Ihren Widerwillen gegen dieses Fachgebiet erregt haben sollte. Ich habe niemals vorher elementare Physik unterrichtet und ich bitte Sie um Entschuldigung. Ich hoffe nur, dass ich Sie nicht ernsthaft verwirrt habe und dass Sie dieses interessante Studium nicht aufgeben. Ich hoffe, dass ein Anderer es Ihnen so beibringen kann, dass es Ihnen nicht im Magen liegt, und dass Sie trotz allem eines Tages feststellen, dass es nicht so schrecklich ist, wie es aussieht. Zum Schluss darf ich noch hinzufügen, dass es nicht das Hauptziel meiner Vorlesungen war, Sie auf irgendeine Prüfung vorzubereiten – ich wollte Sie auch nicht für die Arbeit in der Industrie oder beim Militär vorbereiten. Ich wollte Ihnen vor allem ein Verständnis für die wunderbare Welt vermitteln und dafür, wie sie der Physiker betrachtet, was, wie ich glaube, ein wesentlicher Teil der wahren Kultur in der modernen Zeit ist. (Es gibt wahrscheinlich Professoren anderer Fachgebiete, die Einspruch erheben werden, aber ich glaube, dass sie im Unrecht sind.) Vielleicht haben Sie nicht nur ein Verständnis für diese Kultur gewonnen; es ist sogar möglich, dass Sie sich dem größten Abenteuer, auf das sich der menschliche Geist je eingelassen hat, anschließen wollen.
Index Band V 21-Zentimeter-Linie, 245 Absorption, 58, 173 Adjungierte, 231 Akzeptor, 284 algebraische Gleichungen, 421 algebraischer Operator, 428 Ammoniak-Maser, 155 Ammoniakmolekül, 148, 155 Amplituden, 17, 135 interferierende, 85 Ortsabhängigkeit der, 262, 317 Transformation von, 95 Wahrscheinlichkeits-, 13, 33, 317 Zeitabhängigkeit der, 117 angeregter Zustand, 268 Antimaterie, 222 Antiproton, 218 Antiteilchen, 218 Argon, 417 assoziierte Legendre-Funktionen , 407 Äthylenmolekül, 307 atomare Prozesse, Paritätserhaltung, 365 Atomuhr, 173 Ausbreitung im Kristallgitter, 257 Ausschließungsprinzip, 66 Bahndrehimpuls, 395 Baryonenzahl, Erhaltung, 218 Basiszustände, 82, 233 der Welt, 141 Benzolmolekül, 190, 305 Beugung an Kristallen, 22 bohrscher Radius, 26, 398, 402 bohrsches Magneton, 248 Boltzmann-Konstante, 282 Boltzmann-Theorie, 454 Bor, 417 Bose-Teilchen, 49, 304 Butadienmolekül, 311
Chlorophyllmolekül, 312 Clebsch-Gordan-Koeffizienten, 385 Diamantgitter, 277 Donator, 283 Doppelspalt, Interferenz, 38 Doppler-Effekt, 25, 245 Drehimpuls, 438 Bahn-, 395 Zusammensetzen von, 382 Drehmatrix, 99 dreidimensionales Gitter, 266 dynamischer Impuls, 450 effektive Masse, 266 Eigenwert, 230 Eigenzustand, 230 eindimensionales Gitter, 257 Einheitsmatrix, 203 Einheitszelle, 23 Einstein-Koeffizienten, 60, 174 Einstein-Podolsky-Rosen-Paradoxon, 375 elektrische Ladungsdichte, 452 elektrische Stromdichte, 452 Elektron, 1, 5 Elektron-Loch-Paare, 281 Elektronenkonfiguration, 418 Emission, 58 Energie, potentielle, 124 Energie, Rydberg-, 181 Energie, Zustände mit bestimmter, 260 Energiediagramm, 278 Energieerhaltung, 124 Energieniveaudiagramm, 281 Energieniveaus, 27, 242 EPR-Paradoxon, 375 Erhaltung Baryonenzahl, 218 Energie, 124, 218
474 Strangeness, 217 Exziton, 269 Farbstoffe, 193 Fermi-Teilchen, 49, 305 ferromagnetischer Kristall, 297 Fluor, 417 flüssiges Helium, 66 Flussquantisierung, 458 Gallium, 419 Gauß-Verteilung, 326 gaußscher Satz, 450 Gesetze der Quantenmechanik, 33 Gitter dreidimensionales, 266 eindimensionales, 257 Gleichrichtung, Halbleiter-Übergang, 292 Grundzustand, 118, 233 Halbleiter, 277 unreine, 283 von n-Typ, 284 von p-Typ, 284 Halbleiter-Übergang, 288, 292 Hall-Effekt, 286 Hamilton-Matrix, 147 Hauptquantenzahl, 411 Helium, 415 flüssiges, 66 hermitesch adjungierter Operator, 424 Hyperfeinaufspaltung im Wasserstoff, 233 identische Teilchen, 33, 49 Impuls, 18 Dreh-, 438 dyamischer, 450 kinematischer, 450 Impulsoperator, 423, 432 Interferenz am Doppelspalt, 38 interferierende Amplituden, 85 interferierende Wellen, 4 Ion des Wasserstoffmoleküls, 177 Ionisierungsenergie von Wasserstoff, 26 Josephson-Übergang, 464 Kalium, 419
Index Band V Kernkräfte, 184 kinematischer Impuls, 450 klassischer Grenzfall, 128 Kristall, ferromagnetischer, 297 Kristallgitter Ausbreitung im, 257 Fehlerstellen, 270 Krypton, 419 Kugelfunktionen, 404, 407 kugelsymmetrische Lösungen, 397 Ladungsdichte, elektrische, 452 Ladungsträger, 279 Laser, 171 Legendre-Funktionen, 407 Legendre-Polynome, 381, 407 Leitungsband, 277 Lichtabsorption, 173 Lithium, 415 Magenta, 193 magnetisches Moment, 206 Magnonen, 304 Maser, Ammoniak-, 155 Masse, effektive, 266 Matrix, 78 Matrixelement des elektrischen Dipols, 175 Matrizenrechnung, 90, 204, 443 Meissner-Effekt, 455, 461 Moment, magnetisches, 206 mv-Impuls, 450 n-Typ-Halbleiter, 284 Näherung unabhängiger Teilchen, 297 Natrium, 417 negative Ladungsträger, 279 Neon, 417 neutrales K-Meson, 217 neutrales Pion, 185 Normalverteilung, 326 Nukleon, 204 ohmsches Gesetz, 286 Operator, 140, 421 algebraischer, 428 hermitesch adjungierterer, 424 Impuls-, 423, 432
Index Band V Ortsabhängigkeit der Amplitude, 262 Pauli-Matrizen, 201 Periodensystem, 414 Photon, 10, 58 Absorption, 58 Emission, 58 Polarisationszustände des, 212 p-Impuls, 450 Pion, neutrales, 185 plancksches Wirkungsquantum, 14, 440, 446 Polarisationszustände des Photons, 212 positive Ladungsträger, 279 potentielle Energie, 124 Präzession eines Spin- 21 -Teilchens, 131 Quantenmechanik, 1, 17, 33 und Vektorpotential, 446 quantenmechanische Resonanz, 181 Quantenzahlen, 252 Radius, bohrscher, 26, 398, 402 Resonanz, quantenmechanische, 181 ritzsches Kombinationsprinzip, 28 Röntgenbeugung, 23 Röntgenstrahlen, 22 Rydberg (Einheit), 26 Rydberg-Energie, 181, 398 Schrödinger-Gleichung, 321, 331 im klassischen Kontext, 445 Wasserstoffatom, 395 schwarzer Körper, Spektrum, 60 Sehen, 269 Sigma-Elektron, 237 Sigma-Matrizen, 202 Sigma-Proton, 237 Sigma-Vektor, 205 Spektrum des schwarzen Körpers, 60 sphärisch symmetrische Lösung, 397 Spin- 21 -Teilchen, 95, 233 Präzession von, 131 Spin eins, 73 Spinaustauschoperator, 242, 298 Spinbahnwechselwirkung, 316 Spinwellen, 297 Stäbchenzellen, 269
475 stationärer Zustand, 117, 230 Stern-Gerlach-Apparat, 73 Strangeness, 217 Streuamplituden, 274 Stromdichte, elektrische, 452 Supraleitfähigkeit, 453 Teilchen Bose-, 49, 304 Fermi-, 49, 305 identische, 33, 49 Spin- 21 -, 95, 233 Spin eins, 73 Tensoralgebra, 139 Transformation von Amplituden, 95 Transistor, 294 Triphenylzyklopropenyl, 315 Übergang, 288 Unbestimmtheitsprinzip, 11, 14, 20, 22, 28 unreine Halbleiter, 283 Vektor, 135 Vektoralgebra, 92, 136, 139 Vektorpotential, 446 Vertauschungsregel, 440 Wahrscheinlichkeitsamplitude, 13, 33, 317 Wahrscheinlichkeitsdichte, 323 Wahrscheinlichkeitsverteilung, 323 Wasserstoff, 415 Hyperfeinaufspaltung im, 233 Ionisierungsenergie, 26 Wasserstoffatom, 395 Wasserstoffmolekül, 187 Wasserstoffwellenfunktionen, 411 Wellen, interferierende, 4 Wellenfunktion, 322 Bedeutung der, 452 Wellenknoten, 129 Wellenpaket, 265 Yukawa-Potential, 185 Zeemann-Aufspaltung, 245 zeitabhängige Zustände, 265 Zeitabhängigkeit der Amplituden, 117 Zentrifugalkraft, 410, 414
476 Zink, 419 Zustand angeregter, 268 bestimmter Energie, 260 Eigen-, 230 Grund-, 118
Index Band V stationärer, 117, 230 zeitabhängiger, 265 Zustandsvektor, 137 Zerlegung von, 137 Zweizustandssystem, 177, 201
Gesamtindex 21-Zentimeter-Linie, V-245 Aberration, II-24, II-125 chromatische, II-24 sphärische, II-24, II-149 Ableitung, I-109 partielle, I-204 absoluter Nullpunkt, I-7, I-22, II-286 Absorption, II-77, V-58, V-173 Absorptionskoeffizient, IV-73 Acetylcholin, I-33 Actomyosin, I-33 Adenin, I-38 adiabatische Entmagnetisierung, IV-133 adiabatische Expansion, II-278 adiabatische Kompression, II-201 Adjungierte, V-231 aktives Schaltelement, III-401 Aktivierungsenergie, I-35, II-251 Akzeptor, V-284 Algebra, I-297 Vierervektoren, I-243 algebraische Gleichungen, V-421 algebraischer Operator, V-428 Alnico V, IV-156, IV-179 Ammoniak-Maser, V-155 Ammoniakmolekül, V-148, V-155 Amperemeter, III-280 ampèrescher Strom, IV-141 ampèresches Gesetz, III-229 Amplitude von Schwingungen, I-291 Amplituden, V-17, V-135 interferierende, V-85 Ortsabhängigkeit der, V-262, V-317 Transformation von, V-95 Wahrscheinlichkeits-, V-13, V-33, V-317 Zeitabhängigkeit der, V-117 Amplitudenmodulation, II-331 Analogrechner, I-346
angeregter Zustand, III-141, V-268 Ångstrom (Einheit), I-4 anomale Brechung, II-108 anomale Dispersion, II-77 antiferromagnetisches Material, IV-181 Antimaterie, II-398, V-222 Antiproton, V-218 Antiteilchen, I-24, V-218 Äquipotentialflächen, III-71 äquivalente Schaltkreise, III-411 Äquivalenzprinzip, einsteinsches, IV-275 Arbeit, I-179, I-193 Argon, V-417 assoziierte Legendre-Funktionen, V-407 Astronomie und Physik, I-39 Äthylenmolekül, V-307 Atom, I-3 Rutherford-Bohr-Modell, III-78 Stabilität des, III-78 Thomson-Modell, III-78 Atom, metastabiles, II-256 atomare Polarisierbarkeit, IV-65 atomare Prozesse, I-7 Paritätserhaltung, V-365 atomare Ströme, III-229 atomare Teilchen, I-24 atomare Umlaufbahnen, III-12 atomarer Strom, IV-67, IV-141 Atomhypothese, I-3 Atomuhr, I-63, V-173 Auflösungsvermögen, II-25, II-56 Auge, Facetten-, II-154 Auge, menschliches, II-129, II-148 Ausbreitung eines Feldes, III-323 Ausbreitung im Kristallgitter, V-257 Ausschließungsprinzip, V-66 Austauschkraft, IV-166 Avogadro-Zahl, II-241 axialer Vektor, I-279, II-393, II-398
478 Bahnbewegung, IV-107 Bahndrehimpuls, V-395 Bar (Einheit), II-319 Barkhausen-Effekt, IV-178 Baryonenzahl, Erhaltung, V-218 Basiszustände, V-82, V-233 der Welt, V-141 Batterie, III-404 beeinflusste Zukunft, I-242 Beleuchtung, III-218 Benzolmolekül, 305, V-190 Bernoulli-Theorem, IV-232 Bernstein, III-15, IV-184 Beschleunigung, I-113 Gravitations-, I-122 Komponenten der, I-121 Winkel-, 252 Bessel-Funktion, III-433 Betatron, III-299, III-547 Beugung, II-49, IV-2 an einem Schirm, II-80 Röntgenstrahlen, II-59, II-187 Beugung an Kristallen, V-22 Beugungsgitter, II-44, II-53 Auflösungsvermögen, II-56 bewegte Ladung, Feldimpuls einer, III-518 Bewegung, I-57, I-103 brownsche, II-227, II-240, II-304, II-309 in gekrümmter Raumzeit, IV-280 harmonische, I-291, I-311 Kreis-, I-291 einer Ladung, III-537 parabolische, I-116 Planeten-, I-87, I-126, I-185 Zwangs-, I-195 Bewegungsgleichung, einsteinsche, IV-283 Bezirk, IV-172 Bildladung, III-103 Biologie und Physik, I-32 Biot und Savart, Gesetz von, III-254, III-385 Blindwiderstand, III-413 Blitz, III-166 bohrscher Radius, II-189, V-26, V-398, V-402 bohrsches Magneton, IV-118, IV-133,
Gesamtindex IV-165, V-248 Boltzmann-Energie, IV-156 Boltzmann-Gesetz, II-213 Boltzmann-Konstante, II-241, III-125, V-282 Boltzmann-Theorie, V-454 Bor, V-417 Bose-Teilchen, V-49, V-304 boylesches Gesetz, II-223 „Boys“-Kamera, III-166 Bragg-Nye-Modell, IV-16 Brechung, II-2 anomale, II-108 von Licht, IV-83 Brechungsindex, II-67, IV-63 Bremsstrahlung, II-119 Brennpunkt, II-9, II-17 Brennweite Linse, II-19 sphärische Fläche, II-16 Brewster-Winkel, II-103 brownsche Bewegung, I-13, I-77, II-227, II-240, II-304, II-309 Bürstenentladung, III-165 Butadienmolekül, V-311 carnotscher Kreisprozess, II-278, II-293 Cavendish-Versuch, I-98 Chemie und Physik, I-31 chemische Bindung, IV-3 chemische Energie, I-46, I-54 chemische Kinetik, II-251 chemische Reaktion, I-10 Chlorophyllmolekül, V-312 chromatische Aberration, II-24 Clausius-Clapeyron-Gleichung, II-298 Clausius-Mossotti-Formel, III-195, IV-71 Clebsch-Gordan-Koeffizienten, V-385 Coriolis-Kraft, I-271, I-281, II-378, II-388, IV-112 Cornea, II-129, II-148 Cornu-Spirale, II-61 Couette-Strömung, IV-258 coulombsches Gesetz, II-29, III-3, III-9, III-56, III-57, III-69, III-84 Curie-Temperatur, IV-160, IV-162, IV-165, IV-170, IV-179
Gesamtindex Curie-Weiss-Gesetz, III-199 curiesches Gesetz, III-191 Cytosin, I-38 Dämpfung, II-78 d’Alembert-Operator, III-473 Debye-Länge, III-126 Dehnung, IV-186 Dehnungstensor, IV-205 Diamagnetismus, IV-103, IV-109 Diamantgitter, V-277 Dichte, I-5 Wahrscheinlichkeits-, I-81 Dielektrikum, III-171, III-185 Dielektrizitätskonstante, III-171 Differentialrechnung, I-108, III-17 Diffusion, II-257 von Neutronen, III-212 Diffusionsgleichung, für Neutronen, III212 Dipol elektrischer, III-92 magnetischer, III-250 molekularer, III-185 schwingender, III-381 Dipolmoment, I-168, III-94 magnetisches, III-252 Dipolpotential, III-95 Dipolstrahler, II-32, II-41 Dirac-Gleichung, I-283 Dispersion, II-74 anomale, II-77 normale, II-77 Dispersionsrelation, II-74 Divergenz (Operator), III-26, III-35 für Vierervektoren, III-471 DNS, I-37 Donator, V-283 Doppelbild, II-149 doppelbrechendes Material, II-108, IV-87, IV-216 Doppelbrechung, II-99, II-108 Doppelspalt, Interferenz, V-38 Doppelsterne, I-94 Doppler-Effekt, I-248, I-324, II-120, II-189, IV-278, V-25, V-245 Drehimpuls, I-96, I-251, I-255, I-275, V-438
479 Bahn-, V-395 des starren Körpers, I-285 Erhaltung, I-54, I-257, I-280 Zusammensetzen von, V-382 Drehimpuls, Licht, II-110 Drehmatrix, V-99 Drehmoment, I-253, I-275 Drehstrom, III-290 Drehung ebene, I-249 eines starren Körpers, I-251 im Raum, I-275 von Achsen, I-148 dreidimensionale Wellen, III-365 dreidimensionales Gitter, V-266 Dreikörperproblem, I-131 Druck, I-5 eines Gases, II-197 hydrostatischer, IV-226 durchgelassene Wellen, IV-93 Dynamik, I-89, I-117 Drehung, I-251 relativistische, I-218 dynamischer Impuls, V-450 ebene Wellen, III-355 ebenes Gitter, IV-8 effektive Masse, V-266 Eigenschwingung, III-438 Eigenwert, V-230 Eigenzustand, V-230 einatomiges Gas, II-200, II-208, II-221 eindimensionales Gitter, V-257 Eindringtiefe, IV-78 Einfallswinkel, II-3, IV-83 einflussnehmende Vergangenheit, I-242 eingespannter Balken, IV-199 Einheitsmatrix, V-203 Einheitsvektor, I-159, III-20 Einheitszelle, II-187, V-23 Einschwingverhalten, I-295 Einschwingvorgang, I-325 elektrischer, I-330 Einstein-Koeffizienten, V-60, V-174 Einstein-Podolsky-Rosen-Paradoxon, 375 einsteinsche Bewegungsgleichung, IV-283
480 einsteinsche Feldgleichung, IV-284 einsteinsche Gravitationstheorie, IV-283 einsteinsches Äquivalenzprinzip, IV-274 Elastika, IV-203 elastische Energie, I-46, I-54 elastische Konstanten, IV-212 elastische Materialien, IV-205 elastischer Stoß, I-141 Elastizität, IV-185 Elastizitätstensor, IV-209 Elektret, III-196 elektrische Energie, I-46, I-54, I-142, III-261 elektrische Kräfte, III-1, III-223 in relativistischer Notation, III-463 elektrische Ladungsdichte, III-27, III-58, III-82, V-452 elektrische Stromdichte, III-27, III-224, V-452 elektrische Suszeptibilität, III-176 elektrischer Dipol, III-99 elektrischer Fluss, III-7 elektrischer Generator, III-279, III-401 elektrischer Strom, III-224 in der Atmosphäre, III-153 elektrisches Feld, I-19, I-169, III-3, III-4, III-115 Relativität, III-232 elektrisches Potential, III-59 Elektrodynamik, III-4 in relativistischer Notation, III-463 Elektromagnet, IV-153 elektromagnetische Energie, II-39 elektromagnetische Masse, III-520 elektromagnetische Strahlung, II-1, II-27, II-28, II-37 elektromagnetische Wellen, I-21, II-1, III-355, III-375 elektromagnetisches Feld, I-17, I-20, I-21, I-143 Elektromagnetismus, III-2 Gesetze des, III-8 Elektromotor, III-279 elektromotorische Kraft, III-282 Elektron, I-19, II-165, II-170, V-1, V-5 Ladung des, I-170 Radius, klassischer, II-87
Gesamtindex Elektron, klassischer Radius, III-520 Elektron-Loch-Paare, V-281 Elektronenkonfiguration, V-418 Elektronenmikroskop, III-542 Elektronenpolarisation, III-186 Elektronenstrahlröhre, I-172 Elektronenvolt (Einheit), II-116 Elektronenwolke, I-86 Elektrostatik, III-55, III-75 elektrostatische Energie, III-131 einer Punktladung, III-148 eines Ionenkristalls, III-137 in Kernen, III-140 von Ladungen, III-131 elektrostatische Gleichungen, III-178 elektrostatische Linse, III-540 elektrostatisches Feld, III-75, III-115 eines Gitters, III-128 Energie im, III-145 elektrostatisches Potential, III-92 Ellipse, I-88 Emission, V-58 Emissionsvermögen, III-112 Energie, I-45, III-413 magnetische, III-311 chemische, I-46, I-54 eines Kondensators, III-133 elastische, I-46, I-54 elektrische, I-46, I-54, I-142, III-261 elektromagnetische, II-39 elektrostatische, III-131, III-137 Erhaltung der, III-499 Gravitations-, I-46 im elektrostatischen Feld, III-145 Kern-, I-46 kinetische, I-11, I-22, I-46, I-52, I-270, II-200, II-202 Massen-, I-46 mechanische, III-261 potentielle, I-47, I-179, I-193, V-124 relativistische, I-223 Rydberg-, V-181 Strahlungs-, I-46, I-54, I-101, I-142 Wärme-, I-46, I-140, I-142 Zustände mit bestimmter, V-260 Energiediagramm, V-278 Energiedichte, III-500
Gesamtindex Energieerhaltung, I-33, I-45, IV-278, V-124 Energiefluss, III-501 Energieniveaudiagramm, V-281 Energieniveaus, II-190, V-27, V-242 harmonischer Oszillator, II-225 Energiesatz, II-365 Entfernung, I-64 Entfernungsmessung Farbhelligkeit, I-65 Triangulation, I-64 Enthalpie, II-297 Entmagnetisierung, adiabatische, IV-133 Entropie, II-286, II-312 EPR-Paradoxon, V-375 Erhaltung Baryonenzahl, V-218 Drehimpuls, I-54, I-257, I-280 Impuls, I-54, I-131 Ladung, I-55, III-225 Energie, I-33, I-45, III-499, V-124, V-218 Strangeness, V-217 euklidische Geometrie, I-1, I-163, I-176, I-239 Euler-Kraft, IV-202 Expansion adiabatische, II-278 isotherme, II-277 exponentionelle Atmosphäre, II-211 Exzessradius, IV-269, IV-284 Exziton, V-269 Facettenauge, II-154 Farad (Einheit), I-345, III-109 faradaysches Induktionsgesetz, III-296, III-317, III-328 Farbdiagramm, II-137 Farbensehen, II-129, II-141, II-145 Farbstoffe, V-193 Feld, I-169 eines geladenen Leiters, III-102 eines Leiters, III-86 elektrisches, I-19, I-169, III-3, III-4, III-75, III-115 elektromagnetisches, I-17, I-20, I-21, I-143
481 elektrostatisches, III-75, III-115 Gravitations-, I-188 in einem Hohlraum, III-88 magnetisches, I-173, III-3, III-4, III-223, III-241 und Potential, I-202 Relativität, III-232 skalares, III-19 Superposition, I-172 Vektor-, III-5, III-6, III-18 zweidimensionales, III-116 Feld, magnetisierendes, IV-149 Feldemissionsmikroskop, III-111 Feldenergie, III-499 einer Punktladung, III-517 Feldgleichung, einsteinsche, IV-284 Feldimpuls, III-511 einer bewegten Ladung, III-518 Feldindex, III-546 Feldlinien, III-71 Feldstärke, III-5 fermatsches Prinzip, II-4 Fermi (Einheit), I-69 Fermi-Teilchen, V-49, V-305 Ferrite, IV-182 Ferroelektrizitat, III-197 ferromagnetische Isolatoren, IV-182 ferromagnetische Materialien, IV-178 ferromagnetischer Kristall, V-297 Ferromagnetismus, IV-103, IV-139, IV-165 Festkörperphysik, III-139 Filter, III-417 Fläche, gaußsche, III-172 Fluor, V-417 Fluss, III-6, III-37, III-64 eines Vektorfeldes, III-37 elektrischer, III-8 flüssiges Helium, V-66 Flüssigkeitsströmung, III-214 Flussquantisierung, V-458 Flussregel, III-295 Fortpflanzungsfaktor, III-418 Fotosynthese, I-34 foucaultsches Pendel, I-225 Fourier, Theorem von, III-128 Fourier-Transformation, I-339 Fourieranalyse, II-357, II-361
482 Fovea, II-129, II-142 Freiheitsgrade, I-336, II-210, II-211 Frequenz Kreis-, I-291 Larmor-, IV-111 Plasma-, III-123, IV-79 Schwingungs-, I-20 fresnelsche Reflexionsformeln, II-107 Führungsfeld in Beschleunigern, III-544 g-Faktor von Kernen, IV-107 Galilei-Transformation, I-175, I-209 galileische Relativität, I-134, I-139 Gallium, V-419 Galvanometer, III-13, III-280 Gammastrahlen, I-21 Gas, einatomiges, II-200, II-208, II-221 Gasdruck, II-197 Gauß (Einheit), IV-147 Gauß-Verteilung, I-83, V-326 gaußsche Fläche, III-172 gaußscher Satz, III-40 gaußsches Gesetz, III-68 Anwendung, III-75 gaußscher Satz, V-450 Gauß (Einheit), II-116 gebogener Balken, IV-197 gedämpfte Schwingung, I-327 geführte Wellen, III-443 Gegeninduktivität, III-307, III-422 Gegenkapazität, III-423 gekoppelte Pendel, II-350 gekrümmter Raum, IV-263, IV-268, IV-272 geladener Leiter, III-102, III-133 gelber Fleck, II-129, II-142 Generator elektrischer, III-279, III-401 Van-de-Graaff-, III-89, III-141 Wechselstrom, III-303 Geologie und Physik, I-40 geometrische Optik, II-1, II-15 Geräusch, II-356 gerichtetes magnetisches Moment, IV-124 Geschwindigkeit, I-106, I-119 Komponenten der, I-120 Licht-, I-207, III-328 Paradoxien, I-106
Gesamtindex Transformation der, I-227 Winkel- , I-252 Geschwindigkeitspotential, III-215 Gesetze der Induktion, III-295 des Elektromagnetismus, III-8 der Quantenmechanik, V-33 der Thermodynamik, II-271 gestreifter Muskel, I-194 Gewitter, III-157 Gezeiten, I-92 Gitter dreidimensionales, V-266 eindimensionales, V-257 glatter Muskel, I-194 Gleichgewicht, I-9 Gleichrichter, III-419 Gleichrichtung, II-366 Gleichrichtung, Halbleiter-Übergang, V-292 Gleichzeitigkeit, I-217 Gleitversetzung, IV-14 Gradient, III-21, III-35 Granat, IV-182 Gravitation, I-18, I-87, I-162, I-183, IV-263, IV-274 Gravitationsbeschleunigung, I-122 Gravitationsenergie, I-46 Gravitationsfeld, I-171, I-188 Gravitationskonstante, I-98 Gravitationstheorie, einsteinsche, IV-283 greensche Funktion, I-340 Grenzfrequenz, III-417 Grenzschicht, IV-257 Grundzustand, III-141, V-118, V-233 Gruppengeschwindigkeit, II-335 Guanin, I-38 haidingersches Büschel, II-155 Halbleiter, V-277 unreine, V-283 von n-Typ, V-284 von p-Typ, V-284 Halbleiter-Übergang, V-288, V-292 Hall-Effekt, V-286 Hamilton-Matrix, V-147
Gesamtindex hamiltonsche erste Prinzipalfunktion, III-345 Harmonische, II-355 harmonische Bewegung, I-291, I-311 harmonischer Oszillator, I-131, I-288, II-225 angetriebener, I-294, I-311 Hauptquantenzahl, V-411 Helium, I-7, I-39, II-350, V-415 flüssiges, V-66 Helmholtz-Theorem, IV-241 Henry (Einheit), I-344 hermitesch adjungierter Operator, V-424 hexagonales Gitter, IV-11 Hochspannungsdurchschlag, III-110 Hohlleiter, III-443, III-444 Hohlraumresonator, III-433 hookesches Gesetz, I-169, III-180, IV-21, IV-59, IV-185, IV-209, IV-218 Hornhaut, II-129, II-148 Hydrodynamik, IV-228 Hydrostatik, IV-225 hydrostatischer Druck, IV-226 Hysteresekurve, IV-150, IV-171 ideales Gasgesetz, II-208 identische Teilchen, V-33, V-49 Impedanz, I-346, III-395 komplexe, I-319 des Vakuums, II-85 Impuls, I-117, I-131, II-182, V-18 des Lichts, II-126 Dreh-, I-96, I-255, I-275, I-279, V-438 dyamischer, V-450 kinematischer, V-450 quantenmechanischer, I-143 relativistischer, I-142, I-223 Impulserhaltung, I-54, I-133, I-136 Impulsoperator, V-423, V-432 Impulsspektrometer, III-538 Impulsspektrum, III-539 Induktionsgesetze, III-295 Induktionsspule, I-344 Induktivität, I-318, III-284, III-311, III-396 Gegen-, III-307, III-422 Selbst-, III-285, III-310 induzierte Ströme, III-280
483 Infrarotstrahlung, I-21, I-321, II-1 innere Krümmung, IV-270 innere Reflexion, IV-100 Integral, I-111 Integralrechnung, III-35 Interferenz, II-34, II-37 und Beugung, II-49 am Doppelspalt, V-38 interferierende Amplituden, V-85 interferierende Wellen, II-169, V-4 Interferometer, I-213 Ion, I-9 Ion des Wasserstoffmoleküls, V-177 Ionenbindung, IV-3 Ionenkristall, III-137 Ionenleitfähigkeit, II-264 Ionenpolarisierbarkeit, III-197 Ionisationsenergie, II-249 von Wasserstoff, II-190, V-26 Ionosphäre, III-122 Irreversibilität, II-309 Isolator, III-3, III-171 Isothermalflächen, III-19 Isotherme, III-19 isotherme Atmosphäre, II-213 isotherme Expansion, II-277 isotherme Kornpression, II-278 Isotope, I-36, II-208 johnsonsches Rauschen, II-230, II-237 Josephson-Übergang, V-464 Joule (Einheit), I-182 joulesche Wärme, I-326 Kalium, V-419 Kapazität, I-317, III-108 eines Kondensators, III-133 Gegen-, III-423 Kapillarwirkung, II-381 kármánsche Wirbelstraße, IV-255 Katalysator, II-253 keplersche Gesetze, I-88, I-117, I-257 Kern, I-19, I-22, I-24 Kernenergie, I-46 Kernkräfte, I-176, III-2, III-140, III-530, III-532, V-184 Kernresonanz, magnetische, IV-134
484 Kernwechselwirkungen, III-141 Kernwirkungsquerschnitt, I-69 Kerr-Effekt, II-102 Kerr-Zelle, II-102 Kilokalorie (Einheit), III-138 kinematischer Impuls, V-450 kinetische Energie, I-11, I-22, I-46, I-52, II-200 der Drehbewegung, I-270 und Temperatur, II-202 kinetische Gastheorie, II-195, II-243 kirchhoffsche Gesetze, I-347, III-405, III-415 klassischer Elektronenradius, II-87, III-520 klassischer Grenzfall, V-128 kleinste Wirkung, Prinzip, III-333 Knarre und Sperrhaken Maschine, II-303 Knoten, II-344 Koaxialleitung, III-443 Koeffizient Absorptions-, IV-73 Viskositäts-, IV-246 Koeffizient des Gravitationsgesetzes, I-99 kolloidale Teilchen, III-124 komplexe Impedanz, I-319 komplexe Variable, III-116 komplexe Zahlen, I-305 und Schwingungen, I-311 Kompression adiabatische, II-201 isotherme, II-278 Kompressionsmodul, IV-189 Kondensator, I-205, I-317, III-107, III-398 bei hohen Frequenzen, III-427 Energie des, III-133 konservative Kraft, I-196 Kontraktionshypothese, I-213 Kopplungskoeffizient, III-313 kosmische Strahlung, I-21, III-153 kosmische Synchrotronstrahlung, II-118 kovalente Bindung, IV-4 Kraft Austausch-, IV-166 Coriolis-, I-271, I-281, II-378, II-388, IV-112
Gesamtindex elektrische, I-18, III-1, III-223 elektromotorische, III-282 Euler-, IV-202 Gravitations-, I-18 Kern-, I-176, III-2, III-140, III-530, III-532 Komponenten, I-120 konservative, I-196 Lorentz-, III-223, III-276 magnetische, I-174, III-3, III-223 Molekular-, I-167 Moment (Drehmoment), I-254 nichtkonservative, I-200 Schein-, I-174 Zentrifugal-, I-93, I-175, I-225, I-271, I-285, II-388, IV-112, IV-259 Zentripetal-, I-272 Kreisbewegung, I-291 Kreisel, I-281 Kreisfrequenz, I-291, II-40, II-346 Kreuzprodukt, III-27 Kristall, IV-1 chemische Bindung, IV-3 Geometrie, IV-1 Ionen-, III-137 Wachstum, IV-5 Kristall, ferromagnetischer, V-297 Kristallbeugung, 187 Kristallgitter, IV-5 Ausbreitung im, V-257 Fehlerstellen, V-270 Kristallklassen, IV-10 Kristallmodell von Bragg-Nye, IV-16 Kronecker-Symbol, IV-50 Krümmung im dreidimensionalen Raum, IV-270 in Raum und Zeit, IV-280 intrinsische, IV-270 mittlere, IV-271 von Oberflächen, IV-269 Krypton, V-419 kubisches Gitter, IV-11 Kugel, geladene, III-82 Kugelfunktionen, V-404, V-407 kugelsymmetrische Lösungen, V-397 Kugelwellen, III-370, III-377 kürzeste Zeit, Prinzip der, II-1, II-4, II-8
Gesamtindex Ladung des Elektrons, I-170 Ladung, Bewegung einer, III-537 Ladung, Polarisations-, III-175 Ladungsdichte, III-27, III-58, III-82 V-452 Ladungserhaltung, I-55, III-224 Ladungsträger, V-279 Ladungstrennung, III-162 Ladungsverteilung geladene Kugel, III-82 geladene Linie, III-79 geladene Schicht, III-80 Lagrange-Funktion, III-345 Lamb-Retherford-Messung, III-85 lamésche Elastizitätskonstanten, IV-212 landéscher g-Faktor, IV-107 Laplace-Gleichung, III-115 Laplace-Operator, III-31 Larmor-Frequenz, IV-111 larmorscher Satz, IV-111 Laser, I-59, II-90, II-256, V-171 Legendre-Funktionen, V-407 Legendre-Polynome, V-381, V-407 Leistung, I-181 Leiter, III-3 Leitfähigkeit, IV-76 ionische, II-264 thermische, II-269 Wärme-, III-28, III-205 Leitungsband, V-277 lenzsche Regel, III-285, IV-104 Licht, I-20, III-375 Brechung, IV-83 Geschwindigkeit des, III-328 Reflexion, IV-83 Licht, polarisiertes, II-94 Lichtabsorption, V-173 Lichtdruck, II-126 Lichtgeschwindigkeit, I-207 Lichtimpuls, II-126 Lichtkegel, I-241 Lichtstreuung, II-90 Lichtwellen, II-327 Liénard-Wiechert-Potential, III-391 lineare Systeme, I-335 lineare Transformation, I-153 Linie, geladene, III-79
485 Linienintegral, III-36 Linse elektrostatische, III-540 magnetische, III-541 Quadrupol-, III-119, III-547 Linsenformel, II-23 Lithium, V-415 Logarithmen, I-301 Lorentz-Formel, III-391 Lorentz-Gruppe, III-467 Lorentz-Kontraktion, I-216 Lorentz-Kraft, III-223, III-276 Lorentz-Transformation, I-209, I-237, II122, II-387, III-391, III-463 der Felder, III-479 Lorenz-Eichung, III-331, III-474 Luftkissenbahn, I-136 machsche Zahl, IV-254 Magenta, V-193 Magneteisenstein, III-15, IV-184 magnetische Energie, III-311 magnetische Induktion, I-174 magnetische Kernresonanz, IV-134 magnetische Kraft, I-174, III-3, III-223 eines Stroms, III-226 magnetische Linse, III-541 magnetische Materialien, IV-165 magnetische Resonanz, IV-125 magnetische Suszeptibilität, IV-130 magnetischer Dipol, III-250 magnetisches Dipolmoment, III-252 magnetisches Feld, I-173, III-3, III-4, III-223, III-241 Relativität, III-232 stationäre Ströme, III-227 magnetisches Moment, IV-105, V-206 magnetisierendes Feld, IV-149 Magnetisierungsströme, IV-139 Magnetismus, I-20, IV-103 Magnetostatik, III-55, III-223 Magnetostriktion, IV-173, IV-180 Magnonen, V-304 Maser, II-256 Maser, Ammoniak-, V-155 Masse, I-118, I-207 effektive, V-266
486 elektromagnetische, III-520 relativistische, I-230 Masse-Energie-Äquivalenz, I-220 Massenenergie, I-46, I-54 Massenmittelpunkt, I-249, I-261 Mathematik und Physik, I-31 Matrix, V-78 Matrixelement des elektrischen Dipols, V-175 Matrizenrechnung, V-90, V-204, V-443 maxwellsche Gleichungen, I-208, I-338, II-312, II-323, III-17, III-27, III-55, III-91, III-123, III-146, III-179, III-227, III-275, III-317, III-395, III-404, III-411, III-428, III-434, III-449, III-472, III-474, III-477, III-480, III-502, III-511, III-517, IV-68, IV-87, IV-114, IV-139, IV-142, IV-146, IV-158, IV-187, IV-216, IV-284 allgemeine Lösung, III-380 Dielektrikum, IV-66 in Anwesenheit von Strömen und Ladungen, III-375 in relativistischer Notation, III-494 Lösen der, III-329 Lösungen im leeren Raum, III-355 Modifikationen, III-524 für Vierervektoren, III-476 maxwellscher Dämon, II-309 mechanische Energie, III-261 Meissner-Effekt, V-455, V-461 menschliches Auge, II-129 metastabiles Atom, II-256 Meter (Einheit), I-70 MeV (Einheit), I-26 Michelson-Morley-Experiment, I-210 Mikroskop Elektronen-, III-542 Feldemissions-, III-111 Minkowski-Raum, IV-60 mittlere freie Weglänge, II-260 mittlere Krümmung, IV-271 mittlere quadratische Entfernung, I-78, II-239, II-240 Moden, II-350 Normal-, II-339
Gesamtindex Mol (Einheit), II-208 Molekül, I-4 nichtpolares, III-186 polares, III-186, III-189 Molekularbewegung, II-227 Molekulardiffusion, II-266 molekulare Anziehung, I-4, I-168 molekularer Dipol, III-185 Molekularkristall, IV-4 Moment Dipol-, I-168 Kraft-, I-253 Trägheits-, I-258, I-266 Moment, magnetisches, V-206 monoklines Gitter, IV-11 Mößbauer-Effekt, IV-280 Motor, elektrischer, III-279 Musik, II-356 mv-Impuls, V-450 n-Typ-Halbleiter, V-284 Nablaoperator, III-23 Näherung unabhängiger Teilchen, V-297 „nasses“ Wasser, IV-245 Natrium, V-417 negative Krümmung, IV-269 negative Ladungsträger, V-279 Neon, V-417 nernstsches Wärmetheorem, II-288 Netzhaut, II-129 neutrales K-Meson, V-217 neutrales Pion, V-185 Neutronen, I-19 Neutronen, Diffusion von, III-212 Newton (Einheit), I-152 Newton-Meter (Einheit), I-182 newtonsche Gesetze, I-22, I-90, I-102, I-117, I-131, I-147, I-149, I-155, I-161, I-175, I-179, I-200, I-207, I-218, I-225, I-233, I-249, I-262, I-275, II-30, II-195, II-197, II-208, II-227, II-303, II-310, II-317, III-121, III-333, IV-263, IV-283 nichtpolares Molekül, III-186 Nichtuniversalität, III-477 normale Dispersion, II-77
Gesamtindex Normalmoden, II-339 Normalverteilung, I-83, 326 Nukleon, V-204 Nullmasse, I-28 Nullpunkt, absoluter, I-7, I-22 numerische Analysis, I-123 Nutation, I-284 Oberflächenspannung, III-209 Oberschwingungen, II-355 Oersted (Einheit), IV-147 Ohm (Einheit), I-344 ohmsches Gesetz, I-318, I-344, II-265, III-353, V-286 Operator, V-140, V-421 algebraischer, V-428 Divergenz, III-26, III-35, III-471 Gradient, III-21, III-35 hermitesch adjungierterer, V-424 Impuls-, V-423, V-432 Laplace-, III-31 Nabla, III-23 Rotation, III-27, III-35 Vektor-, III-25 Optik, geometrische, II-1, II-15 optische Achse, II-100 optischer Nerv (Sehnerv), II-130 Orientierungspolarisation, III-189 orthorhombisches Gitter, IV-11 Ortsabhängigkeit der Amplitude, V-262 Oszillator, harmonischer, I-59, I-131, I-288 angetriebener, I-294, I-311 Pappus, Satz von, I-265 Parabolantenne, II-57 parabolische Bewegung, I-116 Parallel-Achsen-Satz, I-268 Paramagnetismus, IV-103, IV-121, IV-129, IV-130 paraxiale Strahlen, II-17 partielle Ableitung, I-204 pascalsches Dreieck, I-76 passives Schaltelement, III-401 Pauli-Matrizen, V-201 Pauli-Prinzip, IV-162 Pendel, foucaultsches, I-225 Pendel, gekoppelte, II-350
487 Pendeluhr, I-59 Periode der Schwingung, I-289 Periodensystem, V-414 Permalloy, IV-180 permanente Bewegung, II-304 Permeabilität, IV-152 Phase, I-289 Phasengeschwindigkeit, II-335 Phasenverschiebung, I-291 Photon, I-25, I-247, II-1, II-174, V-10, V-58 Absorption, V-58 Emission, V-58 Polarisationszustände des, V-212 Physik und Astronomie, I-39 und Biologie, I-32 und Chemie, I-31 und Geologie, I-40 und Mathematik, I-31 und Psychologie, I-41 vor 1920, I-17 Physiochemie des Farbensehens, II-141 Piezoelektrizität, III-197 p-Impuls, V-450 Pion, neutrales, V-185 plancksche Konstante, II-179 plancksches Wirkungsquantum, I-54, I-70, I-247, III-269, III-347, III-530, V-14, V-440, V-446 Planetenbewegung, I-87, I-126, I-185 Plasma, III-122 Plasmafrequenz, III-123, IV-79 Plasmaschwingungen, III-121 Plattenkondensator, I-205, III-107, 133 Poincaré-Spannung, III-522 Poisson-Gleichung, III-91 Poisson-Zahl, IV-187, IV-200 polarer Vektor, I-279, II-393 polares Molekül, III-186, III-189 Polarisation, II-99 von gestreutem Licht, II-99 von Materie, IV-63 zirkulare, II-98 Polarisationsladungen, III-175 Polarisationstensor, IV-43 Polarisationsvektor, III-173
488 Polarisationszustände des Photons, V-212 polarisiertes Licht, II-94 positive Krümmung, IV-269 positive Ladungsträger, V-279 Potential Quadrupol-, III-101 Vektor-, III-241, III-257 Vierer-, III-474 Potentialgradient der Atmosphäre, III-151 potentielle Energie, I-47, I-179, I-193, V-124 Poynting-Vektor, III-505, III-510 Präzession atomarer Magneten, IV-108 larmorsche, IV-111 Präzession eines Spin- 21 -Teilchens, V-131 Präzessionswinkel, IV-108 Prinzip der kleinsten Wirkung, III-333 der kürzesten Zeit, II-1, II-4, II-8 der Superposition, III-4, III-56 fermatsches, II-4 der Umkehrbarkeit, II-7, II-58 Unbestimmtheits-, I-84, I-102, II-176, II-179, II-184, II-192 der virtuellen Arbeit, I-52 Proton, I-19 Protonspin, III-140 Psychologie und Physik, I-41 Punktladung, III-2 elektrostatische Energie einer, III-148 Feldenergie einer, III-517 Purkinje-Effekt, II-131 Pyroelektrizität, III-197 quadratisches Mittel, I-79 Quadrupollinse, III-119, III-547 Quadrupolpotential, III-101 Quantenelektrodynamik, I-24, II-30, II-256 Quantenmechanik, I-17, I-21, I-84, I-143, II-165, II-181, V-1, V-17, V-33 und Vektorpotential, V-446 quantenmechanische Resonanz, V-181 quantenmechanischer Impuls, I-143 quantenmechanisches Vektorpotential, III-268 Quantenzahlen, V-252
Gesamtindex quantisierte magnetische Zustände, IV-117 quellenfreies Vektorfeld, III-50, III-56 Rabi-Molekularstrahl-Methode, IV-125 radioaktive Isotope, I-36, I-61, II-397 radioaktive Uhr, I-61 Radius des Elektrons, II-87 Radius, bohrscher, V-26, V-398, V-402 Randwertprobleme, III-115 Raum, I-17, I-105 gekrümmter, IV-263, IV-268, IV-272 Raumzeit, I-21, I-237, III-495 Raumzeit, Krümmung der, IV-280 Rayleigh-Gesetz, II-235 Rayleigh-Kriterium, II-56 Rayleigh-Wellen, IV-196 Reaktanz, III-413 reflektierte Wellen, IV-93 Reflexion, II-2 Reflexion, Total-, IV-100 von Licht, IV-83 Reflexionswinkel, II-3, IV-83 Reibung, I-136, I-164 Reibungskoeffizient, I-165 relative Permeabilität, IV-152 relativistische Dynamik, I-218 relativistische Energie, I-223 relativistische Masse, I-230 relativistischer Impuls, I-142, I-223 Relativität, I-102 elektrisches Feld, III-232 galileische, I-134, I-139 magnetisches Feld, III-232 Relativitätstheorie, I-237 spezielle, I-207 Resonanz, I-311 elektrische, I-316 in der Natur, I-320 quantenmechanische, V-181 Resonanzkreise, III-441 Resonanzwechselwirkung, I-27 Resonator, Hohlraum-, III-433 retardierte Zeit, II-29 Retina, II-129 Reversibilität, II-308 Reynolds-Zahl, IV-251
Gesamtindex ritzsches Kombinationsprinzip, II-191, V-28 Röntgenbeugung, II-59, II-187, III-137, IV-2, V-23 Röntgenstrahlen, I-21, II-75, II-334, V-22 Rotation (Operator), III-27, III-35 Rutherford-Bohr-Modell, III-78 Rydberg (Einheit), II-190, V-26 Rydberg-Energie, V-181, V-398 Saha-Gleichung, II-250 Schall, I-18, II-315, II-356, II-357 Schallgeschwindigkeit, II-324 Schaltelemente, III-425 aktive, III-401 passive, III-401 Schaltkreise äquivalente, III-411 Wechselstrom-, III-395 Scheinkraft, I-174 Scheinwiderstand (Impedanz), III-395 Schermodul, IV-191 Scherwelle, II-374, IV-193, IV-196 Schicht, geladene, III-80 schiefe Ebene, I-50 Schrödinger-Gleichung, III-273, V-321, V-331 im klassischen Kontext, V-445 Wasserstoffatom, V-395 schraubenförmige Versetzung, IV-14 Schraubenwinde, I-51 schwarzer Körper, Spektrum, V-60 Schwarzkörperstrahlung, II-234 schwingender Dipol, III-381 Schwingung Amplitude, I-291 Dauer, I-288 Frequenz, I-20 gedämpfte, I-327 periodische, I-122 Phase der, I-289 Sehen, II-145, V-269 Farben-, II-129, II-145 zweiäugiges, II-149 Sehpurpur, II-141 Sehrinde, II-150 Seismograph, II-376
489 Seitenbänder, II-331 Sekunde (Einheit), I-63 Selbstinduktivität, III-285, III-310 „seltsame“ Teilchen, III-141 Sigma-Elektron, V-237 Sigma-Matrizen, V-202 Sigma-Proton, V-237 Sigma-Vektor, V-205 sinusförmige Wellen, II-40 Skalar, I-151 skalares Feld, III-18 Skalarprodukt, I-157, III-22 für Vierervektoren, III-466 snelliussches Gesetz, II-3, II-10, II-70, IV-83 Solenoid, III-231 Spaltebene, IV-2 Spannung, IV-186 Volumen-, IV-189 Spannungstensor, IV-54 Spektrum des schwarzen Körpers, V-60 spezielle Relativitätstheorie, I-207 spezifische Wärme, II-221, IV-170 bei konstantem Volumen, II-293 klassische Physik, Versagen, II-223 sphärisch symmetrische Lösung, V-397 sphärische Aberration, II-24, II-149 Spin- 21 -Teilchen, V-95, V-233 Präzession von, V-131 Spin eins, V-73 Spin-Bahn-Kraft, III-140 Spinaustauschoperator, V-242, V-298 Spinbahnwechselwirkung, V-316 Spinell, IV-181 Spinwellen, V-297 spontane Emission, II-254 spontane Magnetisierung, IV-156 Stäbchenzellen, II-130, II-135, II-141, II-151, II-152, V-269 Standardabweichung, I-83 starrer Körper, I-249, I-275 Drehung des, I-251 Statik, III-55 stationäre Strömung, IV-232 stationärer Zustand, V-117, V-230 statistische Mechanik, I-32, II-211 statistische Schwankungen, I-73
490 Stefan-Boltzmann-Konstante, II-301 steinerscher Satz, I-268 Stepped leader, III-167 Stern-Gerlach-Versuch, IV-123, V-73 Stoß, I-230 elastischer, I-141 Stoßquerschnitt, II-261 stokesscher Satz, III-48 Strahlung Brems-, II-119 elektromagnetische, II-1, II-28, II-37 Gamma-, I-21 Infrarot-, I-21, I-321, II-1 kosmische, I-21 Licht-, I-20 relativistische Effekte, II-111 Röntgen-, I-21, II-1, II-75, II-334 Schwarzkörper, II-234 Synchrotron-, II-115, II-118 Tscherenkow-, II-370 Ultraviolett-, I-21, II-1 Strahlungsdämpfung, II-83 Strahlungsdruck, II-126 Strahlungsenergie, I-46, I-54, I-101, I-142, II-39 Strahlungswiderstand, II-83 Strangeness, I-25, V-217 Streuamplituden, V-274 Streuquerschnitt, II-92 thomsonscher, II-93 Streuung des Lichts, II-90 Strom ampèrescher, IV-141 atomarer, III-229, IV-67, IV-141 elektrischer, III-224 induzierter, III-280 Wärme-, III-19, III-28, III-204 Wirbel-, III-287 Stromdichte, III-224, V-452 Stromlinien, IV-232 Strömung einer Flüssigkeit, III-214 stationäre, IV-232 viskose, IV-249 wirbelfreie, III-214, IV-231 Supermalloy, IV-152 Superposition von Feldern, I-172
Gesamtindex Superpositionsprinzip, I-337, II-28, II-322, III-4, III-56, III-240 Supraleitfähigkeit, V-453 Suszeptibilität elektrische, III-176 magnetische, IV-130 Symmetrie, I-6, I-145 physikalischer Gesetze, I-225, II-385 Synchrotron, I-21, I-219, III-301, III-544, III-547 Synchrotronstrahlung, II-115 kosmische, II-118 Taylor-Entwicklung, III-101 Teilchen Bose-, V-49, V-304 Fermi-, V-49, V-305 identische, V-33, V-49 Spin- 21 -, V-95, V-233 Spin eins, V-73 Teilchen, „seltsame“, III-141 Temperatur, II-202 Tensor, III-490, IV-43 Dehnungs-, IV-205 Elastizitäts-, IV-209 höherer Stufe, IV-59 Polarisations-, IV-43 Spannungs-, IV-54 Trägheits-, IV-51 Transformation, IV-45 Verzerrungs-, IV-59, IV-205 Tensoralgebra, V-139 Tensorfeld, IV-59 tetragonales Gitter, IV-11 thermische Ionisation, II-248 thermische Leitfähigkeit, Gas, II-269 thermisches Gleichgewicht, II-230 Thermodynamik, II-196, IV-169 Gesetze der, II-271 thomsonscher Streuquerschnitt, II-93 thomsonsches Atommodell, III-78 Thymin, I-38 Torsion, IV-193 Totalreflexion, IV-100 Trägersignal, II-331 Trägheit, I-17, I-101 Moment, I-258, I-266
Gesamtindex Prinzip, I-261 Trägheitstensor, IV-51 Transformation von Amplituden, V-95 der Geschwindigkeit, I-227 der Zeit, I-213 Fourier-, I-340 Galilei-, I-175, I-209 lineare, I-153 Lorentz-, I-209, I-237, III-463, III-479 Transformator, III-284 Transistor, V-294 Translation von Achsen, I-146 trigonales Gitter, IV-11 triklines Gitter, IV-10 Triphenylzyklopropenyl, V-315 „trockenes“ Wasser, IV-225 Tropfenaufbrechung, Theorie der, III-164 Tscherenkow-Strahlung, II-370 Übergang, V-288 Übertragungsleitung, III-443 Ultraviolettstrahlung, I-21, II-1 Umkehrbarkeit, Prinzip der, II-7, II-58 Unbestimmtheitsprinzip, I-22, I-84, I-102, II-176, II-179, II-184, II-192, V-11, V-14, V-20, V-22, V-28 unreine Halbleiter, V-283 Unschärferelation, Stabilität des Atoms, III-2, III-78 Van-de-Graaff-Generator, III-89, III-141 Variationsrechnung, III-337 Vektor, I-151, V-135 axialer, I-279, II-393, II-398 Einheits-, III-20 polarer, I-279, II-393 Polarisations-, III-173 Poynting-, III-505, III-510 Vierer-, I-243, III-463 Vektoralgebra, I-153, V-92, V-136, V-139 Vektoranalysis, II-386, III-18, III-24, III-32, III-35, III-51 Vektorfeld, III-5, III-6, III-18 Fluss eines, III-37 quellenfreies, III-50, III-56
491 wirbelfreies, III-50 Vektorintegrale, III-35 Vektoroperator, III-25 Vektorpotential, III-241, III-257, III-265, V-446 bekannter Ströme, III-244 in der Quantenmechanik, III-268 Vektorprodukt, I-279, III-27, IV-53 Verdampfung, I-8, II-215, II-243 Vergrößerung, II-22 Versetzungen, IV-13 und Kristallwachstum, IV-14 Vertauschungsregel, V-440 Verzerrungstensor, IV-59, IV-205 Viererpotential, III-474 Vierervektoren, I-217, I-243, III-463 virtuelle Arbeit, Prinzip der, I-52 virtuelles Bild, II-18 viskose Strömung, IV-249 Viskosität, IV-245 Viskositätskoeffizient, IV-246 Voltmeter, III-280 Volumenänderung, IV-189 Volumenspannung, IV-189 Wahrscheinlichkeit, I-71 Wahrscheinlichkeitsamplitude, II-178, II-181, V-13, V-33, V-317 Wahrscheinlichkeitsdichte, I-81, V-323 Wahrscheinlichkeitsverteilung, I-81, V-323 Wandenergie, IV-172 Wärme, I-4, I-182 Wärme, spezifische, IV-170 Wärme, Versagen der klassischen Physik, II-223 Wärmediffusion, Gleichung der, III-42 Wärmeenergie, I-46, I-140, I-142 Wärmeleitfähigkeit, III-28, III-205 Wärmeleitung, III-39, III-42 Wärmemaschinen, II-271 Wärmestrom, III-19, III-28, III-204 Wasserstoff, V-415 Hyperfeinaufspaltung im, V-233 Ionisierungsenergie, V-26 Wasserstoffatom, V-395 Wasserstoffmolekül, V-187 Wasserstoffwellenfunktionen, V-411
492 Watt (Einheit), I-182 Weber (Einheit), III-224 Wechselstromgenerator, III-303 Wechselstromschaltungen, III-395 Wechselstromwiderstand, III-395 Welle dreidimensionale, III-365 durchgelassene, IV-93 ebene, III-355 elektromagnetische, III-375 Kugel-, III-370, III-377 reflektierte, IV-93 Scher-, II-374, IV-196 sinusförmige, II-40 Wellen, II-369 Licht-, II-327 Wellen, interferierende, II-169, V-4 Wellenfront, II-109, II-318, II-369 Wellenfunktion, V-322 Bedeutung der, V-452 Wellengleichung, II-315, III-329 Wellenknoten, V-129 Wellenlänge, II-1, II-40 Wellenpaket, V-265 Wellenzahl, II-40 Widerstand, I-317, II-230, II-239, III-400 Widerstandsbeiwert, IV-254 Winkel Einfalls-, II-3 Reflexions-, II-3 Winkelbeschleunigung, I-252 Winkelgeschwindigkeit, I-252 wirbelfreie Strömung, IV-231 wirbelfreies Vektorfeld, III-50, III-56 Wirbellinien, IV-240 Wirbelschicht, IV-257 Wirbelstrom, III-287 Wirbelvektor, IV-231 Wirkungsgrad, ideale Maschine, II-281 Wirkungsquerschnitt, I-69
Gesamtindex wissenschaftliche Methode, I-15 youngscher Modul, IV-186 Yukawa-Potential, III-534, V-185 Zähigkeit, s. Viskosität, IV-245 Zapfenzellen, II-130, II-135, II-139, II-146, II-151 Zeemann-Aufspaltung, V-245 Zeit, I-17, I-57, I-103 -normale, I-63 Einheit der, I-63 Transformation der, I-213 Zeit, retardierte, II-29 zeitabhängige Zustände, V-265 Zeitabhängigkeit der Amplituden, V-117 Zeitverzögerung, II-29 Zentrifugalkraft, I-93, I-175, I-225, I-271, I-285, II-262, II-388, IV-112, IV-259, V-410, V-414 Zentripetalkraft, I-272 Zink, V-419 zirkulare Polarisation, II-98 Zirkulation, III-8, III-46 Zufallsbewegung, I-77, II-238 Zustand angeregter, V-268 bestimmter Energie, V-260 Eigen-, V-230 Grund-, V-118 stationärer, V-117, V-230 zeitabhängiger, V-265 Zustandsvektor, V-137 Zerlegung von, V-137 Zwangsbewegung, I-195 zweidimensionales Feld, III-116 Zweizustandssystem, V-177, V-201 Zwillingsparadoxon, I-226 Zykloide, verkürzte, II-114, II-116 Zyklotron, III-544, III-547
Personenverzeichnis Adams, John C. (1819–92), I-94 Aharonov, Yakir (1932), III-273 Ampère, André-Marie (1775–1836), III-227, III-329, III-368 Anderson, Carl D. (1905–91), II-398 Aristoteles (384–322 v. Chr.), I-57 Avogadro, Amedeo (1776–1856), II-196 Becquerel, Antoine Henri (1852–1908), II-30 Bell, Alexander G. (1847–1922), III-283 Bessel, Friedrich (1784–1846), III-433 Boehm, Felix H. (1924), II-398 Bohm, David (1917–92), III-124, III-273 Bohr, Niels (1885–1962), II-254, III-78, V-333, V-401 Boltzmann, Ludwig (1844–1906), II-228 Bopp, Friedrich (1909–87), III-527 Born, Max (1882–1970), II-166, II-193, III-526, III-530, V-1, V-29, V-33, V-452 Bragg, William Lawrence (1890–1971), IV-16 Brewster, David (1781–1868), II-103 Briggs, Henry (1561–1630), I-304 Brown, Robert (1773–1858), II-227 Carnot, N. L. Sadi (1796–1832), I-47, II-273, II-293, II-300 Cavendish, Henry (1731–1810), I-98 Clapeyron, Benoît Paul Émile (1799–1864), II-274 de Coulomb, Charles-Augustin de (1736– 1806), III-85 Dedekind, Richard (1831–1916), I-300 Dicke, Robert H. (1916–97), I-102 Dirac, Paul (1902–84), II-398, III-17, III-526, III-530, V-33, V-137, V-139, V-242, V-328, V-333
Einstein, Albert (1879–1955), I-21, I-54, I-85, I-102, I-172, I-176, I-207, I-210, I-218, I-223, I-229, I-234, II-227, II-238, II-254, II-269, III-233, III-478, III-496, III-512, III-521, IV-263, IV-270, IV-274, IV-280, IV-283, V-59, V-375 Eötvös, Loránd (1848–1919), I-102 Euklid (3. Jhd. v. Chr.), IV-267 Euklid (um 300 v. Chr.), I-17, I-64, I-163 Faraday, Michael (1791–1867), III-171, III-280, III-292, III-294, III-296, III-329, III-368 Fermat, Pierre de (1601–65), II-4, II-12 Fermi, Enrico (1901–54), I-69 Feynman, Richard P. (1918–88), III-381, III-527, III-530 Fourier, J. B. Joseph (1768–1830), II-357 Frank, Ilya M. (1908–90), II-370 Franklin, Benjamin (1706–90), III-85 Galileo Galilei (1564–1642), I-57, I-89, I-117, I-136, II-388 Gauß, Carl Friedrich (1777–1855), III-42, III-281, IV-147 Geiger, Hans (1882–45), III-78 Gell-Mann, Murray (1929), I-25, V-217, V-222 Gerlach, Walther (1889–1979), IV-123 Goeppert-Mayer, Maria (1906–72), V-316 Hamilton, William Rowan (1805–65), V-147 Heaviside, Oliver (1850–1925), III-381 Heisenberg, Werner K. (1901–76), II-166, II-176, II-179, II-193, III-347, V-1, V-11, V-14, V-29, V-327, V-443
494 Helmholtz, Hermann von (1821–94), II-138, IV-240 Hess, Victor F. (1883–1964), III-153 Huygens, Christiaan (1629–95), I-208, II-2, II-108 Infeld, Leopold (1898–1968), III-526, III-530 Jeans, James H. (1877–1946), II-224, II-235, III-25 Jensen, J. Hans D. (1907–1973), V-316 Josephson, Brian D. (1940), V-464 Kepler, Johannes (1571–1630), I-88 Kopernikus, Nikolaus (1473–1543), I-87 Lamb, Willis E. (1913–2008), III-85 Laplace, Pierre-Simon de (1749–1827), II-324 Lawton, Willard E. (1899–1946), III-85 Le Verrier, Urbain (1811–77), I-94 Leibniz, Gottfried Wilhelm (1646–1716), I-108 Liénard, Alfred-Marie (1869–1958), III-387 Lorentz, Hendrik Antoon (1853–1928), I-210, I-216, III-391, III-478, III-521, III-526, III-532 MacCullough, James (1809–47), III-14 Marsden, Ernest (1889–1970), III-78 Maxwell, James Clerk (1831–79), I-71, I-83, II-27, II-30, II-223, II-237, II-309, III-12, III-16, III-85, III-296, III-317, III-329, III-332, III-368, III-380, III-520, IV-66 von Mayer, Julius Robert (1814–78), I-33 Mendelejew, Dmitri (1834–1907), I-25 Michelson, Albert A. (1852–1931), I-210, I-213 Miller, William C. (1910–81), II-131 Minkowski, Hermann (1864–1909), I-248 Morley, Edward E. (1838–1923), I-210, I-213 Mößbauer, Rudolf (1929–2011), I-323, I-324
Personenverzeichnis Nernst, Walter H. (1864–1941), II-288 Neumann, John von (1903–57), III-215, IV-229 Newton, Isaac (1643–1727), I-90, I-99, I-102, I-108, I-117, I-121, I-132, I-143, I-207, II-165, II-324, III-70, III-344, IV-263, V-1 Nishijima, Kazuhiko (1926–2009), I-25, V-217 Nye, John F. (1923), IV-16 Oersted, Hans C. (1777–1851), III-329, IV-147 Pais, Abraham (1918–2000), V-217, V-222 Pasteur, Louis (1822–95), I-43 Pauli, Wolfgang (1900–58), V-52, V-203 Pines, David (1924), III-124 Planck, Max (1858–1947), II-225, II-235, II-254, V-66 Plimpton, Samuel J. (1883–1948), III-85 Poincaré, Henri (1854–1912), I-210, I-213, I-223 Poincaré, J. Henri (1854–1912), III-522 Poynting, John Henry (1852–1914), III-502, III-520 Priestley, Joseph (1733–1804), III-85 Ptolemäus, Claudius (2. Jhd. n. Chr.), II-3 Pythagoras (6. Jhd. v. Chr.), II-355 Rabi, Isidor I. (1898–1988), IV-125 Ramsey, Norman F. (1915–2011), I-63 Retherford, Robert C. (1912–81), III-85 Rømer, Ole (1644–1710), I-93 Rushton, William A. H. (1901–80), II-141 Rutherford, Ernest (1871–1937), III-78 Schrödinger, Erwin (1887–1961), II-136, II-166, II-193, III-347, V-1, V-29, V-33, V-321, V-332, V-443, V-452 Shannon, Claude E. (1916–2001), II-273 Smoluchowski, Marian (1872–1917), II-238 Snellius, Willebrord (1580–1626), II-3 Stern, Otto (1888–1969), IV-123 Stevinus, Simon (1548/49–1620), I-50
Personenverzeichnis Tamm, Igor Y. (1895–1971), II-370 Thomson, Joseph John (1856–1940), III-78 Tscherenkow, Pavel A. (1908–90), II-370 Tycho Brahe (1546–1601), I-87 da Vinci, Leonardo (1452–1519), II-147 Wapstra, Aaldert Hendrik (1922–2006), II-398 Weber, Wilhelm (1804–91), III-281 Weyl, Hermann (1885–1955), I-145, II-386
495 Wheeler, John A. (1911–2008), III-527, III-530 Wiechert, Emil Johann (1861–1928), III-387 Wilson, Charles T. R. (1869–1959), III-164 Young, Thomas (1773–1829), II-138 Yukawa, Hideki (1907–81), I-25, III-533, V-184 Yustova, Elizaveta N. (1910–2008), II-140 Zenon von Elea (5. Jh. v. Chr.), I-106