Università degli Studi di Padova
Dipartimento di Fisica e Astronomia “Galileo Galilei” Corso di Laurea Magistrale in Fisica
A PPUNTI DI F ISICA T EORICA Modulo B Scritti da:
M ATTIA FAGGIN
Anno accademico 2015-2016
Quest’opera è distribuita con Licenza Creative Commons Attribuzione - Non commerciale Condividi allo stesso modo 4.0 Internazionale.
2
Indice 1
2
Estensione dell’equazione di Schrödinger 1.1 Assunzioni preliminari . . . . . . . . . . . . . . . . . . . . . . . 1.2 Notazione relativistica . . . . . . . . . . . . . . . . . . . . . . . 1.3 Equazione di Klein-Gordon (libera) . . . . . . . . . . . . . . . . 1.3.1 Soluzione dell’equazione di Klein-Gordon . . . . . . . . 1.4 Equazione di Klein-Gordon con accoppiamento minimale . . . . . 1.5 Paradosso di Klein . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Equazione di Dirac . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1 Soluzione generale dell’equazione di Dirac . . . . . . . . 1.6.2 Equazione di Dirac accoppiata con un campo magnetico limite non relativistico . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . esterno nel . . . . . . .
Teorie di campo libere 2.1 Teorie lagrangiane e hamiltoniane . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Sistemi classici con finiti gradi di libertà . . . . . . . . . . . . . . . . . 2.1.2 Sistemi con gradi di libertà infiniti e continui: i campi . . . . . . . . . 2.2 Simmetrie globali e conservazioni - il teorema di Nöther . . . . . . . . . . . . 2.2.1 Applicazione ad una simmetria globale interna . . . . . . . . . . . . . 2.2.2 Applicazione ad una simmetria interna spazio-temporale . . . . . . . . 2.2.3 Applicazione ad una teoria di campo relativistica . . . . . . . . . . . . 2.3 Teoria lagrangiana (classica) per un campo scalare (relativistico) . . . . . . . . 2.3.1 Teoria lagrangiana (classica) libera per un campo scalare (relativistico) reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Teoria lagrangiana (classica) libera per un campo scalare (relativistico) complesso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Teoria lagrangiana e hamiltoniana classica di Dirac (campi spinoriali) . 2.3.4 Teoria classica relativistica di campo vettoriale (reale) . . . . . . . . . 2.4 Quantizzazione canonica di una teoria di campo relativistica . . . . . . . . . . 2.4.1 Sistemi con un numero finito di gradi di libertà . . . . . . . . . . . . . 2.4.2 Sistemi con un numero infinito di gradi di libertà: i campi . . . . . . . 2.4.3 Campo reale scalare libero . . . . . . . . . . . . . . . . . . . . . . . . 2.4.4 Campo scalare complesso libero . . . . . . . . . . . . . . . . . . . . . 2.4.5 Quantizzazione canonica della teoria di Dirac . . . . . . . . . . . . . . 2.4.6 Quantizzazione canonica covariante per il campo elettromagnetico . . . 2.5 Teoria di campo di Schrödinger . . . . . . . . . . . . . . . . . . . . . . . . . . 3
7 7 9 10 13 16 18 22 30 37 41 41 41 43 47 48 49 50 52 53 55 58 61 70 70 71 72 79 81 85 90
4
INDICE
3
Teorie di campo con interazione 95 3.1 Teorie di campo classiche con interazione . . . . . . . . . . . . . . . . . . . . 95 3.1.1 Teoria di campo scalare . . . . . . . . . . . . . . . . . . . . . . . . . 95 3.1.2 Teoria di campo spinoriale . . . . . . . . . . . . . . . . . . . . . . . . 96 3.1.3 Teoria di campo di interazione tra campo scalare reale e campo spinoriale 97 3.1.4 Teoria di campo di interazione tra campo vettoriale e campo spinoriale . 97 3.1.5 Quantum ElectroDynamics (Q.E.D.) . . . . . . . . . . . . . . . . . . . 98 3.2 Quantizzazione canonica delle teorie di campo con interazione . . . . . . . . . 100 3.2.1 Visuale di interazione . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 3.2.2 Espansione perturbativa dell’operatore di evoluzione temporale in visuale di interazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 3.2.3 Matrice di interazione . . . . . . . . . . . . . . . . . . . . . . . . . . 108 3.2.4 Processi di scattering . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 3.3 Il teorema di Wick e i propagatori di Feynman . . . . . . . . . . . . . . . . . . 109 3.3.1 Campo scalare reale . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 3.3.2 Campo scalare complesso . . . . . . . . . . . . . . . . . . . . . . . . 112 3.3.3 Campo vettoriale (reale) . . . . . . . . . . . . . . . . . . . . . . . . . 113 3.3.4 Campo spinoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 3.3.5 Caso generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 3.4 Diagrammi di Feynman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 3.4.1 Interpretazione grafica dei propagatori di Feynman . . . . . . . . . . . 116 3.4.2 Interpretazione grafica dei campi non contratti . . . . . . . . . . . . . 124
4
Quantum ElectroDynamics (Q.E.D.) 4.1 Espansione della matrice di interazione nello spazio delle coordinate . . . . . . 4.2 Espansione della matrice di interazione nello spazio dei momenti . . . . . . . . 4.2.1 Regole di Feynman . . . . . . . . . . . . . . . . . . . . . . . . . . . .
127 127 136 143
A Funzionali e derivata funzionale
149
B Meccanica quantistica - visuali di Schrödinger e di Heisenberg
153
C Tensore di Levi-Civita
155
D Gammologia
157
Introduzione Programma del corso Il corso verterà sulla seconda quantizzazione, o quantizzazione canonica di una teoria di campo. Il nostro scopo sarà dunque quello di estendere la descrizione di sistemi quantistici al caso relativistico. Risulta necessario introdurre uno strumento nuovo, quale le teorie di campo, essendo l’equazione di Schrödinger ∂ (1) i ψ(~x,t) = Hψ(~x,t) ∂t con H l’operatore hamiltoniano, non adatta alla descrizione di molti sistemi fisici. Infatti: • la ricerca della soluzione risulta troppo complicata qualora il sistema in esame sia particolarmente complesso. La soluzione per l’atomo di idrogeno, in cui l’unico grado di libertà è rappresentato dall’elettrone orbitante attorno al nucleo, risulta semplice, ma non appena aumenta il numero di elettroni la cosa si complica notevolmente; • l’equazione di Schrödinger, per costruzione, permette di descrivere sistemi con gradi di libertà fissati. E’ dunque necessario sviluppare un nuovo strumento per trattare sistemi con gradi di libertà variabili, come per esempio processi di decadimento α: il nucleo padre, avente un grado di libertà, si divide in una particella α e un nucleo figlio, che complessivamente costituiscono due gradi di libertà; • l’equazione di Schrödinger non permette di descrivere sistemi relativistici. La stessa soluzione per i livelli energetici dell’elettrone nell’atomo di idrogeno non è accurata, essendovi delle imprecisioni sulle stime delle spaziature tra i livelli energetici. Tra l’altro, in sistemi relativistici il numero di gradi di libertà non è fissato (l’elettrone in moto in un acceleratore può emettere radiazione di Bremsstrahlung), tornando quindi al problema precedente. Il motivo storico dell’introduzione delle teorie di campo è proprio quello di estendere la descrizione di sistemi quantistici nel contesto relativistico. Il programma del corso è il seguente: 1. tentativo di estensione dell’equazione di Schrödinger al caso relativistico (approccio storico) per trovare un’equazione d’onda relativistica, osservando l’inconsistenza di questo approccio; 2. introduzione e studio della teoria lagrangiana di campo a livello classico, studio delle equazioni di Eulero - Lagrange e teorema di Noether; 3. quantizzazione canonica di una teoria di campo libera, in particolare: 5
6
INDICE • di un campo scalare (particelle scalari, cioè di spin 0); • di un campo fermionico (particelle fermioniche, cioè di spin 12 ); • di un campo vettoriale (particelle vettoriali, cioè di spin 1). 4. descrizione di una teoria interagente tramite sviluppo perturbativo (interazione di debole intensità: e 1), applicazionealla QCD (Quantum ElectroDynamics), cioè al caso del e2 l’interazione elettromagnetica d = 4π 1 , diagrammi di Feynmann, stime di sezioni d’urto e lunghezze di decadimento.
Unità di misura naturali, o di Planck Il sistema di unità di misura maggiormente utilizzato nel contesto delle teorie di campo è il sistema di unità naturali. Esso permette una semplificazione nella scrittura delle equazioni. In questo sistema di unità di misure h¯ = c = 1(= ε0 = kB )
adimensionali
Questa scelta ovviamente si ripercuote sulle unità di misura delle altre grandezze fisiche: • essendo c adimensionale, allora [c] =
[L] [T ]
=⇒
[L] = [T ]
cioè tempo e lunghezza hanno le stesse dimensioni; • essendo h¯ adimensionale, allora l’azione s è adimensionale, dunque [s] = [E][T ]
[M][L]2 [T ]
=⇒
[M] = [L]−1 = [T ]−1
cioè la massa ha le dimensioni dell’inverso di un tempo, o di una lunghezza; • l’energia a riposo di un corpo è E = mc2 . Essendo c adimensionale, allora [E] = [M] cioè massa ed energia hanno le stesse dimensioni1 ; 2
2
1 e • la costante di struttura fine α = 4πεe 0 h¯ c ' 137.04 diventa α = 4π . Essendo α adimensionale, allora anche la carica diventa adimensionale.
Qualora necessario, per ritornare al sistema di unità di misura internazionale (SI) basterebbe reintrodurre opportune potenze di c, h¯ , c¯h riaggiustando le unità di misura. Questa operazione verrà spesso effettuata alla fine dei conti, una volta ottenuto il risultato cercato.
1 Non a caso l’equazione E
= mc2 viene interpretata come quella che afferma l’equivalenza tra massa ed energia
Capitolo 1 Estensione dell’equazione di Schrödinger 1.1
Assunzioni preliminari
La validità dell’equazione di Schrödinger si basa su alcune assunzioni: i. data l’energia di un sistema classico p2 +V (~x) 2M possiamo ottenere l’equazione di Schrödinger ∇2 ∂ +V (~x) ψ(~x,t) i ψ(~x,t) = Hψ(~x,t) ≡ − ∂t 2M E=
tramite il principio di corrispondenza E →i
∂ ∂t
p → −i~∇
~x → X
(1.1)
ii. alla funzione d’onda ψ(~x,t) viene dato un preciso significato fisico, cioè viene interpretata in termini probabilistici: essa corrisponde infatti alla probabilità di trovare la particella considerata in un intorno di (~x,t). In particolare, la densità di probabilità associata è ρ(~x,t) = ||ψ(~x,t)||2 Per definizione stessa di probabilità, la probabilità che la particella si trovi in un qualunque punto dello spazio è Z P(t) =
R3
||ψ(~x,t)||2 d 3 x = 1
(1.2)
dove ψ(~x,t): • è normalizzata; • è modulo quadro integrabile su R3 , cioè ψ(~x,t) ∈ C2 . iii. la probabilità totale è sempre pari a 1, ad ogni istante di tempo. Verifichiamolo: ∗ Z Z ∂ψ d d ∂ψ 2 3 ∗ P(t) = ||ψ(~x,t)|| d x = ψ (~x,t) (~x,t) + (~x,t) ψ(~x,t) d 3 x = 3 3 dt dt ∂t ∂t R R Z h i i = ψ ∗ (~∇2 ψ) −V ψ ∗ ψ − (~∇2 ψ ∗ )ψ +V ψ ∗ ψ d 3 x = 2M R3 Z h i i = ψ ∗ (~∇2 ψ) − (~∇2 ψ ∗ )ψ d 3 x 2M R3 7
8
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER avendo utilizzato al terzo passaggio l’equazione 1 e la sua coniugata. Ora, definendo la corrente h i ~j(~x,t) = − 1 ψ ∗ (~∇ψ) − (~∇ψ ∗ )ψ (1.3) M allora, utilizzando il teorema di Gauss: d ~∇ · ~jd 3 x = − P(t) = − dt R3 Z
Z ∂ R3
~j ·~ndΣ = 0
essendo ψ(~x,t) ∈ C2 , dunque nulla al bordo di R3 . Come voluto, la probabilità totale si preserva nel tempo, quindi l’interpretazione probabilistica della funzione d’onda è coerente. Considerando il primo ed il terzultimo passaggio del conto precedente otteniamo dunque l’equazione di continuità della probabilità d ||ψ(~x,t)||2 + ~∇ · ~j = 0 dt
(1.4)
iv. nel caso libero l’equazione di Schrödinger è facilmente risolvibile. L’hamiltoniana libera ~∇2 è H = − 2M e, supponendo di ricercare soluzioni a variabili separabili ψ(~x,t) = ϕ(~x)χ(t) allora, inserendo il tutto nell’equazione 1: iϕ(~x)
∂ 1 ~2 χ(t) = − ∇ ϕ(~x)χ(t) ∂t 2M
1 ~2 i ∂ χ(t) = − ∇ ϕ(~x) χ(t) ∂t 2Mϕ(~x) Essendo il primo membro indipendente dallo spazio, allora anche il secondo membro deve esserlo, e viceversa per ciò che riguarda la dipendenza dal tempo. Insomma, ambo i membri devono essere uguali ad una costante E, perciò ∂ χ(t) = −iEχ(t) ∂t ~∇2 ϕ(~x) = −2MEϕ(~x)
=⇒
=⇒
χ(t) = χ(0)e−iEt ~
ϕ(~x) = ϕeik·~x
con E = ωk =
|~k|2 2M
perciò ~
ψ(~x,t) ∝ e−i(Et−k·~x) Dunque, una generica soluzione dell’equazione di Schrödinger è 1 ψ(~x,t) = (2π)3/2
Z
~ ˜ ~k)e−i(ωk t±k·~x) d 3 k ϕ(
(il segno ± all’esponente di fatto è arbitrario, essendovi un’integrazione su tutti i ~k) dove ˜ ~k) è la trasformata di Fourier tridimensionale di ϕ(~x)1 ϕ( 1
Convenzioni:
1.2. NOTAZIONE RELATIVISTICA
1.2
9
Notazione relativistica
Definiamo un vettore controvariante la quantità Aµ = (A0 , ~A) = (A0 , Ai ),
con i = 1, 2, 3
(1.9)
ossia un quadrivettore con indice di Lorenz in alto. I quadrivettori che utilizzeremo molto spesso saranno x ≡ xµ e il quadrimomento p ≡ pµ . La metrica di cui il nostro spazio è dotato è la metrica di MinkowsKi "mostly-negative", rappresentata dal tensore metrico 1 0 0 0 0 −1 0 0 −1 ηµν = ηµν = (1.10) 0 0 −1 0 = diag(1, −1, −1, −1) 0 0 0 −1 con il quale riusciamo ad definire i vettori covarianti Aµ = ηµν Aν
(1.11)
In questo modo, i quadrivettori covarianti relativi alle coordinate spazio-temporali e al quadrimomento sono: xµ = ηµν xν = (x0 , −~x) = (x0 , −xi ) ≡ (x0 , xi ) pµ = ηµν pν = (p0 , −~p) = (p0 , −pi ) ≡ (p0 , pi ) Si noti che l’alzamento/abbassamento di un indice spaziale provoca un cambio di segno, mentre non ha effetti di segno se viene coinvolto l’indice temporale. Si noti che la derivata relativistica ∂µ ≡
∂ = (∂0 , ~∇) ∂ xµ
(1.12)
• l’oggetto ˜ ~k) = ϕ(
1 (2π)3/2
Z
~
ϕ(~x)eik·~x d 3 x
(1.5)
~ ˜ ~k)e−ik·~x d 3 k ϕ(
(1.6)
è la trasformata di Fourier di ϕ(~x), mentre l’oggetto ϕ(~x) =
1 (2π)3/2
Z
˜ ~k). La potenza 3/2 a denominatore è arbitraria: l’importante è che faè l’antitrasformata di Fourier di ϕ( 1 cendo il prodotto tra i coefficienti degli integrali si ottenga (2π) 3 . I segni + e − degli esponenziali sono intercambiabili; ˜ ~k) e • se ϕ(~x) è modulo quadro integrabile, allora lo è anche ϕ( ˜ ~k)||2 ||ϕ(~x)||2 = ||ϕ( • la delta di Dirac tridimensionale è definita come δ 3 (~x −~y) =
1 (2π)3
Z
~
e−ik·(~x−~y) d 3 k
(1.7)
• la trasformata di Fourier della delta di Dirac nello spazio di Minkowski è definita come δ 4 (k − k0 ) =
1 (2π)4
Z
0
ei(k−k )·x d 4 x
(1.8)
10
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
è definita come un quadrivettore covariante2 . Nello spazio di MinkowsKi il prodotto scalare è definito così: x · y = xµ yµ = ηµν xν yµ = (x0 y0 −~x ·~y) = xT ηy (1.13) Si noti che il prodotto scalare nello spazio di MinkowsKi non è definito positivo, dato che in generale x · y può essere positivo, negativo o nullo. In tal caso, l’intervallo spazio temporale s2 = s · s = ct 2 − (x2 + y2 + z2 )
(1.14)
può essere: • > 0, timelike; • = 0, lightlike; • < 0, spacelike. Il prodotto scalare suddetto è lasciato invariante da tutte le trasformazioni del gruppo di Lorenz, ad ognuna delle quali è associata una matrice Λ di determinante 1 tale che: Λ:
M4 → M4 x 7→ x0 = Λx
(1.15)
dove M4 è lo spazio di MinkowsKi. Infatti, valendo 3 ΛT ηΛ = η allora il prodotto scalare è invariante sotto trasformazioni di Lorenz: x0 · y0 = xT ΛT ηΛy = xT ηy = x · y Il gruppo di Lorenz è un sottogruppo del gruppo di Poincaré (Λ, a) :
M4 → M4 x 7→ x0 = Λx + a
(1.16)
Secondo il principio di relatività ristretta tutte le leggi della fisica sono invarianti in forma nei sistemi di riferimento inerziali, cioè quelli legati da una trasformazione di Poincaré. Di conseguenza, esse dovranno necessariamente essere relazioni tra grandezze invarianti sotto trasformazioni del gruppo di Lorenz, ossia devono essere covarianti, cioè del tipo F µν = Gµν .
1.3
Equazione di Klein-Gordon (libera)
L’equazione di Schrödinger non può descrivere un sistema relativistico. Infatti: • per scriverla abbiamo utilizzato il principio di corrispondenza a partire dalla forma classica dell’energia della particella; 2
Questo implica che il segno − nella componente spaziale compare per ∂ µ : ∂ µ = (∂ 0 , −~∇)
3
Le trasformazioni di Lorenz costituiscono di fatto il gruppo delle isometrie della metrica.
1.3. EQUAZIONE DI KLEIN-GORDON (LIBERA)
11
• essa presenta una quantità differente di derivate rispetto alle coordinate spaziali e rispetto al tempo. Presentando derivate rispetto a tempo e spazio, per essere estesa relativamente affinchè sia covariante essa deve necessariamente essere riscritta in termini di ∂µ , ma ciò non è possibile per la differenza numerica tra derivate temporali e spaziali. Allora, per trovare un’equazione d’onda relativistica partiamo da una teoria classica relativistica e tentiamo di quantizzarla. In relatività ristretta, vale la legge covariante pµ pµ = E 2 − |~p|2 = M 2
(1.17)
dove M è la massa invariante del mio sistema (cioè la massa della particella). Questo implica dunque q E = ± |~p|2 + M 2 ≡ ±ω p
(1.18)
Come possiamo vedere, l’equazione 1.17 prevede una duplice soluzione: una con E > 0 ed una con E < 0, di cui per ora non siamo in grado di dare alcun significato4 . Per raggiungere il nostro scopo proseguiamo dunque in questo modo: 1. Come primo tentativo, vediamo cosa succede "dimenticandoci" della soluzione E < 0, mantenendo cioè solamente la relazione lineare q E = |~p|2 + M 2 Applicando il principio di corrispondenza 1.1 si ottiene i
p ∂ψ (~x,t) = −∇2 + M 2 ψ(~x,t) ∂t
Questa equazione presenta però due problemi: (a) non si può scrivere in termini di oggetti esplicitamente covarianti; (b) pur sviluppando la radice nel caso M |~p|2 5 ∂ψ ∇2 ∇4 i = M 1− − +... ψ ∂t 2M 8M • se ci fermiamo al termine quadratico si riottiene l’operatore non relativistico; • se si tronca lo sviluppo ad un qualsiasi ordine si perde la covarianza dell’equazione; • se lo sviluppo non viene troncato si ha a che fare con un operatore non locale6 . 2. Manteniamo allora le soluzioni E < 0 dell’equazione quadratica 1.17. Applicando il principio di corrispondenza 1.1 si ottiene l’equazione ∂ 2ψ (~x,t) − ∇2 ψ(~x,t) = −M 2 ψ(~x,t) 2 ∂t ∂µ ∂ µ ψ(~x,t) = −M 2 ψ(~x,t) 4 5 6
Le "particelle" di energia negativa verranno dette antiparticelle. Propriamente non relativistico. Con un numero infinito di derivate.
12
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER che è dunque covariante. Definendo poi l’operatore d’Alembertiano ≡ ∂µ ∂ µ
(1.19)
si ottiene dunque l’equazione di Klein-Gordon ( + M 2 )ψ(x) = 0
(1.20)
dove x ≡ xµ . Essendo M uno scalare di Lorenz e invariante per costruzione, quindi anch’esso scalare di Lorenz, a sua volta la funzione d’onda deve essere scalare7 , cioè ψ 0 (x0 ) = ψ(x) Solo così l’equazione di Klein-Gordon è covariante, cioè (0 + (M 0 )2 )ψ 0 (x0 ) = ( + M 2 )ψ(x) = 0 valendo quindi per tutti i sistemi di riferimento inerziali, soddisfacendo il principio di relatività ristretta. Abbiamo dunque trovato un’equazione d’onda relativistica. Cerchiamone allora l’equazione di continuità associata, in analogia a quanto fatto per l’equazione di Schrödinger. Moltiplichiamo l’equazione di Klein-Gordon a sinistra per ψ ∗ (x) e poi prendiamone la coniugata: si ottengono le equazioni ψ ∗ (x)( + M 2 )ψ(x) = 0 ψ(x)( + M 2 )ψ ∗ (x) = 0 Sottraendo membro a membro otteniamo: ψ ∗ (x)ψ(x) − ψ(x)ψ ∗ (x) = 0 cioè 0 = ψ ∗ (x) ∂02 − ∇2 ψ(x) − ψ(x) ∂02 − ∇2 ψ ∗ (x) = = ∂0 [ψ ∗ (x)∂0 ψ(x) − (∂0 ψ ∗ (x)) ψ(x)] − (∂0 ψ(x)) (∂0 ψ ∗ (x)) + (∂0 ψ ∗ (x)) (∂0 ψ(x)) + h i − ~∇ · ψ ∗ (x)~∇ψ(x) − ~∇ψ ∗ (x) ψ(x) − ~∇ψ(x) · ~∇ψ ∗ (x) + ~∇ψ ∗ (x) · ~∇ψ(x) = i h = ∂0 [ψ ∗ (x)∂0 ψ(x) − (∂0 ψ ∗ (x)) ψ(x)] − ~∇ · ψ ∗ (x)~∇ψ(x) − ~∇ψ ∗ (x) ψ(x) Definendo ora la densità ← → i i ∗ [ψ (x)∂0 ψ(x) − (∂0 ψ ∗ (x)) ψ(x)] = ψ ∗ (x) ∂0 ψ(x) 2 2
(1.21)
h i ← → ~j = − i ψ ∗ (x)~∇ψ(x) − ~∇ψ ∗ (x) ψ(x) = − i ψ ∗ (x) ∇ ψ(x) 2 2
(1.22)
ρ(x) ≡ e la corrente
possiamo allora scrivere l’equazione di continuità relativa all’equazione di Klein-Gordon: ∂0 ρ(x) + ~∇ · ~j ≡ ∂µ J µ = 0 7
Come vedremo, la natura scalare di ψ implica che essa descriva particelle scalari, ossia di spin nullo.
(1.23)
1.3. EQUAZIONE DI KLEIN-GORDON (LIBERA)
13
avendo definito la quadricorrente J µ ≡ (ρ, ~j)
(1.24)
che si dimostra essere un quadrivettore. L’equazione di continuità 1.23 è evidentemente covariante. Inoltre, possiamo verificare che la quantità Z Q=
R3
ρ(~x,t)d 3 x
(1.25)
detta carica totale, si conserva nel tempo. Infatti, utilizzando la 1.23 e applicando il teorema di Gauss: Z Z Z ∂ d 3 3 ~ ~ ~j ·~ndΣ = 0 Q= ρ(~x,t)d x = − ∇ · j(~x,t)d x = − dt R3 ∂t R3 ∂ (R3 ) visto che la corrente ~j all’infinito si annulla essendo integrabile. L’equazione di Klein-Gordon sembra dunque adatta al nostro scopo, ossia per assumere in ambito relativistico lo stesso ruolo che assume l’equazione di Schrödinger per sistemi quantistici non relativistici. Tuttavia, ciò non è vero per il semplice fatto che la densità 1.21 non è definita positiva. In generale, infatti: ρ(x) =
i ∗ [ψ (x)∂0 ψ(x) − (∂0 ψ ∗ (x)) ψ(x)] ≷ 0 2
Questo significa che alla ρ(x) non può essere associato il significato di densità di probabilità che aveva nel caso di Schrödinger, dunque la quantità Q, ossia l’analogo di Klein-Gordon della probabilità totale 1.2, non assume il significato di probabilità. Insomma, con l’equazione di Klein-Gordon non sussiste l’interpretazione probabilistica della funzione d’onda, sancendo dunque il fallimento del tentativo di estensione dell’equazione di Schrödinger nel caso relativistico.
1.3.1
Soluzione dell’equazione di Klein-Gordon
Consideriamo una funzione d’onda ϕ(x) scalare nello spazio di MinkowsKi. Essa può essere ˜ scritta attraverso la sua trasformata di Fourier ϕ(k) nello spazio di MinkowsKi: 1 ϕ(x) = (2π)2
Z
−ik·x 4 ˜ ϕ(k)e d k
Dato che: • k · x = kµ xµ è scalare; • d 4 k → d 4 k0 = | det Λ|d 4 k = d 4 k; allora, affinchè ϕ(x) sia scalare, lo deve essere anche la sua traformata di Fourier, cioè ˜ ϕ˜ 0 (k0 ) = ϕ(k) Allora l’equazione di Klein-Gordon 1.20 può essere scritta così: 1 ( + M )ϕ(x) = (2π)2 2
Z
−ik·x 4 ˜ (−k2 + M 2 )ϕ(k)e d k=0
14
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
˜ Questo integrale è nullo se ϕ(k) si annulla per tutti i valori di k, al più non per k2 = M 2 . Dunque, possiamo dire che ˜ ϕ(k) = δ (k2 − M 2 ) f˜(k) con f˜(k) una generica funzione di k ≡ k µ . Ora, dato che8 δ (k2 − M 2 ) = δ ((k0 )2 − (ωk )2 ) = con ωk ≡
δ (k0 − ωk ) + δ (k0 + ωk ) 2ωk
q |~k|2 + M 2 , allora ϕ(x) =
1 (2π)2
Z
d 4 k −ikx e δ (k0 − ωk ) f˜(k) + e−ikx δ (k0 + ωk ) f˜(k) 2ωk
E’ opportuno osservare che seppur i conti portino ad una forma di ϕ(x) non covariante a vista, ciò non contraddice il fatto che ϕ(x) sia invariante: per come è stata definita, infatti, essa è una funzione scalare. Definendo ora f˜± (~k) ≡ f˜(±ωk ,~k) allora 1 ϕ(x) = (2π)2
Z
d 3 k −iωk x0 +i~k·~x ˜ ~ ~ e f+ (k) + eiωk x0 +ik·~x f˜− (~k) 2ωk
Mandando ora nel secondo addendo dell’integrando ~k → −~k allora 1 ϕ(x) = (2π)2
Z
d 3 k −ikx ˜ ~ ikx ˜ e f+ (k) + e f− (−~k) 2ωk k0 =ωk
Notiamo come l’integrando sia costituito da due addendi, ognuno dei quali è costituito da un esponenziale il cui esponente ha componente 0 opposta rispetto all’altro: come vedremo tra poco, questi due addendi corrispondono alle due soluzioni dell’equazione di Klein-Gordon, una relativa al caso E > 0, l’altra relativa al caso E < 0. Effettuando ora una rinormalizzazione di f˜± 9 f˜+ (~k) a(~k) ≡ √ √ 2π 2ωk
f˜− (−~k) b∗ (~k) ≡ √ √ 2π 2ωk
la soluzione generale dell’equazione di Klein-Gordon può essere scritta così: Z i d 3 k h ~ −ik·x 1 ∗ ~ ik·x √ ϕ(x) = a(k)e + b (k)e 0 2ωk (2π)3/2 k =ωk Si osservi che la 1.26 può essere scritta come ϕ(x) = ϕ+ (x) + ϕ− (x) 8
La delta di Dirac gode della seguente proprieta: δ ( f (k)) =
∑Ni=1 δ (x − xi ) | f 0 (xi )|
∀xi , i = 1, . . . , N| f (xi ) = 0 9 Il significato di a(~k) e b(~k) lo vedremo quando tratteremo le teorie di campo.
(1.26)
1.3. EQUAZIONE DI KLEIN-GORDON (LIBERA) dove 1 ϕ+ (x) = (2π)3/2 ϕ− (x) =
15
d 3 k ~ −ik·x √ a(k)e 0 2ωk k =ωk Z d 3 k ∗ ~ ik·x √ b (k)e 2ωk k0 =ωk
Z
1 (2π)3/2
Si verifica facilmente che i∂0 ϕ+ (x) = ωk ϕ+ (x) i∂0 ϕ− (x) = −ωk ϕ− (x) ed essendo i∂0 il corrispondente operatore quantistico dell’energia, ciò implica che ϕ+ (x) è la soluzione di energia positiva, mentre ϕ− la soluzione di energia negativa. Si noti infine che la soluzione 1.26 in generale è una funzione complessa. Volendo restringersi al caso di soluzioni reali, ossia tali che ϕ ∗ (x) = ϕ(x), allora le soluzioni 1.26 assumono la forma seguente: Z i d 3 k h ~ −ik·x 1 ∗ ~ ik·x √ (1.27) a(k)e + a (k)e ϕ(x) = 0 2ωk (2π)3/2 k =ωk ESERCIZIO: ricaviamo a(~k) e b(~k) in funzione di ϕ(x) e ∂0 ϕ(x). • Caso reale: dall’equazione 1.27 deriva che 1 i∂0 ϕ(x) = (2π)3/2
Z
i d3k h −ik·x ∗ ~ ik·x ~ √ ωk a(k)e − ωk a (k)e 0 2ωk k =ωk
Costruiamo allora la seguente combinazione lineare: 1 i∂0 ϕ(x)+ω p ϕ(x) = (2π)3/2 dove
Z
i d3k h −ik·x ∗ ik·x √ (ω p + ωk )a(~k)e + (ω p − ωk )a (~k)e 0 2ωk k =ωk q ωk = |~k|2 + M 2 q ω p = |~p|2 + M 2
Ora, moltiplichiamo per eipx e integriamo in d 3 x: Z
d 3 x (i∂0 ϕ(x) + ω p ϕ(x)) eipx p =ω = p 0 Z Z Z 3 1 d k −i(k−p)·x 3 ∗~ i(k+p)·x 3 ~ √ (ω + ω )a( k) e d x + (ω − ω )a ( k) e d x = p p k k 0 2ωk (2π)3/2 k =ωk
Essendo (ricordando la relazione 1.7) Z
d 3 xe−i(k−p)·x = e−i(k
0 −p0 )x0
Z
= e−i(k
0 −p0 )x0
(2π)3 δ 3 (~k −~p)
~
ei(k−~p)·~x d 3 x =
e analogamente Z
d 3 xei(k+p)·x = ei(k
0 +p0 )x0
(2π)3 δ 3 (~k −~p)
16
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER allora Z
" d 3 x (i∂0 ϕ(x) + ω p ϕ(x)) eipx p
0 =ω p
= (2π)3/2
2ω p 0 p a(~p) + p e2ip0 x0 2ω p 2ω p
#
avendo imposto ωk = ω p : infatti questa uguaglianza è diretta q conseguenza dell’uguaglianp za ~p =~k imposta con la δ 3 (~k −~p), e dal fatto che ωk = |~k|2 + M 2 e ω p = |~p|2 + M 2 . Dunque deriva che Z 1 d3x ipx p a(~p) = (ω ϕ(x) + i∂ ϕ(x)) e (1.28) p 0 (2π)3/2 2ω p p0 =ω p
1 a∗ (~p) = (2π)3/2
Z
d3x p (ω p ϕ(x) − i∂0 ϕ(x)) e−ipx 2ω p
(1.29) p0 =ω p
• Caso complesso: per esercizio.
1.4
Equazione di Klein-Gordon con accoppiamento minimale
Consideriamo ora l’equazione di Klein-Gordon in presenza di un campo elettromagnetico esterno di cui la particella risente. Si parla di accoppiamento minimale10 quando si effettua la sostituzione 11 ∂µ → ∂µ + iqAµ (1.30) con Aµ = (A0 , ~A) il quadripotenziale che descrive il campo elettromagnetico esterno in questo modo: ( ~E = −~∇A0 − ∂0~A ~B = ~∇ × ~A Definendo la quantità Lorenz-invartiante detta derivata covariante Dµ := ∂µ + iqAµ 10
(1.31)
L’accoppiamento minimale si può scrivere anche così: pµ → pµ − qAµ
Questo infatti è l’accoppiamento minimale risultante dall’accoppiamento dell’equazione di Schrödinger con un campo elettromagnetico esterno. Infatti, l’hamiltoniana di tale sistema è H=
2 1 ~p − q~A + qA0 2M
riscrivibile come H − qA0 =
2 1 ~p − q~A 2M 2
p ottenibile dall’hamiltoniana di Schrödinger libera H = 2M con il suddetto accoppiamento minimale. 11 ATTENZIONE: vedi anche la nota relativa alla derivata covariante con segno invertito nel caso di teorie con interazione (vedi 3.13).
1.4. EQUAZIONE DI KLEIN-GORDON CON ACCOPPIAMENTO MINIMALE
17
allora l’equazione di Klein-Gordon che descrive il comportamento di una particella quantistica relativistica soggetta all’azione di un campo elettromagnetico esterno si ottiene dall’equazione di Klein-Gordon libera 1.20 sostituendo ∂µ con la derivata covariante Dµ : Dµ Dµ + M 2 ϕ(x) = D2 + M 2 ϕ(x) = (∂ µ + iqAµ )(∂µ + iqAµ ) ϕ(x) = 0 (1.32) cioè, esplicitando tutti i termini: iqAµ ∂µ + ∂ µ ∂µ + iq(∂µ Aµ ) − q2 A2 + M 2 ϕ(x) = 0
(1.33)
Scegliendo ora la gauge di Lorenz ∂µ Aµ = 0
(1.34)
evidentemente Lorenz invariante a differenza, per esempio, della gauge di Coulomb, si ottiene + 2iqAµ ∂µ − q2 A2 + M 2 ϕ(x) = 0 (1.35) Come visto, la soluzione generale dell’equazione di Klein-Gordon è una combinazione di onde piane del tipo ϕ± (x) = e∓ikx con ϕ+ (x) soluzione ad energia positiva e ϕ− (x) soluzione ad energia negativa. Inserendole nella 1.35 otteniamo h i −Dµ Dµ ϕ+ (x) = (ωk − qA0 )2 − (~k − q~A)2 ϕ+ = M 2 ϕ+ h i −Dµ Dµ ϕ− (x) = (ωk + qA0 )2 − (~k + q~A)2 ϕ− = M 2 ϕ− Questi risultati ci dicono che se noi consideriamo ϕ+ come la funzione d’onda relativa ad una particella di massa M e carica q, per esempio l’elettrone, allora l’equazione di Klein-Gordon accoppiata relativa a ϕ− (x) si ottiene dalla precedente sostituendo q con −q e lasciando invariata M. Quindi, possiamo intuire che ϕ− (x) sia la funzione d’onda riferita all’antiparticella dell’elettrone, cioè il positrone12 . IMPORTANTE: le soluzioni dell’equazione 1.32 sono complesse. Dimostriamo ora che considerando il limite non relativistico M |~k|, o analogamente M Ek , l’equazione di Klein-Gordon accoppiata si riduce a quella si Schrödinger accoppiata. Infatti, nel limite non relativistico q k2 +··· ' M ωk = |~k|2 + M 2 ' M + 2M ossia domina il termine di massa. Possiamo allora ridefinire la soluzione dell’equazione di Klein-Gordon accoppiata come ϕ(~x,t) ≡ e−iMt ϕ 0 (~x,t) ossia la fattorizziamo in un termine di oscillazione legato alla massa (e−iMt ) e in un termine di oscillazione legato all’energia cinetica (ϕ 0 (~x,t)). In questo modo, dalla 1.32 deriva che h i 2 2 2 −iMt 0 ~ ~ (∂0 + iqA0 ) − (∇ − iqA) + M e ϕ (~x,t) = 0 12
Ribadiamo che il tutto sarà più rigoroso nel contesto delle teorie di campo.
18
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
cioè i h 2 2 2 −iMt 0 −iMt ~ ~ (∇ − iqA) ϕ 0 (~x,t) (∂0 + iqA0 ) + M e ϕ (~x,t) = e ossia −iMt e (−M 2 ϕ 0 − 2iM∂0 ϕ 0 + ∂02 ϕ 0 + 2qMA0 ϕ 0 + 2iqA0 ∂0 ϕ 0 − q2 A20 ϕ 0 + M 2 ϕ 0 ) = i h = e−iMt (~∇ − iq~A)2 ϕ 0 cioè i h 2 0 0 2 2 0 0 2 0 ~ ~ −2iM∂0 ϕ + ∂0 ϕ + 2qMA0 ϕ + 2iqA0 ∂0 ϕ − q A0 ϕ = (∇ − iqA) ϕ 0 Imponiamo a questo punto le condizioni di approssimazione non relativistica, ossia: 0 1. M ∂ϕ0 ϕ0 ∼ ωk = Ek , energia cinetica;
13 ,
ossia la massa della particella è molto maggiore della sua
2. M |qA0 |, ossia l’energia potenziale elettrica è trascurabile rispetto alla massa. Così facendo, i termini proporzionali alla massa prevalgono, dunque, trascurando tutti gli altri, otteniamo 1 ~ 0 2 ~ i∂0 ϕ = − (∇ − iqA) + qA0 ϕ 0 2M che non è altro che l’equazione di Schrödinger14 . Si verifichi per esercizio che l’equazione di continuità per l’equazione 1.32 è ∂µ J µ = 0 dove
1.5
J µ = (ρ, ~j)
h → i ρ = i ϕ ∗ ← qA0 ϕ ∗ ϕ 2 ∂0 ϕ − → ~j = − i ϕ ∗ ← ∇ ϕ − q~Aϕ ∗ ϕ 2
(1.36)
Paradosso di Klein
Consideriamo un sistema costituito da una particella carica quantistico-relativistica incidente su di un gradino di potenziale V dovuta alla presenza di un campo elettromagnetico esterno. Sia dunque Aµ = (A0 , ~A), dunque qAµ = (V, 0), con ( 0 V= V
, se z < 0 (regione 1) , se z > 0 (regione 2)
dove per comodità l’asse z individua la direzione del moto della particella. Si noti infatti che ϕ 0 non è altro che un termine proporzionale a qualcosa del tipo eiωk t , che derivato nel tempo è iωk ϕ 0 . 14 Si ricordi infatti che l’operatore corrispondente ad H è i∂ . 0 13
1.5. PARADOSSO DI KLEIN
19
Figura 1.1: Scattering tra una particella quantistico-relativistica libera e un gradino di potenziale. Come visto nei precedenti corsi di meccanica quantistica , la funzione d’onda associata al sistema in questione è ϕ+ = e−iωt χ(z) con
( χ(z) =
χ1 (z) = eikz z + re−ikz z
(regione 1)
χ2 (z) = τe
(regione 2)
0 ikz z
dove r è il rapporto tra l’ampiezza dell’onda riflessa nella regione 1 e l’ampiezza dell’onda incidente, e τ è il rapporto tra l’ampiezza dell’onda trasmessa nella regione 2 e l’ampiezza dell’onda incidente. Chiamando ϕ1,2 = e−iωt χ1,2 allora: 1. nella regione 1 vale la legge di Klein-Gordon libera, cioè ( + M 2 )ϕ1 = [(∂02 − ~∇2 ) + M 2 ]ϕ1 = 0 dalla quale deriva la legge di dispersione ω 2 − kz2 − M 2 = 0
=⇒
kz =
p ω 2 − M2
(1.37)
2. nella regione 2 vale la legge di Klein-Gordon con accoppiamento minimale, cioè h i (D2 + M 2 )ϕ2 = (∂0 − iV )2 − ~∇ − ~∇2 + M 2 ϕ2 = 0 dalla quale deriva la legge di dispersione 0
(ω −V )2 − kz2 − M 2 = 0
=⇒
kz0 =
q (ω −V )2 − M 2
A questo punto, per avere una buona soluzione dobbiamo imporre: i. la continuità della funzione ϕ(z,t) in z = 0, cioè ϕ1 (0,t) = e−iωt (1 − r) = e−iωt τ = ϕ2 (0,t)
=⇒
τ = 1−r
ii. la continuità della derivata ∂z ϕ(z,t) in z = 0, cioè ∂z ϕ1 (0,t) = ikz e−iωt (1 − r) = ikz0 e−iωt τ = ∂z ϕ2 (0,t)
(1.38)
20
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
Queste due condizioni forniscono un sistema di incognite r e τ, la cui soluzione è r=
kz − kz0 kz + kz0
τ=
2kz kz + kz0
Considerando la quadricorrente conservata 1.36 si dimostra che la densità e la densità di corrente nelle due regioni sono ( ρ1 = ω|χ1 |2 (1.39) j1 = kz (1 − |r|2 ) ρ = (ω −V )|τ|2 ei(kz0 −kz0 ∗ )z 2 0 (1.40) j = kz0 +kz∗ |τ|2 ei(kz0 −kz0 ∗ )z 2
2
kz0
con in generale complesso. Valutiamo ora tre casi distinti: 1. ω ≥ V +M, ossia il caso equivalente alla situazione in cui, per l’equazione di Schrödinger, si ha la particella con energia maggiore del potenziale. In questo caso le equazioni 1.37 e 1.38 ci dicono che kz , kz0 ∈ R, essendo in ambo i casi i radicandi numeri reali. Allora, dalle equazioni 1.39 e 1.40 deriva che ( ( 2 ρ1 = ω|χ1 | ρ2 = (ω −V )|τ|2 j1 = kz (1 − |r|2 ) j2 = kz0 |τ|2 si noti che, essendo (ω −V ) = M > 0 e kz0 > 0 poichè l’onda trasmessa va verso il semiasse z positivo, allora ρ1,2 ≥ 0 e j1,2 ≥ 0. Definendo il coefficiente di riflessione R e il coefficiente di trasmissione T jIN − j1 (1.41) R= jIN j2 T = (1.42) jIN in questo caso si ottiene kz − kz0 2 kz0 2 4kz kz0 2 R = |r| = T = |τ| = kz + kz0 kz (kz + kz0 )2 Come si può notare, entrambi questi coefficienti sono positivi e la loro somma è 1: R +T = 1 Come nel caso non relativistico, essi possono essere interpretati rispettivamente come la probabilità che l’onda incidente venga riflessa dal gradino di potenziale e la probabilità che l’onda incidente venga trasmessa nella zona in cui il gradino di potenziale è presente; 2. V − M ≤ ω < V + M, cioè la particella ha energia inferiore alla barriera di potenziale. In questo caso le equazioni 1.37 e 1.38 ci dicono che kz ∈ R, ma kz0 è immaginario, cioè kz0 = ik, k ∈ R. Allora, dalle equazioni 1.39 e 1.40 deriva che ( ( ρ1 = ω|χ1 |2 ρ2 = (ω −V )|τ|2 e−2kz j1 = kz (1 − |r|2 ) j2 = 0
1.5. PARADOSSO DI KLEIN
21
Si noti che la quantità ρ2 decade esponenzialmente, ma può assumere valori sia positivi che negativi, visto che, in generale, (ω − V ) ≷ 0: questo implica che ρ2 non può essere interpretata come densità di probabilità. Inoltre: 0 k + ik0 ∗ k − ik kz2 + |kz0 |2 0 z z z z 2 = 1 T = =0 R = |r| = = 0 kz + ikz0 kz − ikz∗ kz2 + |kz0 |2 jIN Anche in questo caso R + T = 1 e i due coefficienti possono essere interpretati in termini probabilistici. In particolare, in questo caso l’onda incidente viene sicuramente riflessa; 3. ω < V − M, ossia la particella ha un’energia di molto inferiore alla barriera di potenziale, tanto da poter parlare di regione di potenziale forte. In questo caso, le equazioni 1.37 e 1.38 ci dicono che kz , kz0 ∈ R, perciò le densità e densità di corrente nelle regioni 1 e 2 hanno la stessa forma di quelle nel caso ω > V + M. Ora però c’è una grossa differenza: dato che (ω −V ) < 0 per ogni valore di ω < V − M, allora ρ2 non può mai essere interpretata come densità di probabilità. Ora, dato che la particella trasmessa si propaga nel verso positivo dell’asse z ci aspettiamo che kz0 > 0. Tuttavia, essendo la velocità di gruppo la quantità fisica che indica la direzione di propagazione dell’onda, e dovendo dunque questa essere > 0, allora vg =
kz0 kz0 ∂ω q >0 = = 02 ∂ kz0 ω −V 2 kz + M
=⇒
kz0 < 0
essendo (ω −V ) < 0. Tutto questo implica che j2 < 0. Inoltre, scrivendo 0 > kz0 = −|kz0 |: kz − kz0 2 kz + |kz0 | 2 R = |r| = >1 = kz + kz0 kz − |kz0 | 2
T =
4kz kz0 4kz |kz0 | = − <0 (kz + kz0 )2 (kz + kz0 )2
Questi ultimi risultati sono l’essenza del cosiddetto paradosso di Klein: interpretando R e T in termini probabilistici, allora se mando una particella incidente ne ritornano indietro più di una, mentre ne viene trasmesso un numero negativo. In particolare, poichè ancora R + T = 1, secondo questi risultati è possibile la situazione paradossale in cui mandando una particella ne vengano riflesse 2 e ne venga trasmessa -1. Pur trattandosi di un paradosso per quelli che sono i risultati ottenuti, possiamo interpretare tutto questo in maniera fisica. Supponiamo che ω sia di poco minore di V : il fatto che ρ2 possa essere negativo si può interpretare come una possibilità che a ridosso della buca vi sia la produzione di coppie particella-antiparticella, le quali però annichilano immediatamente, giustificando la corrente nulla nella regione 2. Se ora ω V , ossia la regione 2 è di potenziale forte, allora il potenziale è in grado di accelerare nella regione 2 le antiparticelle: in questo modo, interpreto j2 < 0 come una corrente di antiparticelle. Nonostante questa interpretazione, il paradosso di Klein evidenzia i limiti della quantizzazione di sistemi relativistici sino ad ora effettuata. Nel caso dell’equazione di KleinGordon, infatti, non permette un’interpretazione probabilistica della funzione d’onda e questo porta ad evidenti inconsistenze15 . 15
La soluzione si troverà solo nel contesto delle teorie di campo, nelle quali il numero di particelle del sistema non è vincolato come nei casi sino ad ora trattati.
22
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
1.6
Equazione di Dirac
Nel 1928 Dirac propone una nuova formulazione della quantizzazione dei sistemi relativistici. La sua idea si basa sulla volontà di ottenere un’equazione d’onda lineare nelle derivate, evitando così le inconsistenze derivanti da un’equazione d’onda quadratica (Klein-Gordon). Dirac propone un’equazione delle onde del tipo i
∂ψ = −i~α · ~∇ + β M ψ = Hψ ∂t
(1.43)
dove nel membro di sinistra compare una sola derivata temporale e nel membro di destra una sola derivata spaziale. Ora, si tratta di capire che tipo di oggetti sono α1 , α2 , α3 , β , sulla base di alcuni requisiti che diano un senso fisico alla nostra equazione. Imponendo queste condizioni, l’equazione d’onda risultante dovrà: • avere un’equazione di continuità della probabilità; • essere covariante, cioè essere consistente con il principio di relatività. Imponiamo dunque le seguenti richieste: i. l’operatore hamiltoniano H = −i~α · ~∇ + β M deve essere hermitiano, in modo tale che sia autoaggiunto, cioè un’osservabile. Questo implica (verificare per esercizio) che αi = αi∗ e β = β ∗ , cioè che αi , β ∈ R; ii. l’equazione di Dirac deve essere consistente con l’espressione relativistica E 2 = p2 + M 2 , 2 dunque con l’equazione di Klein-Gordon. Per fare questo, calcoliamo ∂∂tψ2 : i h i ∂ 2ψ ∂ ∂ψ ∂ h ~∇ + β M ψ = −i −i~α · ~∇ + β M ∂ ψ = ~ = −i i = −i −i α · ∂t 2 ∂t ∂t ∂t ∂t h ih i = − −i~α · ~∇ + β M −i~α · ~∇ + β M ψ = = αi α j ∂ i ∂ j + i (αi β + β αi ) M∂ i − β 2 M 2 ψ Ora, per essere consistente con l’equazione di Klein-Gordon deve valere16 ∂ 2 ψ ~ 2 2 = ∇ − M ψ ∂t 2 e questo implica che α1 , α2 , α3 , β devono soddisfare le seguenti proprietà: αi , α j = αi α j + α j αi = 2δi j
(1.44)
{αi , β } = αi β + β αi = 0
(1.45)
β2 = 1
(1.46)
Tuttavia queste proprietà non possono essere soddisfatte da semplici numeri, quindi α1 , α2 , α3 , β devono essere degli oggetti più complicati. Dirac propose che α1 , α2 , α3 , β fossero dunque delle matrici N × N, ossia l’oggetto più semplice in grado di soddisfare le proprietà 16
Deriva direttamente dalla 1.20.
1.6. EQUAZIONE DI DIRAC
23
1.44, 1.45 e 1.46. Di conseguenza, la funzione d’onda ψ dovrà essere un vettore di dimensione N e l’equazione ∂ψ = Hψ ∂t sarà di conseguenza un’equazione vettoriale. Le matrici suddette dovranno dunque soddisfare le seguenti proprietà: • devono essere hermitiane, cioè αi+ = α, β + = β ; • dalla 1.44 deriva immediatamente che αi2 = 1, i = 1, 2, 3, e vale anche la 1.46; • dalla 1.44 deriva che {αi , α j } = 0 , ∀i 6= j e vale la 1.45. La seconda di queste proprietà ci dice, in particolare, che gli autovalori delle quattro matrici sono solamente ±1. Inoltre: Tr[αi ] = Tr[αi α j α j ] = −Tr[α j αi α j ] = −Tr[αi α j α j ] = −Tr[αi ] | {z } 1
dove al secondo passaggio si sfrutta la proprietà {αi , α j } = 0 per i 6= j, mentre al terzo passaggio si sfrutta la ciclicità della traccia17 . Il tutto implica che Tr[αi ] = 0
i = 1, 2, 3
e affinchè questo accada è necessario che la dimensione delle matrici αi , e dunque di β , deve essere pari: N = dim αi = dim β = PARI Cerchiamo dunque per quali N pari riusciamo a trovare delle matrici che soddisfano le proprietà suddette. N=2 Le matrici di Pauli 0 1 σ1 = 1 0
0 −i σ2 = i 0
1 0 σ3 = 0 −1
(1.47)
soddisfano le proprietà elencate precedentemente. Infatti, esse soddisfano le proprietà 18 σi+ = σi σi2 = 1 {σi , σ j } = 2δi j (1.48) Possiamo quindi identificare αi ≡ σi , i = 1, 2, 3. Per trovare β , ci ricordiamo del fatto che una base dello spazio delle matrici 2 × 2 è costituita da (1, σi ), cioè una generica matrice M si può scrivere come 3
M = m0 1 + ∑ Mi σi i=1
17 18
Tr[ABC] = Tr[BCA] = Tr[CAB]. Esse soddisfano anche le proprietà [σi , σ j ] = 2iεi jk σk σi σ j = iεi jk σk + δi j · 1
24
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER con m0 ∈ C e M1 , M2 , M2 matrici 2 × 2. Ma visto che l’obiettivo è trovare β , la quale in particolare deve soddisfare la proprietà 1.45, allora deve valere {M, σ j } = 0, cioè 3
0 = {M, σ j } = m0 {1, σ j } + { ∑ Mi σi , σ j } i=1
ma visto che la matrice identità commuta con tutte le matrici, cioè {1, σ j } 6= 0, necessariamente m0 = 0, ma allora M non è altro che una combinazione lineare delle matrici di Pauli. Quindi per N = 2 non riusciamo a trovare quattro matrici indipendenti che soddisfino tutte le proprietà di cui abbiamo bisogno. N=4 In questo caso è possibile trovare le matrici α1 , α2 , α3 e β : si tratta delle matrici 4 × 4 diagonali a blocchi 0 σi 1 0 αi = β= (1.49) σi 0 0 −1 dette matrici di Dirac (verificare per esercizio che le matrici 1.49 soddisfano le proprietà volute). Questo significa che la dimensione minima dello spazio spinoriale, ossia lo spazio vettoriale su cui agiscono le matrici di Dirac, è N=4. Si noti che nel caso di particella non massiva (M = 0) la dimensione minima dello spazio spinoriale è 2 (il termine β M nell’hamiltoniana è nullo, quindi sono sufficienti le matrici αi , i = 1, 2, 3). Poco dopo lo stesso Dirac propose una diversa scrittura delle proprie matrici: egli introdusse la quantità γ µ = (γ 0 , γ i ) i = 1, 2, 3 dove
12 02 γ =β = 02 −12
0
i
γ = β αi =
02
σi
−σi 02
(1.50)
Questa è la rappresentazione di Dirac delle matrici di Dirac (detta anche non relativistica, in quanto utile per studiare il limite non relativistico). In tale rappresentazione si definisce anche l’operatore di chiralità i εµνρσ γ µ γ ν γ ρ γ σ = iγ 0 γ 1 γ 2 γ 3 4! che nella rappresentazione di Dirac delle matrici di Dirac è 02 12 5 γ = γ5 =
(1.51)
(1.52)
12 02
Un’altra importante rappresentazione delle matrici di Dirac è la rappresentazione di Weyl 02 12 02 σi −12 02 0 i 5 γ = γ = β αi = γ = (1.53) 12 02 −σi 02 02 12 utile per studiare il limite ultrarelativistico. Le matrici 1.50 e l’operatore di chiralità 1.52 soddisfano le seguenti proprietà19 : γ 0 = (γ 0 )+ , γ 5 = (γ 5 )+ 19
hermitiane ;
γ i = −(γ i )+
antihermitiana
(1.54)
ATTENZIONE: nonostante valga la proprietà 1.56, la quale definisce la cosiddetta algebra di Clifford, lo spazio spinoriale di dimensione 4 è uno spazio diverso dallo spazio di MinkowsKi!
1.6. EQUAZIONE DI DIRAC
25 (γ 0 )2 = (γ 5 )2 = 14
{γ µ , γ ν } = 2η µν {γ 5 , γ µ } = 04
(γ i )2 = −14
(1.55)
µ, ν = 0, 1, 2, 3
(1.56)
µ, ν = 0, 1, 2, 3
(1.57)
Inoltre, le matrici γ soddisfano la proprietà γ 0 (γ µ )+ γ 0 = γ µ
µ, ν = 0, 1, 2, 3
(1.58)
Si può dimostrare che per ciascuna matrice invertibile C le matrici γ˜µ = Cγ µ C−1 soddisfanno la condizione 1.56. Affinchè siano soddisfatte anche le proprietà 1.54 e 1.55, la matrice C deve essere anche unitaria. Dunque, moltiplicando a sinistra ambo i membri dell’equazione ∂ψ ~ i = −i~α · ∇ + β M ψ = Hψ ∂t per β = γ 0 si ottiene iγ 0 ∂0 ψ + iγ i ∂i ψ − Mψ = 0 da cui l’equazione di Dirac20 (iγ µ ∂µ − M)ψ = (i∂/ − M)ψ = 0
(1.59)
L’equazione di Dirac è un’equazione vettoriale, cioè consiste nelle quattro equazioni scalari µ i∂αβ ∂µ − Mδαβ ψβ = 0 α, β = 0, 1, 2, 3 (1.60) dette equazione di Dirac in indici spinoriali21 . Verifichiamo la consistenza dell’equazione di Dirac con l’equazione di Klein-Gordon tramite il formalismo delle matrici γ µ : moltiplicando a sinistra per −i∂/ + M l’equazione 1.59 otteniamo 0 = ∂/∂/ + iM ∂/ − iM ∂/ + M 2 ψ = γ µ γ ν ∂µ ∂ν + M 2 ψ = 1 µ ν 2 {γ , γ } ∂µ ∂ν + M ψ = η µν ∂µ ∂ν + M 2 ψ = = 2 = + M2 ψ avendo utilizzato alla seconda riga la proprietà 1.56 e avendo riscritto γ µ γ ν ∂ µ ∂ν =
1 µ ν γ γ ∂µ ∂ν + γ µ γ ν ∂µ ∂ν 2
da cui, cambiando i nomi agli indici µ e ν nel secondo addendo e sfruttando la commutatività reciproca delle derivate, si ottiene 1 µ ν 1 µ ν µ ν ν µ {γ , γ } ∂µ ∂ν γ γ ∂ µ ∂ν = γ γ ∂ µ ∂ν + γ γ ∂ µ ∂ν = 2 2 20
/ ≡ γ µ Pµ = γµ Pµ , cioè P contratto con γ µ di componenti 1.50. Per definizione P D’ora in avanti riserveremo µ e ν per indicare gli indici di Lorenz, mentre riserveremo α e β per indicare gli indici spinoriali. 21
26
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
L’equazione appena ottenuta in realtà è ancora un’equazione di tipo vettoriale. Formalmente, infatti, l’equazione andrebbe scritta così: · 14 + M 2 · 14 ψ = 0 evidenziando il fatto che ψ è e resta uno spinore 22 . Dunque, l’equazione di Dirac è consistente con quella di Klein-Gordon nella misura in cui ciascuna delle quattro componenti dello spinore ψ soddisfa l’equazione 1.20: + M 2 ψα = 0, α = 0, 1, 2, 3 a differenza di quanto accade nell’equazione di Dirac, nella quale le varie componenti di ψ vengono mescolate, non essendo γ µ diagonale. L’equazione di Dirac è un’equazione lineare nelle derivate, proprio come richiesto all’inizio. Essa però deve essere compatibile con il principio di relatività ristretta, cioè deve essere un’equazione covariante. In questo caso, il problema riguarda lo spinore ψ. Supponiamo che lo spinore ψ sotto trasformazioni di Lorenz trasformi come ψ 0 (x0 ) = S(Λ)ψ(x)
(1.61)
ψα0 (x0 ) = S(Λ)α ψβ (x) β
dove S(Λ) è la rappresentazione spinoriale del gruppo di Lorenz 23 . Applicando una trasformazione di Lorenz al primo membro dell’equazione 1.59 otteniamo 24 iγ µ Λνµ ∂ν − M S(Λ)ψ(x) = S(Λ) iΛνµ S(Λ)−1 γ µ S(Λ)∂ν − M ψ(x) Questo significa che l’equazione di Dirac è covariante se e solo se Λνµ S(Λ)−1 γ µ S(Λ) = γ ν cioè S(Λ)−1 γ µ S(Λ) = Λν γ ν µ
(1.62)
Questo significa che le matrici S(Λ) sotto cui devono trasformare gli spinori devono essere tali da far trasformare γ µ come un quadrivettore, cosa non scontata a priori, non essendo µ di γ µ un indice di Lorenz (tra poco vedremo meglio cosa significa). 22
Di fatto la matrice identità 4 × 4 si omette sempre. Questo significa che S è la rappresentazione del gruppo di Lorenz avente come sede lo spazio spinoriale. Noi conosciamo altre due rappresentazioni del gruppo di Lorenz: 23
1. la rappresentazione banale ψ 0 (x0 ) = ψ(x), cioè quella che mappa tutti gli elementi del gruppo di Lorenz nell’identità (Λ 7−→ 1); 2. la rappresentazione vettoriale, vista per esempio con il quadripotenziale Aµ 0
A µ (x0 ) = Λν Aν (x) µ
in cui cioè i quadrivettori trasformano come le coordinate. In questo caso, la sede della rappresentazione è lo spazio di MinkowsKi. 24
Si sfrutta il fatto che Λνµ commuta con S(Λ) , in quanto agenti su spazi differenti, e che S(Λ)S(Λ−1 ) = 1.
1.6. EQUAZIONE DI DIRAC
27
A questo punto non ci resta che trovare le matrici S(Λ). Consideriamo trasformazioni infinitesime del gruppo di Lorenz. Nella rappresentazione vettoriale si tratta di considerare le trasformazioni µ µ µ Λν = ην + ων µ
dove le ων sono matrici 4 × 4 antisimmetriche che rappresentano trasformazioni infinitesime in un intorno dell’identità nello spazio di MinkowsKi. Nella rappresentazione spinoriale, invece, si tratta di considerare le trasformazioni i S(Λ) = 1 − ωµν Σµν 2 µ
dove Σν sono matrici 4 × 4 antisimmetriche che rappresentano trasformazioni infinitesime in un intorno dell’identità nello spazio spinoriale (dette generatori del gruppo di Lorenz nello spazio spinoriale). Analogamente i S(Λ)−1 = 1 + ωµν Σµν 2 Inserendo il tutto nella relazione 1.62 si ottiene i i µ ρσ µ ρσ 1 + ωρσ Σ γ 1 − ωρσ Σ = γ µ + ωσ γ σ 2 2 da cui
i γ µ − ωρσ [γ µ , Σρσ ] + O(ω 2 ) = γ µ + ωρσ η µρ γ σ 2 perciò, sfruttando l’antisimmetria di ω: i 1 − ωρσ [γ µ , Σρσ ] = ωρσ η µρ γ σ = ωρσ (η µρ γ σ − η µσ γ ρ ) 2 2 da cui infine [γ µ , Σρσ ] = i (η µρ γ σ − η µσ γ ρ ) Si verifichi per esercizio che vale la relazione Σµν =
1 i µ ν [γ , γ ] ≡ σ µν 4 2
(1.63)
25
con σ µν ≡
i µ ν [γ , γ ] 2
(1.64)
visto che la matrice γ 5 definita nella 1.50 anticommuta con tutte le γ µ (proprietà 1.58) allora si verifica che [γ 5 , Σµν ] = 0 (1.65) Questo risultato ci dice che la rappresentazione spinoriale del gruppo di Lorenz non è una rappresentazione irriducibile, in quanto esiste un elemento della rappresentazione stessa che commuta con i suoi generatori26 . Scritte in forma non infinitesima, le matrici S(Λ) sono dunque i µν (1.66) S(Λ) = exp − ωµν Σ 2 i −1 µν S(Λ) = exp ωµν Σ (1.67) 2 valide comunque in un intorno dell’identità. Definiamo ora alcuni oggetti: 25
NOTA BENE: è importante sottolineare che ai fini del calcolo nello spazio spinoriale il tensore metrico η µν è proporzionale all’identità 14 , ossia commuta con tutti gli operatori spinoriali. Esso infatti agisce sullo spazio di Minkowski, che non coincide con lo spazio spinoriale. 26 Nel modulo A del corso di Fisica Teorica si vedrà che la rappresentazione del gruppo di Lorenz ha dim = 2.
28
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER i. definiamo l’operatore di spin
1 2
1 Σi = εi jk Σ jk , 2 E’ facile verificare che 27
i = 1, 2, 3
(1.68)
1 σi 0 Σi = 2 0 σi
scrivendo quindi Σi in funzione delle matrici di Pauli, associate a rappresentazioni del gruppo SO(2) isomorfo al gruppo di spin ± 12 . Si verifica facilmente che spin e momento angolare presi separatamente non si conservano (cioè non commutano con l’hamiltoniano), bensì si conserva la loro somma, ossia il momento angolare totale. Dati gli operatori 1 σ3 0 H = ~α ·~p + β M L3 = x1 p2 − x2 p1 Σ3 = 2 0 σ3 allora 28 [H, L3 ] = [αi pi + β M, L3 ] = [αi pi , L3 ] + [β M, L3 ] = αi [pi , L3 ] = αi [pi , x1 p2 − x2 p1 ] = αi [pi , x1 p2 ] − αi [pi , x2 p1 ] = = α1 (p1 x1 p2 − x1 p2 p1 ) − α2 (p2 x2 p1 − x2 p1 p2 ) = = α1 (p1 x1 p2 − x1 p1 p2 ) − α2 (p2 x2 p1 − x2 p2 p1 ) = = α1 ([p1 , x1 ]p2 ) − α2 ([p2 , x2 ]p1 ) = = −i¯h(α1 p2 − α2 p1 ) = −i¯hεi jk αi p j avendo sfruttato il fatto che 29 [xi , p j ] = i¯hδi j ossia che se i e j sono diversi allora xi e p j commutano. Valendo [β , Σ3 ] = 0 (è facile da verificare: basta fare il conto esplicito) in maniera del tutto analoga si dimostra che [H, Σ3 ] = i¯h(α1 p2 − α2 p1 ) = iεi jk αi p j Dato che il momento totale è J3 = L3 + Σ3 , allora dai due risultati precedenti è immediato verificare che [H, J3 ] = 0 ii. l’operatore elicità è definito così: σp ≡
~Σ ·~p |~p|
(1.69)
L’elicità non è altro che la proiezione dello spin lungo la direzione del moto, la quale si conserva nel tempo (esercizio); Un modo per farlo è sfruttando il fatto che σ j σk = iεi jk σk + δ jk · 12 e εi jk ε jkl = 2δil BENE: gli operatori x e p vivono su uno spazio differente rispetto a quello spinoriale dove vivono invece α, β e Σ. Questo implica la commutatività, in quanto è indifferente far agire prima uno e poi l’altro operatore, vivendo appunto su spazi diversi. 29 In questi conti h viene esplicitato, ma sappiamo che, essendo in unità di misura naturali, h = 1. ¯ ¯ 27
28 NOTA
1.6. EQUAZIONE DI DIRAC
29
iii. consideriamo l’equazione aggiunta della 1.59: ← − 0 = − ∂µ ψ + i (γ µ )+ − ψ + M ≡ −ψ + i (γ µ )+ ∂µ + M ← − dove il simbolo ∂µ significa che la derivata ∂µ agisce sulla funzione che sta alla sua sinistra, cioè ψ. Sfruttando le proprietà 1.58 e 1.54 l’equazione precedente diventa ← ← − − 0 = −ψ + iγ 0 γ µ γ 0 ∂µ + M γ 0 γ 0 = − ψ + γ 0 iγ µ ∂µ + M γ 0 |{z} 1
Definendo a questo punto lo spinore coniugato ψ(x) ≡ ψ + (x)γ 0
(1.70)
l’equazione di Dirac 1.59 e la sua aggiunta possiamo scriverle rispettivamente nel modo seguente: → − i ∂/ − M ψ(x) = 0 ← − / ψ(x) i ∂ + M = 0 Ricordando ora la 1.61 otteniamo 0
ψ 0 (x0 ) = ψ + (x0 )γ 0 = ψ + (x)S+ (Λ)γ 0 = ψ + (x)γ 0 γ 0 S+ (Λ)γ 0 Dato che (verificare) γ 0 S+ (Λ)γ 0 = S−1 (Λ) allora lo spinore coniugato sotto trasformazioni di Lorenz trasforma come ψ 0 (x0 ) = ψ(x)S−1 (Λ)
(1.71)
Definiamo ora lo scalare matriciale bilineare ψ(x)ψ(x). Sotto trasformazioni di Lorenz esso trasforma come ψ(x)ψ(x) 7−→ ψ(x)S−1 (Λ)S(Λ)ψ(x) = ψ(x)ψ(x) Questo implica che ψ(x)ψ(x) è sia uno scalare matriciale, sia uno scalare di Lorenz. A questo punto, possiamo vedere il significato dell’indice µ dell’oggetto γ µ definito in 1.50. Infatti, sotto trasformazioni di Lorenz la quantità ψγ µ ψ trasforma così (si ricordi la relazione 1.62): µ ψγ µ ψ 7−→ ψS−1 γ µ Sψ = Λν ψγ ν ψ cioè l’oggetto ψγ µ ψ trasforma come un vettore di Lorenz. L’indice µ di γ µ è dunque un indice quasi di Lorenz, nel senso che rende quadrivettoriale anche la quantità ψγ µ ψ. Giunti a questo punto, abbiamo sviluppato l’intero formalismo. Possiamo dunque ricercare l’equazione di continuità dell’equazione di Dirac, andando poi a valutarne la consistenza o meno con un’interpretazione in termini di equazione di continuità della probabilità. Moltiplicando a sinistra l’equazione di Dirac per ψ e moltiplicando a destra la sua aggiunta per ψ otteniamo → ← − − / / ψ i ∂ − M ψ(x) = 0 ψ(x) i ∂ + M ψ = 0
30
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
Facendo la somma membro a membro si ottiene 0 = i ∂µ ψ γ µ ψ + ψγ µ ∂µ ψ = i∂µ (ψγ µ ψ) cioè possiamo definire la quadricorrente conservata associata all’equazione di Dirac J µ = ψγ µ ψ
∂µ J µ = 0
(1.72)
Scritta in componenti: ( ρ = J 0 = ψγ 0 ψ = ψ + γ 0 γ 0 ψ = ψ + ψ J i = ψγ i ψ = ψ + γ 0 γ i ψ = ψ + α i ψ Dunque, l’equazione di continuità ∂0 ρ + ∂i J i = 0 permette di definire la carica conservata Z
Q=
3
Z
ρd x =
ψ + ψd 3 x
Purtroppo, anche in questo caso, come vedremo, Q non è definita positiva, impedendo l’interpretazione probabilistica della funzione d’onda.
1.6.1
Soluzione generale dell’equazione di Dirac
Per costruzione, l’equazione di Dirac risulta consistente con l’equazione di Klein-Gordon, quindi le sue soluzioni dovranno essere consistenti con e−ikx + eikx , rispettivamente onde piane di energia positiva e negativa. Trattandosi tuttavia di un’equazione vettoriale, le soluzioni dell’equazione di Dirac saranno allora del tipo −ikx ikx ψ(x) ' u(k)e + v(k)e ≡ ψ+ (x) + ψ− (x) k0 =ωk
dove u(k) e v(k) sono rispettivamente lo spinore a energia positiva e lo spinore a energia negativa nello spazio dei momenti. Dunque, l’equazione di Dirac nello spazio dei momenti assume la seguente forma: (i∂/ − M)ψ+ (x) = e−ikx (/k − M)u(k) = 0
=⇒
(/k − M)u(k) = 0
(E > 0)
(1.73)
(i∂/ − M)ψ− (x) = −eikx (/k + M)v(k) = 0
=⇒
(/k + M)v(k) = 0
(E < 0)
(1.74)
Consideriamo il caso di spinori massivi (M 6= 0): in questo caso è possibile determinare le soluzioni dell’equazione di Dirac nel sistema di riferimento a riposo della particella, nel quale il quadrimomento della particella è µ kR = (M, 0) per poi trovare le soluzioni valide in un generico sistema di riferimento tramite un boost di Lorenz. Allora, nel sistema di quiete della particella le equazioni 1.73 e 1.74 diventano " ! !# 1 0 1 0 2 2 2 2 ( − u(M) = 0 M 0 −12 0 1 (Mγ 0 − M 14 )u(M) = 0 2 2 2 " ! !# =⇒ (Mγ 0 + M 14 )v(M) = 0 1 0 1 0 2 2 2 2 + v(M) = 0 M 02 12 02 −12
1.6. EQUAZIONE DI DIRAC
31
dove u(M) e v(M) sono gli spinori calcolati nel sistema di quiete della particella. Questo implica dunque che ! ! x 0 0 2 2 =0 0 −21 y x 02 2 2 ! ! =⇒ u(M) = v(M) = y 02 x 212 02 = 0 0 0 y 2 2 dove x e y sono oggetti a 2 componenti. Questo implica che l’equazione di Dirac prevede quattro soluzioni indipendenti, con in particolare due soluzioni degeneri per ciascuno dei due casi energetici. Scegliendo la proprietà di normalizzazione vr (M)vs (M) = −2Mδrs
ur (M)us (M) = 2Mδrs consideriamo allora le soluzioni 1 √ 0 u (M) = 2M , 1 0 0 0 √ 0 2M , v (M) = 1 1 0
0 √ 1 u2 (M) = 2M 0 0 0 √ 0 v2 (M) = 2M 0
(E > 0) (1.75) (E < 0)
1
riscrivibili come (
√ ur (M) = 2M
dove
ξr
!
02
1 ξ1 = 0
√ 02 vr (M) = 2M ξr
!
0 ξ2 = 1
La degenerazione in energia delle soluzioni u1 , u2 e v1 , v2 è dovuta al fatto che in realtà questi non sono altro che autostati dell’operatore di spin 1.68. Infatti 1 σ3 ξ 1 1 ξ1 1 1 σ3 02 ξ1 = = u1 (M) Σ3 u1 (M) = = 0 σ 0 0 0 2 2 2 2 2 2 2 3 2 1 1 σ3 0 2 1 σ3 ξ 2 1 −ξ2 02 = − u2 (M) Σ3 u2 (M) = = = ξ2 2 02 σ3 2 02 2 02 2 1 02 1 02 1 1 σ3 02 02 = = = v1 (M) Σ3 v1 (M) = ξ1 2 02 σ3 2 σ3 ξ 1 2 ξ1 2 1 σ3 0 2 1 02 1 02 1 02 = = = − v2 (M) Σ3 v2 (M) = ξ2 2 02 σ3 2 σ3 ξ 2 2 −ξ2 2 Questo significa che nel sistema di riferimento di quiete della particella esistono quattro soluzioni indipendenti:
32
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER 1. u1 (M) con E > 0 e spin 1/2; 2. u2 (M) con E > 0 e spin −1/2; 3. v1 (M) con E < 0 e spin 1/2; 4. v2 (M) con E < 0 e spin −1/2;
Quindi l’introduzione del numero quantico di spin mi giustifica la degenerazione energetica delle soluzioni 30 . A questo punto, invece di applicare direttamente il boost sfruttiamo il trucco seguente: visto che (/k − M)(/k + M)|k0 =ωk = /k 2 − M 2 =0 k0 =ωk
allora possiamo ipotizzare che le soluzioni dell’equazione di Dirac nello spazio dei momenti in un generico sistema di riferimento siano della forma ( u(k) = c(/k + M)u(M) v(k) = d(/k − M)v(M) Esse sono delle buone soluzioni, poichè per k0 = ωk l’equazione di Dirac per questi spinori è (/k − M)u(k) = (/k − M)(/k + M)u(k) = 0 (/k + M)v(k) = (/k + M)(/k − M)v(k) = 0 Scegliendo le condizioni di normalizzazione ur (M)us (M) = 2Mδrs
vr (M)vs (M) = −2Mδrs
che permettono di fissare c e d otteniamo ur (k) = √ /k+M vr (k) =
ur (M) 2M(M+ωk ) √ −/k+M vr (M) 2M(M+ωk )
(E > 0) (E < 0)
(1.76)
Le soluzioni dell’equazione di Dirac in un generico sistema di riferimento nello spazio dei momenti assumono una forma diversa in base alla rappresentazione delle matrici di Dirac utilizzata. In particolare, scegliendo la rappresentazione di Dirac 1.50 allora ! √ M + ω ξ r k ~ ur (k) = √ ~σ ·k ξr M+ωk ! ~ √ ~σ ·k ξr M+ωk vr (k) = √ M + ωk ξr Gli spinori coniugati nello spazio dei momenti sono invece ur (k) = ur (M) √ /k+M (E > 0) 2M(M+ωk ) vr (k) = vr (M) √ −/k+M 2M(M+ωk )
30
(E < 0)
(1.77)
Si noti che la scelta delle soluzioni 1.75 ovviamente non è l’unica possibile, ma se ne possono scegliere altre. Questa particolare scelta permette di scrivere una base di autostati di Σ3 dello spazio spinoriale.
1.6. EQUAZIONE DI DIRAC
33
che nella rappresentazione di Dirac 1.50 diventano ur (k) = √M + ωk ξ T , −ξ T √ ~σ ·~k r r M+ωk √ ~ ~ σ · k T vr (k) = ξ T √ r M+ω , − M + ωk ξr k
Giunti a questo punto, possiamo scrivere la soluzione generale dell’equazione di Dirac per una particella di spin 1/2 31 Z 1 d3k 2 √ (1.78) ψ(x) = cr (k)ur (k)e−ikx + dr∗ (k)vr (k)eikx ∑ 3/2 2ωk r=1 (2π) k0 =ωk
da cui lo spinore coniugato è 1 ψ(x) = (2π)3/2
Z
d3k 2 √ dr (k)vr (k)e−ikx + c∗r (k)ur (k)eikx + ∑ 2ωk r=1
k0 =ωk
Vediamo ora come possiamo costruire i proiettori relativi agli spinori nello spazio dei momenti nel sistema di quiete della particella (1.75). Le matrici 4 × 4 Λ± (k) =
±/k + M 2M
(1.79)
sono i proiettori sugli spinori nello spazio dei momenti di energia positiva e negativa. Infatti Λ+ (k)u(k) = c
/k + M (/k + M)u(M) = c(/k + M)u(M) = u(k) 2M
dove al secondo passaggio abbiamo utilizzato la proprietà /k 2 = M 2
=⇒
/k = M
valida nel rest frame. I proiettori soddisfano le seguenti proprietà: i. Λ2± (k) = Λ± (k) (definizione di proiettore); ii. Λ+ (k) + Λ− (k) = 1; iii. Λ+ (k)Λ− (k) = 0, cioè sono operatori ortogonali; iv. Tr[Λ± ] = 2, cioè non costituiscono una base per i proiettori; v. si possono riscrivere nella forma Λ+ (k) =
∑2r=1 ur (k)ur (k) 2M
Λ− (k) = −
∑2r=1 vr (k)vr (k) 2M
Oltre a dei proiettori sugli autostati dell’hamiltoniana vogliamo anche dei proiettori sugli autostati dell’operatore di spin 1/2. Nel sistema di quiete della particella l’operatore σ3 commuta con l’hamiltoniana, cioè si conserva nel tempo, ma ciò non accade in un sistema di riferimento generico, essendo l’operatore di momento angolare totale a conservarsi. Tuttavia, in un sistema di riferimento generico si conserva l’elicità, ossia la componente dello spin lungo la direzione 31
La sommatoria ∑ri=1 è fatta su tutti i possibili stati di spin (r) (in questo caso r = 2).
34
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
del moto. Cerchiamo dunque dei proiettori su autostati di elicità 1/2. Volendo scrivere tali proiettori tramite il formalismo quadrivettoriale, introduciamo lo pseudo vettore di Pauli-Lubansky32 1 W µ = ε µνρσ Jνρ Pσ (1.80) 2 dove J è l’operatore di momento angolare totale e P l’operatore momento. Esso trasforma bene sotto trasformazione di Lorenz e grazie al fatto che Lµν = Xµ Pν − Xν Pµ e che J = L + Σ allora 1 W µ = ε µνρσ Σνρ Pσ 2 cioè il vettore di Pauli-Lubansky può essere espresso in funzione dei generatori della rappresentazione spinoriale del gruppo di Lorenz Σµν . Il vettore 1.80 nel sistema di quiete della particella è M WR0 = ε 0νρ0 Σνρ = 0 2 M WRi = ε i jk0 Σ jk = MΣi 2 µ Dunque il casimir individuato da W , calcolato nel rest frame, è W 2 W µ Wµ = = Σi Σi = −|~Σ|2 M2 M2 Il segno meno deriva dal fatto che abbiamo un indice spaziale in alto e uno in basso, quindi c’è un segno meno relativo tra i due. Ora, l’operatore di spin al quadrato ha autovalore s(s + 1); si può dimostrare che 3 W2 = −|~Σ|2 = −Σ21 − Σ22 − Σ23 = − · 14 ≡ −s(s + 1) 2 M 4 Questo implica che la rappresentazione che noi stiamo considerando del gruppo di Poincaré si riferisce a particelle con spin 1/2, proprio come ci aspettavamo. In definitiva, possiamo affermare che uno spinore di Dirac descrive un fermione di spin 1/2. Definiamo ora un generico quadrivettore di tipo spazio ortogonale all’operatore momento: ( nµ nµ = −1 nµ (n0 ,~n) : nµ Pµ = 0 Nel rest frame, essendo Pµ = (M, 0), soddisfa le proprietà ( ( nµ nµ = −1 |~n| = 1 =⇒ µ n Pµ = 0 n0 = 0 Ricordandosi della relazione 1.64 possiamo dunque dire che W µ nµ 1 µνρσ 1 µνρσ = ε Σνρ Pσ nµ = ε σνρ Pσ nµ M 2M 4M 32
Il vettore di Pauli-Lubansky individua, insieme all’operatore momento, i casimir del gruppo di Poincaré, che sono P2 = M e W 2 , associato allo spin. Questo implica che identificando massa e spin di una particella automaticamente di individua una rappresentazione del gruppo di Poincaré.
1.6. EQUAZIONE DI DIRAC
35
Utilizzando ora l’identità 33 ε µνρσ σρσ = 2iγ 5 σ µν allora
W µ nµ i 5 µν 1 5 = γ σ Pν nµ = − γ /n /p M 2M 2M che calcolato nel rest frame diventa W µ nµ 1 5 1 5 1 =− γ n0 γ 0 + ni γ i p0 γ 0 + p j γ j = − γ ni γ i p0 γ 0 = − γ 5 ni γ i γ 0 M 2M 2M 2 ossia 34
W µ nµ 1 ~σ ·~n 02 =− = −~Σ ·~n M 2 02 ~σ ·~n
Quindi contrarre W µ con il quadrivettore nµ significa proiettare l’operatore di spin 1/2 lungo la direzione del versore ~n. Definendo allora il quadrivettore ( µ ω n p n pµ = −1 |~ p| ~ p p nµp ≡ , : µ M M |~p| n p Pµ = 0 facendo il conto nel rest frame abbiamo ~Σ ·~p W µ n pµ 1 5 =− γ /n p /p = − = −σ p M 2M |~p| ossia l’operatore elicità. In definitiva, possiamo definire i proiettori di elicità π± = π(±n p ) ≡
1 ± γ 5 /n p
!
2
(1.81)
i quali rispettivamente proiettano su autostati di elicità +1/2 e -1/2. Tali operatori agiscono in questo modo sugli spinori nello spazio dei momenti: π+ u1 = u1
π+ v1 = 0
π− u1 = 0
π− v1 = v1
π+ u2 = 0
π+ v2 = v2
π− u2 = u2
π− v2 = 0
Dunque, gli spinori nello spazio dei momenti u(k) e v(k) oltre ad essere autostati dell’operatore di spin 1/2, come già visto, sono anche autostati dell’operatore elicità. In particolare: • u1 è autostato dell’operatore di spin 1/2 relativo all’autovalore s = 1/2 ed è autostato dell’operatore elicità relativo all’autovalore 1/2; • u2 è autostato dell’operatore di spin 1/2 relativo all’autovalore s = −1/2 ed è autostato dell’operatore elicità relativo all’autovalore -1/2; 33 34
Con i mezzi attuali è difficile da dimostrare: prenderla per buona. ATTENZIONE: il quadrivettore nµ è controvariante, quindi ni = −ni .
36
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER • v1 è autostato dell’operatore di spin 1/2 relativo all’autovalore s = 1/2 ed è autostato dell’operatore elicità relativo all’autovalore -1/2; • v2 è autostato dell’operatore di spin 1/2 relativo all’autovalore s = −1/2 ed è autostato dell’operatore elicità relativo all’autovalore 1/2.
Definiamo ora i proiettori di chiralità sinistro (left) e destro (right) PL =
14 − γ 5
PR =
2
14 + γ 5 2
(1.82)
Essi soddisfano le seguenti proprietà: PL2 = PL
PR2 = PR
(proiettori)
(1.83)
PL + PR = 14
(1.84)
PL PR = PR PL = 04
(1.85)
In questo modo possiamo scrivere lo spinore ψ(x) come composizione delle sue componenti chirali. Sfruttando la proprietà 1.84 infatti: ψ = (PL + PR )ψ ≡ ψL + ψR con ψL = PL ψ
ψR = PR ψ
(1.86)
dette componenti chirali dello spinore di Dirac. Esse infatti sono autostati dell’operatore chirale 1.51 di autovalori −1 e +1 rispettivamente. Infatti: 5 5 5 14 − γ ψ = −PL ψ = −ψL γ ψL = γ 2 5 5 5 14 + γ γ ψR = γ ψ = PR ψ = ψR 2 L’equazione di Dirac può essere dunque riscritta in termini delle due equazioni per le componenti chirali, ossia in termini di rappresentazioni irriducibile del gruppo di Lorenz di dimensione 2. A questo punto possiamo definire le componenti chirali coniugate35 ψ L = ψL+ γ 0 = ψ + PL+ γ 0 Dato che PL γ 0 = γ 0 PR allora ψ L = ψPR
ψ R = ψPL
Ora, nel limite ultra-relativistico nµp
|~p| ~p pµ ' 1, = M |~p| M
quindi, nel limite ultra-relativistico, si ha che π(±n p )u(p) ' 35
1 γ 5 /p ± 2 2M
Noi definiamo (ψL ), in alcuni testi viene definito (ψ)L .
! u(p)
(1.87)
1.6. EQUAZIONE DI DIRAC
37
Utilizzando la 1.73 allora π(±n p )u(p) '
1 γ5 ± u(p) = PR,L u(p) 2 2
In maniera del tutto analoga si dimostra che 1 γ5 π(±n p )v(p) ' ∓ u(p) = PL,R v(p) 2 2 ossia nel limite ultra-relativistico l’operatore di chiralità e di elicità coincidono. Ricapitolando, in generale: • u1 è autostato dell’operatore di spin 1/2 relativo all’autovalore s = 1/2, è autostato dell’operatore elicità relativo all’autovalore 1/2 ed è autostato dell’operatore chiralità di autovalore 1; • u2 è autostato dell’operatore di spin 1/2 relativo all’autovalore s = −1/2, è autostato dell’operatore elicità relativo all’autovalore -1/2 ed è autostato dell’operatore chiralità di autovalore -1; • v1 è autostato dell’operatore di spin 1/2 relativo all’autovalore s = 1/2, è autostato dell’operatore elicità relativo all’autovalore -1/2 ed è autostato dell’operatore chiralità di autovalore -1; • v2 è autostato dell’operatore di spin 1/2 relativo all’autovalore s = −1/2, è autostato dell’operatore elicità relativo all’autovalore 1/2 ed è autostato dell’operatore chiralità di autovalore 1. spinore u1 (k) u2 (k) v1 (k) v2 (k)
spin 1/2 -1/2 1/2 -1/2
elicità 1/2 -1/2 -1/2 1/2
chiralità 1 -1 -1 1
Tabella 1.1: Spinori e autovalori relativi agli operatori di spin, elicità e chiralità.
1.6.2
Equazione di Dirac accoppiata con un campo magnetico esterno nel limite non relativistico
Affinchè l’equazione di Dirac resti consistente con l’equazione di Klein-Gordon, anche in questo caso imponiamo l’accoppiamento minimale 1.30. In questo modo, l’equazione di Dirac 1.59 diventa / µ − M ψ = i∂/ − qA/ − M ψ = 0 iD (1.88) Per calcolare esplicitamente il limite non relativistico conviene riscrivere l’equazione nella forma 1.43, cioè h i (i∂0 − qA0 ) ψ = −i~α · ~∇ − iq~A + β M ψ Ridefiniamo ora lo spinore, esplicitando in particolare il termine di oscillazione temporale legato alla massa: ψ(x,t) = e−iMt ψ 0 (x,t)
38
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
il quale, inserito nell’equazione precedente, fornisce: h i e−iMt (i∂0 + M − qA0 ) ψ 0 = e−iMt −i~α · ~∇ − iq~A + β M ψ 0 da cui
h i i∂0 ψ 0 = −i~α · ~∇ − iq~A + (β − 14 ) M + qA0 ψ 0
Definiamo a questo punto gli spinori bidimensionali ϕ 0 e χ 0 tali che 0 ϕ 0 ψ ≡ χ0 L’equazione di Dirac in accoppiamento minimale diventa allora i∂0 ϕ 0 = qA0 ϕ 0 − i~σ · ~∇ − iq~A χ 0 i∂0 χ 0 = (qA0 − 2M) χ 0 − i~σ · ~∇ − iq~A ϕ 0 cioè si scinde in due equazioni vettoriali in due dimensioni. Giunti a questo punto applichiamo le condizioni di approssimazione non relativistica, ossia, analogamente a quanto fatto nel caso di Klein-Gordon: 0 1. ∂0χχ0 M cioè la massa è molto più grande dell’energia cinetica della particella, cioè del momento36 ; 2. |qA0 | M cioè siamo in approssimazione di potenziale debole. In questo caso, la seconda equazione diventa i ~σ · ~∇ − iq~A ϕ 0 2M la quale, non presentando più una derivata temporale, perde il ruolo di equazione dinamica, acquisendo invece il ruolo di semplice vincolo: essa infatti "congela" due componenti dello spinore ψ 0 , dimezzando dunque i gradi di libertà del nostro sistema. La prima equazione del sistema diventa dunque 2 1 ~ ~σ · ∇ − iq~σ · ~A ϕ 0 i∂0 ϕ 0 = qA0 ϕ 0 − 2M Ora, sfruttando il fatto che 1 1 σi σ j = [σi , σ j ] + {σi , σ j } 2 2 e che 1 {σi , σ j } = iδi j 2 allora 2 ~σ · ~∇ − iq~σ · ~A ϕ 0 = (∂i + iqAi ) ∂ j + iqA j σi σ j ϕ 0 = 1 1 [σi , σ j ] + {σi , σ j } ∂i ∂ j − q2 Ai A j + iqAi ∂ j + iqA j ∂i + iq ∂i A j = = 2 2 2 2~ 2 ~ ~ ~ ~ ~ = ∇ − q A − 2iA · ∇ − qσ · B ϕ 0 = 2 ~ ~ ~ = ∇ − iqA 12 − q~σ · B ϕ 0 χ0 = −
36
Si noti che ha senso imporre tale condizione solo su χ 0 perchè solo la sua equazione presenta la massa.
1.6. EQUAZIONE DI DIRAC
39
Si noti che alla terza riga si sfrutta sia il fatto che la contrazione tra tensori simmetrici σi , σ j = 2εi jk σk e antisimmettrici (Ai A j e ∂i ∂ j ) è nulla, sia la definizione di campo magnetico come rotore del potenziale vettore: Bl = εi jk ∂ j Ak . Questo significa che l’equazione ottenuta è 2 1 ~ ∂ 0 q ~ ~ ~σ · B ϕ 0 (1.89) i ϕ = − ∇ − iqA + qA0 − ∂t 2M 2M detta equazione di Pauli. Si tratta dell’equazione di Dirac con accoppiamento minimale ad un campo magnetico esterno valutata nel limite non relativistico. Si noti che, a differenza dell’equazione di Dirac 1.59, l’equazione di Pauli è un’equazione bidimensionale, valutata sugli spinori bidimensionali ϕ 0 i quali non dipendono dal termine oscillatorio legato alla massa. Il termine ~σ · ~B fornisce l’accoppiamento tra spin e campo magnetico, assicurando un momento di dipolo magnetico non nullo, il quale, per definizione, è MDM = −
q ~σ · ~B ≡ −~µs · ~B 2M
dove ~µs è il momento magnetico di spin della particella. Quest’ultimo è definito così:37 ! ~µ q ~ q s ~µs = ge Σ(2) → ge = ~Σ(2) 2M 2M dove ge è detto rapporto giromagnetico dell’elettrone, il quale, in base alla 1.89, è pari a 2 38 , mentre ~Σ(2) = 21 ~σ è l’operatore di spin 1/2 bidimensionale. Il formalismo di Dirac è sicuramente corretto e la sua equazione è lineare nelle derivate, ma nonostante gli sforzi effettuati egli ritrova nuovamente: • una densità che definisce una carica conservata che però non è definita positiva, quindi non interpretabile in termini probabilistici; • il paradosso di Klein, in analogia al caso dell’equazione di Klein-Gordon. In virtù di ciò, si decise di abbandonare l’idea di estendere l’equazione di Schrödinger al caso relativistico, per sviluppare un nuovo strumento, che va sotto il nome di teorie di campo.
37
In analogia alla definizione q ~ ~µL = L 2M
→
~µL q ~L = 2M
con ~L il momento angolare orbitale. 38 Il rapporto giromagnetico non è esattamente 2. Tuttavia, l’equazione di Dirac con accoppiamento minimale nel limite non relativistico permette di dare una stima di ge molto vicina al suo valore reale, senza giustificare (come spesso viene fatto) il fatto che ge ' 2.
40
CAPITOLO 1. ESTENSIONE DELL’EQUAZIONE DI SCHRÖDINGER
Capitolo 2 Teorie di campo libere 2.1
Teorie lagrangiane e hamiltoniane
2.1.1
Sistemi classici con finiti gradi di libertà
Consideriamo un sistema classico con N gradi di libertà (particelle). Ciascuna particella si identifica con una posizione e una velocità ad un istante t, cioè tramite la coppia (q(t), q(t)) ˙ = ((q1 , . . . , qN ) , (q˙1 , . . . , q˙N )) ∈ Ω con Ω detto spazio delle fasi. Il formalismo lagrangiano prevede l’esistenza di una funzione, detta lagrangiana, di posizione, velocità ed eventualmente tempo (in modo esplicito)1 L (q(t), q(t),t). ˙ La lagrangiana permette di trovare le equazioni del moto del sistema in maniera unica. Com’è possibile questo? In generale, infatti, fissati due punti q(ti ) e q(t f ) esistono infinite traiettorie che li uniscono. Si definisce allora l’azione Z tf
S[q(t), (ti ,t f )] =
L (q(t), q(t),t) ˙ dt
(2.1)
ti
la quale è un funzionale della sola traiettoria q(t) scelta: l’azione dunque assume valori nei vari diversi istanti a seconda della traiettoria q(t). Ora, per trovare la traiettoria effettivamente seguita dal sistema si utilizza il principio di minima azione, secondo il quale la traiettoria fisica tra i punti q(ti ) e q(t f ) è quella che minimizza l’azione 2.1. Questo significa che la traiettoria del sistema deve fare in modo che la variazione funzionale dell’azione sia nulla2 δ0 S[q]|t ≡ (S[q + δ0 q] − S[q])t = 0
(2.2)
1
Noi considereremo solo sistemi conservativi, in cui cioè la lagrangiana è una funzione del tempo in maniera indiretta, cioè solo perchè è funzione di posizione e velocità che, a loro volta, sono funzioni del tempo. Dunque le lagrangiane di nostro interesse saranno del tipo: L(q(t), q(t)) ˙ =
1 N ∑ mi q˙2i −V (q2 ) 2 i=1
con V (q2 ) potenziale dipendente solo dal modulo delle distanze tra le particelle. 2 Condizione necessaria ma non sufficiente: essa infatti implica che si tratti di un estremale, non necessariamente di un minimo. Nonostante ciò, non verifichiamo esplicitamente che si tratta effettivamente di un minimo.
41
42
CAPITOLO 2. TEORIE DI CAMPO LIBERE
dove q(t) −→ q0 (t) = q(t) + δ0 q(t)
(2.3)
è la variazione funzionale della traiettoria q(t), ossia la traiettoria q che viene leggermente modificata all’istante t FISSATO 3 . Dato che le traiettorie che stiamo considerando hanno in comune il fatto di partire tutte da q(ti ) e di finire in q(t f ) allora si pongono le condizioni al contorno ( δ0 q(ti ) = 0 (2.4) δ0 q(t f ) = 0 Detto questo, calcoliamo la variazione dell’azione: Z tf
δ0 S = δ0
Z tf
L (q(t), q(t)) ˙ dt = ti
ti
δ0 L (q(t), q(t)) ˙ dt =
Z tf ∂L ti
∂L δ0 q + δ0 q˙ dt ∂q ∂ q˙
dove al secondo passaggio abbiamo sfruttato il fatto che la variazione, essendo definita a tempo fissato, può entrare nell’integrale. Dato che, per lo stesso motivo, la variazione commuta con la derivata temporale, allora δ0 S =
Z t f ∂L d ∂L ∂L d d ∂L δ0 q + δ0 q dt = − δ0 q + δ0 q dt ∂q ∂ q˙ dt ∂ q dt ∂ q˙ dt ∂ q˙ ti
Z tf ∂L ti
Ma poichè per le condizioni al contorno 2.4 t f ∂L δ0 q = δ0 q = 0 ∂ q˙ ∂ q˙ ti
Z tf d ∂L ti
dt
allora se la variazione dell’azione deve essere nulla ∀δ0 , cioè per ogni variazione, allora necessariamente l’integrando deve essere nullo. L’equazione del moto del nostro sistema lagrangiano è allora l’equazione di Eulero-Lagrange ∂L d ∂L − =0 ∂ q dt ∂ q˙
(2.5)
E’ facile dimostrare che l’equazione del moto derivante da una lagrangiana L può derivare da una qualsiasi altra lagrangiana df L0 = L + dt con f = f (q,t). Ora, dal formalismo lagrangiano possiamo agilmente passare a quello hamiltoniano. Definiamo il momento coniugato ∂L p≡ (2.6) ∂ q˙ Possiamo allora definire anche l’hamiltoniana tramite la trasformata di Legendre4 H(q, p,t) = pq˙ − L(q, q,t) ˙ 3 4
La variazione è definita per un istante fissato, quindi non intacca il tempo. Per sistemi conservativi non c’è dipendenza esplicita dal tempo, come nel caso lagrangiano.
(2.7)
2.1. TEORIE LAGRANGIANE E HAMILTONIANE
43
Si noti che la lagrangiana è una funzione di q e q, ˙ mentre l’hamiltoniana è funzione di q e p: il passaggio da q˙ a p viene fornito dalla 2.6. A questo punto, possiamo ricavare l’equazione del moto nel formalismo hamiltoniano per sistemi conservativi: ∂H ∂H ∂H ∂ q˙ ∂ L ∂ q˙ ∂ q˙ ∂ L ∂ L ∂ q˙ dH = dp+ dq + dt = q˙ + p− dp+ p − − dq ∂p dq ∂t ∂p ∂ q˙ ∂ p ∂ q ∂ q ∂ q˙ ∂ q |{z} =0
A questo punto, utilizzando l’equazione di Eulero-Lagrange 2.5 e la definizione di momento coniugato 2.6 si ottiene dH =
∂H ∂L ∂H dp+ dq = qd ˙ p− dq = qd ˙ p − pdq ˙ ∂p dq ∂q
da cui derivano immediatamente le equazioni del moto in formalismo hamiltoniano, dette equazioni di Hamilton ( q˙ = ∂∂Hp (2.8) p˙ = − ∂∂Hq Date due funzioni f (q, p) e g(q, p) definiamo le parentesi di Poisson a tempo fissato N ∂ f ∂g ∂ f ∂g ∂ f ∂g ∂ f ∂g { f , g}t = − =∑ − ∂ q ∂ p ∂ p ∂ q i=1 ∂ qi ∂ pi ∂ pi ∂ qi con le quali possiamo riscrivere le equazioni di Hamilton: ( q(t) ˙ = {q, H}t p(t) ˙ = {p, H}t
(2.9)
(2.10)
Data una generica funzione f (q, p,t) vale la relazione ∂f df = + { f , H}t dt ∂t Le parentesi di Poisson soddisfano le seguenti proprietà: qi , q j t = pi , p j t = 0 qi , p j t = δi j
2.1.2
(2.11)
(2.12) (2.13)
Sistemi con gradi di libertà infiniti e continui: i campi
Consideriamo ora un sistema fisico costituito da una quantità infinita di gradi di libertà continui, ossia per ciascun punto dello spazio ~x sia definito un campo ϕ~x (t). Passando dal continuo al discreto, allora, ogni grado di libertà è individuato da un campo e le sue derivate spaziali e temporale: (q(t), q(t)) ˙ −→ ϕ(~x,t), ∂µ ϕ(~x,t) = ϕ(x), ∂µ ϕ(x) In questo contesto la lagrangiana conservativa sarà allora una funzione L = L ϕ(x), ∂µ ϕ(x) . Se ad esempio noi consideriamo un sistema con N gradi di libertà di lagrangiana conservativa mi 2 N 2 L = ∑i=1 2 q˙i − qi , il passaggio al continuo prevede la sostituzione N
∑ −→
i=1
Z
d3x
44
CAPITOLO 2. TEORIE DI CAMPO LIBERE
dunque la nostra lagrangiana sarà Z L = L ϕ(x), ∂µ ϕ(x) =
ρ(~x) 2 2 (∂0 ϕ) − ϕ d 3 x 2
L’integrando ρ(~x) (∂0 ϕ)2 − ϕ 2 (2.14) 2 è detta densità lagrangiana ed è l’elemento base per la costruzione di una teoria lagrangiana di campo 5 . Definiamo ora l’azione 6 L (~x,t) = L (x) = L (ϕ, ∂µ ϕ) =
Z tf
S[ϕ, ∂ D4 ] =
Z
dt ti
∂ D4
L (ϕ, ∂µ ϕ)d 3 x =
Z
L (ϕ, ∂µ ϕ)d 4 x
(2.15)
la quale permette di trovare il campo fisico che descrive il sistema. Infatti, secondo il principio di minima azione, fissate le condizioni al contorno ∂ D4 il campo fisico ϕ è quello che minimizza l’azione (o meglio che la rende stazionaria), ossia che soddisfa ∂0 S[ϕ] = S[ϕ + δ0 ϕ] − S[ϕ] = 0
(2.16)
dove la variazione funzionale, o sincrona sui campi in un punto x fissato è ϕ 0 (x) = ϕ(x) + δ0 ϕ(x)
(2.17)
Così come nel contesto finito dimensionale le traiettorie ricercate sono quelle con i punti iniziale e finale fissati (condizione 2.4), in questo caso noi cerchiamo i campi con la variazione sincrona nulla all’infinito: δ0 ϕ(∂ D4 ) = 0 (2.18) Applichiamo il principio di minima azione, sfruttando il fatto che δ0 per definizione non interferisce con il punto spaziale x e di conseguenza commuta con ∂µ : Z Z ∂L ∂L δϕ + δ ∂µ ϕ d 4 x = ∂0 S[ϕ] = δ0 L (x) = ∂ϕ ∂ ∂µ ϕ Z ∂L ∂L ∂L = + ∂µ δ ϕ + ∂µ δ0 ϕ d4x ∂ϕ ∂ ∂µ ϕ ∂ ∂µ ϕ ∂L ma visto che ∂µ ∂ ∂µ ϕ δ0 ϕ è la quadridivergenza di una quantità J µ che si annulla al bordo, allora tale quantità, integrata in d 4 x, dà contributo nullo 7 . Dunque,dovendo essere l’integrale nullo per una qualsiasi variazione, questo implica che l’integrando stesso deve essere sempre nullo. Dunque, il campo fisico soddisfa l’equazione di Eulero-Lagrange per i campi ∂L ∂L − ∂µ =0 ∂ϕ ∂ ∂µ ϕ 5
(2.19)
Da ora in avanti i termini lagrangiana e densità lagrangiana diverranno interscambiabili: in ogni caso, si parlerà sempre della densità lagrangiana 2.14 propriamente detta. 6 Nel caso relativistico D = M (spazio di Minkowski), mentre nel caso non relativistico D = R × R3 . 4 4 4 7 Infatti Z Z ∂µ J µ d 4 x = ni J i d 3 Σ = 0 D4
perchè Ji (∂ D4 ) = 0.
∂ D4
2.1. TEORIE LAGRANGIANE E HAMILTONIANE
45
che in una teoria non relativistica si scrive esplicitamente ∂0
∂L ∂L ∂L = − ∂i ∂ ∂0 ϕ ∂ϕ ∂ ∂i ϕ
Anche nel caso infinito dimensionale tutte le lagrangiane del tipo L 0 (ϕ, ∂µ ϕ) = L (ϕ, ∂µ ϕ) + ∂µ k µ (ϕ)
(2.20)
portano alle stesse equazioni di Eulero-Lagrange prodotte dalla lagrangiana L (ϕ, ∂µ ϕ). Infatti, date Z Z 4 0 S = L (x)d x S = L 0 (x)d 4 x si ha che 0
Z
δ0 S = δ0
Z
4
µ
(L + ∂µ k )d x = δ0 S + δ0
∂µ k µ d 4 x
Ma visto che Z
δ0
µ 4
Z
∂µ k d x =
µ
∂µ (δ0 k ) d x =
visto che al bordo δ0 ϕ = 0, allora
Z
4
∂µ
∂ kµ δ0 ϕ d 4 x = 0 ∂ϕ
δ0 S 0 = δ0 S
quindi L 0 e L forniscono le stesse equazioni di Eulero-Lagrange. Per questo motivo, le lagrangiane 2.20 e la lagrangiana L (ϕ, ∂µ ϕ) si dicono equivalenti. Quindi, modificare la lagrangiana aggiungendo una quadridivergenza non modifica le equazioni del moto. Per passare al formalismo hamiltoniano definiamo prima di tutto il momento coniugato π(x) ≡
∂L ∂ ∂0 ϕ
(2.21)
con cui possiamo definire la densità hamiltoniana H (π, ϕ) ≡ π(∂0 ϕ) − L (ϕ, ∂µ ϕ)
(2.22)
dalla quale risulta che lhamiltoniana è Z
H(t) =
H (~x,t)d 3 x
(2.23)
Si noti che introducendo l’integrazione nelle coordinate spaziali perdiamo la covarianza: non a caso l’energia infatti non è uno scalare di Lorenz, ma di fatto è una componente del quadrimomento. Ricaviamo le equazioni di Hamilton per una densità hamiltoniana conservativa (cioè non dipendente dal tempo in maniera esplicita) : dH =
∂H ∂H dπ + dϕ ∂π ∂ϕ
Considerando ora una densità lagrangiana del tipo 2.14, ossia indipendente dalle derivate spaziali del campo ϕ, allora sfruttando l’equazione di Eulero-Lagrange 2.19 e la definizione 2.21 otteniamo ∂L ˙ − ∂0 ˙ − πdϕ ˙ dH = ϕdπ dϕ = ϕdπ ∂ ∂0 L
46
CAPITOLO 2. TEORIE DI CAMPO LIBERE
da cui le equazioni di Hamilton ( ϕ˙ = ∂∂Hπ π˙ = − ∂∂H ϕ
(2.24)
Verifichiamo esplicitamente la validità di queste equazioni: 1. ∂ ∂ L ∂ ∂µ ϕ ∂H ∂ ϕ˙ ∂ L ∂ ϕ = − − = π ϕ˙ − L (ϕ, ∂µ ϕ) = ϕ˙ + π ∂π ∂π ∂π ∂ ϕ |{z} ∂ π ∂ ∂µ ϕ ∂ π 0
∂ ϕ˙ ∂ L ∂ ∂0 ϕ ∂ L ∂ ∂i ϕ ∂ L ∂ ∂i ϕ = ϕ˙ + π − − = ϕ˙ − ∂ π ∂ ∂0 ϕ | ∂{zπ } ∂ ∂i ϕ ∂ π ∂ ∂i ϕ ∂ π | {z } ∂ ϕ˙ ∂π
π
A questo punto, riscrivendo il campo ϕ(x) come funzionale identità 8 , cioè Z
ϕ(x) = allora
∂ L ∂ ∂i ϕ ∂ ∂i ϕ ∂ π
Z
= x
δ 3 (x − y)ϕ(y)d 3 y
∂L ∂ ∂i ϕ
∂ ϕ(y) x 3 3 x ϕ ∂i δ (x − y)d y = 0 ∂ ∂ x | {zi } 0
avendo riscritto solo la varphi a numeratore del secondo fattore. In questo modo, si conclude che ∂H = ϕ˙ ∂π come voluto; 2. ∂H ∂ = π ϕ˙ − L (ϕ, ∂µ ϕ) = ∂ϕ ∂ϕ ∂π ∂ ϕ˙ ∂ L ∂ ϕ ∂ L ∂ ∂µ ϕ = ϕ˙ + π − − ∂ϕ ∂ϕ ∂ ϕ ∂ ϕ ∂ ∂µ ϕ ∂ ϕ |{z} |{z} 0
1
Sfruttando ora la 2.19 otteniamo ∂H ∂ ϕ˙ ∂L ∂ L ∂ ∂µ ϕ =π − ∂µ = − ∂ϕ ∂ϕ ∂ ∂µ ϕ ∂ ∂µ ϕ ∂ ϕ ∂L ∂ ϕ˙ ∂L ∂ L ∂ ∂0 ϕ ∂ L ∂ ∂i ϕ =π − ∂0 −∂i − − = ∂ϕ ∂ ∂0 ϕ ∂ ∂i ϕ ∂ ∂0 ϕ ∂ ϕ ∂ ∂i ϕ ∂ ϕ | {z } | {z } π
∂L ∂ L ∂ ∂i ϕ = π˙ − ∂i − ∂ ∂i ϕ ∂ ∂i ϕ ∂ ϕ 8
Vedi appendice.
π
2.2. SIMMETRIE GLOBALI E CONSERVAZIONI - IL TEOREMA DI NÖTHER
47
ma dato che, utilizzando lo stesso trucco del punto precedente9 Z ∂ L ∂ ∂i ϕ ∂L ∂ L ∂ ϕ(y) x 3 ∂i δ (x − y)d 3 y = −∂i = ∂ ∂i ϕ ∂ ϕ x ∂ ∂i ϕ ∂ ϕ ∂ ∂i ϕ | {z } 1
allora
∂H = −π˙ ∂ϕ
come voluto. Dati ora i due funzionali F[ϕ, π]
G[ϕ, π]
le parentesi di Poisson (a tempo t fissato) sono definite come Z δG δG δF δF − d3x {F, G}t = ~ δ π(x,t) ~ ~ δ ϕ(x,t) ~ δ ϕ(x,t) δ π(x,t) t
(2.25)
dove δδϕ , δδπ è la derivata funzionale10 . Possiamo allora riscrivere le equazioni di Hamilton come ( ˙ x,t) = {ϕ(~x,t), H}t ϕ(~ (2.26) ˙ x,t) = {π(~x,t), H}t π(~ Le parentesi di Poisson soddisfano le seguenti proprietà:
2.2
{ϕ(~x,t), ϕ(~y,t)}t = {π(~x,t), π(~y,t)}t = 0
(2.27)
{ϕ(~x,t), π(~y,t)}t = δ 3 (~x −~y)
(2.28)
Simmetrie globali e conservazioni - il teorema di Nöther
Per definizione, in una teoria di campo si parla di simmetria quando si considera una trasformazione dei campi e/o delle coordinate che lascia invariata l’azione, ossia tale che δS = 0 cioè una trasformazione che non modifica le equazioni del moto. Le simmetrie si dividono in due grandi categorie:
11
1. simmetrie discrete, come la parità (x 7−→ −x), l’inversione temporale (t 7−→ −t) o la coniugazione di carica (q 7−→ −q); 2. simmetrie continue, associate cioè al gruppo continuo di Lie. 9
10
Si ricordi che
Z
d 3 y∂ x δ 3 (x − y) f (x) = −
Z
d 3 y∂ x f (x)δ 3 (x − y)
Vedi appendice.
questo non significa che anche δ L = 0. Vale solo l’implicazione δ L = 0 =⇒ δ S = 0. Infatti considerando una lagrangiana equivalente del tipo 2.20 tale che δ L 0 = ∂µ k µ si ottiene sempre δ S = 0, cioè le stesse equazioni del moto fornite da L . In generale, quindi, una simmetria può modificare la lagrangiana. 11 ATTENZIONE:
48
CAPITOLO 2. TEORIE DI CAMPO LIBERE
In questa trattazione si analizzeranno in dettaglio le simmetrie continue, le quali si suddividono in: 1. simmetrie globali, legate quindi a parametri αi indipendenti dal punto spazio-temporale scelto. Esse a loro volta si suddividono in: • interne, agenti cioè sui soli campi (es/ conservazione numero leptonico/numero adronico/sapore); • spazio-temporali, agenti cioè sulle coordinate (es/ trasformazioni del gruppo di Lorenz/Poincaré); 2. simmetrie locali, legate quindi a parametri αi (x) dipendenti dal punto spazio-temporale scelto. Anch’esse si suddividono in simmetrie interne (es/ invarianza di gauge) e spaziotemporali (es/ gravità). Il teorema di Nöether afferma che ad ogni simmetria continua e globale dell’azione è associata µ una corrente conservata J(a) e, di conseguenza, una carica conservata Q(a) : Z
µ ∂µ J(a)
=0
=⇒
Q(a) =
0 3 J(a) d x
(2.29)
µ
Data infatti la corrente conservata J(a) allora Z
0=
µ ∂µ J(a) d 4 x
Z t2
=
Z
dt t1
R3
0 i ∂0 J(a) + ∂i J(a) = Q(a) (t2 ) − Q(a) (t1 )
poichè, per il teorema della divergenza Z
i ∂i J(a) d3x 3
R
Z
=
∂ R3
i d 2 Σni J(a)
i (∞) = 0. la quale va a 0 perchè per ipotesi i campi si annullano all’infinito12 quindi J(a)
2.2.1
Applicazione ad una simmetria globale interna
Una simmetria globale interna per definizione agisce solo sui campi, cioè ( 0 ( x µ = xµ δ xµ = 0 −→ ϕ 0 (x) = ϕ(x) + δ0 ϕ(x) δ0 ϕ(x) = ε (a) X(a) (ϕ)
(2.30)
dove: • δ0 è la solita variazione sincrona 13 ; • ε (a) , con a = 1, . . . , n, sono n parametri globali; • X(a) (ϕ), con a = 1, . . . , n, sono gli n generatori del gruppo di simmetria considerato nella rappresentazione con sede lo spazio in cui vive il campo. Essi dunque saranno diversi a seconda del tipo di campo considerato (scalare, spinoriale, vettoriale). 12 13
Solo così sono funzioni integrabili in R 3 . Detta anche variazione in forma.
2.2. SIMMETRIE GLOBALI E CONSERVAZIONI - IL TEOREMA DI NÖTHER
49
µ
Troviamo l’espressione esplicita di J(a) : Z
0 = δ0 S =
∂L ∂L − ∂µ ∂ϕ ∂ ∂µ L
4
Z
δ0 ϕd x +
∂µ
∂L δ0 ϕ d 4 x ∂ ∂µ ϕ
A differenza di quanto quanto fino ad ora, noi non stiamo facendo alcuna ipotesi sulle variazioni, quindi, in particolare, non stiamo imponendo le condizioni 2.18, quindi il secondo integrale non si annulla. Invece, noi in questo caso stiamo valutando una simmetria agente su campi fisici, cioè campi che sono soluzioni dell’equazione di Eulero-Lagrange 2.19: questo implica che il primo integrale si annulli, quindi Z ∂L (a) 0 = δ0 S = ε ∂µ X d4x ∂ ∂µ ϕ (a) Dunque, la corrente conservata associata ad una simmetria globale interna è µ
J(a) =
∂L X , ∂ ∂µ ϕ (a)
a = 1, . . . , n
(2.31)
da cui la carica conservata nel tempo Z
Q(a) =
2.2.2
∂L X d 3 x, ∂ ∂0 ϕ (a)
a = 1, . . . , n
(2.32)
Applicazione ad una simmetria interna spazio-temporale
Una simmetria interna spazio-temporale per definizione modifica sia i campi sia le coordinate, cioè ( 0 ( µ δ xµ = ε (a) Ξ(a) x µ = xµ + δ xµ (2.33) −→ ϕ 0 (x) = ϕ(x) + δ ϕ(x) δ ϕ(x) = ε (a) X(a) (ϕ) dove: • δ NON è la variazione sincrona, perchè adesso stiamo variando anche le coordinate; • ε (a) , con a = 1, . . . , n, sono n parametri globali; µ
• Ξ(a) (ϕ), con a = 1, . . . , n, sono gli n generatori del gruppo di simmetria considerato nella rappresentazione con sede lo spazio di Minkowski: essi infatti variano le coordinate. In questo caso abbiamo due aspetti in più da tenere presenti: 1. ora la variazione δ non è più sincrona, quindi non può entrare liberamente negli integrali perchè variano anche le coordinate, cioè l’elemento di volume. Considerando lo jacobiano della trasformazione, arrestandoci al primo ordine perturbativo otteniamo d 4 x0 = d 4 x(1 + ∂µ δ xµ ) cioè δ d 4 x = ∂µ δ xµ d 4 x
50
CAPITOLO 2. TEORIE DI CAMPO LIBERE 2. la variazione δ è detta variazione totale e agisce in maniera diversa rispetto a quella sincrona: δ ϕ ≡ ϕ 0 (x0 ) − ϕ(x) (2.34) Tuttavia, visto che la 2.34 è riscrivibile come δ ϕ = ϕ 0 (x0 ) − ϕ)(x0 ) + ϕ(x0 ) − ϕ(x) effettuando uno sviluppo di Taylor del termine ϕ(x0 ) − ϕ(x) si ottiene δ ϕ = δ0 ϕ(x) + ∂µ ϕ δ xµ
(2.35)
La relazione 2.35 permette di scrivere la variazione totale in termini della variazione sincrona, permettendo di proseguire nel conto µ
Troviamo allora l’espressione esplicita di J(a) : Z
Ld x= 4
0 = δS = δ =
Z
L δd x + 4
Z
δ L d4x =
Z
L (∂µ δ xµ ) + δ0 L + ∂µ L δ xµ d 4 x
utilizzando la relazione 2.35 (in quel caso particolare scritta per i campi) direttamente sulla densità lagrangiana. Ora, riscrivendo il primo e terzo addendo in termini di una derivata totale e sfruttando l’espressione di δL ottenuta nelle sezioni precedenti, si ottiene Z ∂L ∂L ∂L µ − ∂µ δ0 ϕ + ∂ µ δ0 ϕ d4x 0 = δS = ∂µ (L δ x ) + ∂ϕ ∂ ∂µ ϕ ∂ ∂µ ϕ Visto che la simmetria considerata agisce su campi fisici, che c+sono quindi soluzioni dell’equazione di Eulero-Lagrange 2.19, allora, utilizzando la relazione 2.35 ed esplicitando poi le variazioni secondo la relazione 2.33, si ottiene Z ∂L ∂L µ ρ 0 = δS = ∂ µ L ηρ − ∂ρ ϕ δ x + δ ϕ d4x = ∂ ∂µ ϕ ∂ ∂µ ϕ Z ∂L ∂L ρ µ (a) =ε ∂µ L ηρ − ∂ρ ϕ Ξ(a) + X(a) d 4 x ∂ ∂µ ϕ ∂ ∂µ ϕ Dunque, la corrente conservata associata ad una simmetria interna spazio-temporale è ∂L ∂L ρ µ µ J(a) = −L ηρ + ∂ρ ϕ Ξ(a) − X , a = 1, . . . , n ∂ ∂µ ϕ ∂ ∂µ ϕ (a) da cui la carica conservata nel tempo Z ∂L ∂L ρ 0 Q(a) = −L ηρ + ∂ρ ϕ Ξ(a) − X d 3 x, ∂ ∂0 ϕ ∂ ∂0 ϕ (a)
2.2.3
a = 1, . . . , n
(2.36)
(2.37)
Applicazione ad una teoria di campo relativistica
Consideriamo ora una teoria di campo relativistica. Affinchè essa descriva correttamente un sistema relativistico, è necessario richiedere che l’azione sia uno scalare sotto trasformazioni del gruppo di Poincaré, ossia sotto traslazioni spazio-temporali e sotto trasformazioni del gruppo di Lorenz (rotazioni). Consideriamo separatamente i due casi.
2.2. SIMMETRIE GLOBALI E CONSERVAZIONI - IL TEOREMA DI NÖTHER
51
1. Sottoponiamo il nostro sistema ad una traslazione spazio-temporale. Questo significa che, in termini di traslazioni infinitesime ( ( ( 0 δ xµ = η µν εν Ξµν = η µν x µ = xµ + ε µ (2.38) → cioè X =0 ϕ 0 (x0 ) = ϕ(x) δϕ = 0 Sfruttando il fatto che l’azione, per ipotesi, è invariante sotto traslazioni spazio-temporali, calcoliamo le correnti di Nöther e le cariche associate. Dalla relazione 2.36 otteniamo allora ∂L µ µ J(ν) = (∂ν ϕ) − ην L ∂ ∂µ ϕ Definendo il tensore energia impulso canonico 14 ∂L µ µ T˜ν ≡ (∂ν ϕ) − ην L ∂ ∂µ ϕ
(2.39)
µ µ allora J(ν) = T˜ν . Le quattro cariche conservate associate sono
Z
Q(ν) =
0 J(ν) d3x
Z
=
0 3 T˜(ν) d x≡
Z
pν d 3 x = Pν
avendo definito la densità di momento pν ≡ T˜ν0
(2.40)
Questo significa che le quattro cariche conservate Q(ν) non sono altro che le quattro componenti del quadrimomento: Z Z Z ∂L 3 0 3 ∂0 ϕ − L d 3 x = Q(0) = p0 d x = J(0) d x = ∂ ∂µ ϕ Z
=
(π∂0 ϕ − L )d x = 3
Z
e Q(i) = · · · =
Z
H d 3 x = H = P0 (π∂i ϕ)d 3 x
la quale vedremo più avanti essere proprio Pi . Questi conti dunque ci dicono che: • la conservazione dell’energia è conseguenza dell’invarianza dell’azione sotto traslazioni temporali; • la conservazione della quantità di moto è conseguenza dell’invarianza dell’azione sotto traslazioni spaziali. 2. Sottoponiamo ora il nostro sistema ad una rotazione. Dunque, in termini di trasformazioni infinitesime ( 0 ( ( µ µ µ µ µ x µ = xµ + ων xν δ xµ = 21 ων Ξνρσ Ξρσ = ηρ xσ − ησ xρ → con ϕ 0 (x0 ) = ϕ(x) + 21 ω µν Ωµν ϕ δ ϕ = ω µν Xµν Xρσ = Ωρσ ϕ (2.41) 14
Questo in realtà non è il vero tensore energia impulso: questo infatti in generale non è simmetrico, e per questo è detto canonico. Tuttavia, è sempre possibile simmetrizzarlo, ottenendo il vero tensore energia impulso.
52
CAPITOLO 2. TEORIE DI CAMPO LIBERE Analogamente al caso precedente, tramite la relazione 2.31 si ottiene ∂L ∂L µ µ µ + Ωρσ ϕ −J(ρσ ) = ηρ xσ − ησ xρ L − (∂ρ ϕ)xσ − (∂σ ϕ)xρ ∂ ∂µ ϕ ∂ ∂µ ϕ | {z } µ
Sρσ
Definendo il tensore di momento angolare µ µ µ µ Mρσ ≡ xρ T˜σ − xσ T˜ρ + Sρσ
(2.42) µ
evidentemente antisimmetrico negli indici ρ e σ , allora le correnti di Nöther sono −J(ρσ ) = µ
Mρσ . Le cariche conservate ad esse associate sono
Z
Q(ρσ ) =
0 Mρσ d3x =
Z h
i
0 d3x = xρ T˜σ0 − xσ T˜ρ0 + Sρσ
Z
xρ pσ − xσ pρ + Sρσ d 3 x | {z } |{z} I
II
avendo definito il tensore di spin 0 Sρσ ≡ Sρσ =
∂L Ωρσ ϕ = πΩρσ ϕ ∂ ∂0 ϕ
(2.43)
Non a caso, infatti, la quantità I può essere interpretata come un momento angolare orbitale e quindi la II come un momento angolare di spin. In definitiva, le correnti di Nöther in questione sono le componenti del momento angolare totale: Q(ρσ ) ≡ Mρσ = Lρσ + Sρσ Dunque, questo significa che la conservazione del momento angolare totale è conseguenza dell’invarianza dell’azione sotto trasformazioni del gruppo di Lorenz (rotazioni). In definitiva, l’invarianza dell’azione associata ad una generica teoria di campo relativistica sotto trasformazioni del gruppo di Poincaré implica l’esistenza di 10 cariche conservate: • traslazioni → conservazione del quadrimomento Pµ (4 cariche); • rotazioni → conservazione di M µν (6 cariche)15 .
2.3
Teoria lagrangiana (classica) per un campo scalare (relativistico)
Consideriamo ora una teoria di campo scalare classica. Per poterla sviluppare, dobbiamo innanzi tutto costruire la lagrangiana, basandosi su alcuni principi: • richiedendo che l’azione sia una quantità misurabile, allora questa deve essere una quantità reale. Di conseguenza, anche la densità di lagrangiana L deve essere reale16 ; 15
Infatti M µν è una matrice 3 × 3 antisimmetrica, quindi ha 6 gradi di libertà. Quanto passeremo alla quantizzazione della teoria di campo richiedere che l’azione e la lagrangiana siano misurabili implicherà che siano entrambe operatori hermitiani. 16
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)53 • volendo trattare una teoria relativistica, l’azione deve essere uno scalare sotto trasformazioni del gruppo di Poincaré. Di conseguenza, anche la densità di lagrangiana L deve essere uno scalare. • L’azione deve fornire tramite il principio di minima azione delle buone equazioni del moto. Dato che per ipotesi il campo ϕ è un campo scalare, allora le equazioni di EuleroLagrange devono coincidere, nel caso libero, con l’equazione di Klein-Gordon, soddisfatta, appunto, dai campi scalari. Allora, la densità di lagrangiana L (ϕ, ∂µ ϕ) deve essere: – quadratica nei campi (cioè dovrà contenere termini del tipo (ϕ)2 ); – quadratica nelle derivate dei campi (cioè dovrà contenere termini del tipo (∂µ ϕ)2 ).
2.3.1
Teoria lagrangiana (classica) libera per un campo scalare (relativistico) reale
Consideriamo innanzi tutto un campo reale, che soddisfa dunque le proprietà seguenti: ( ϕ(x) = ϕ ∗ (x) ϕ 0 (x0 ) = ϕ(x) Ipotizziamo che la lagrangiana del nostro sistema sia del tipo L =
1 1 ∂µ ϕ (∂ µ ϕ) − m2 ϕ 2 −V (ϕ) 2 2
(2.44)
dove: •
1 2
•
1 2 2 2m ϕ
∂µ ϕ (∂ µ ϕ) è detto termine cinetico, il quale è associato al quadrimomento; è detto termine di massa;
• V (ϕ) è detto termine di interazione, cioè V (ϕ) = ϕ n , con n > 217 . Le equazioni del moto, calcolabili tramite la relazione 2.19, sono −m2 ϕ −
∂V − ∂µ ∂ µ ϕ = 0 ∂ϕ
cioè ∂V + m2 ϕ = − ∂ϕ
(2.45)
Volendo però considerare la teoria libera, cioè con V (ϕ) = 0, otteniamo, come voluto, proprio l’equazione di Klein-Gordon 1.20, la quale ha la soluzione nota 1.27 (ϕ campo reale), a partire dalla lagrangiana 1 1 L0 = ∂µ ϕ (∂ µ ϕ) − m2 ϕ 2 (2.46) 2 2
Una volta sviluppata la teoria lagrangiana possiamo ricavare anche quella hamiltoniana. Nel 17
Il caso n = 2 è il termine di massa
54
CAPITOLO 2. TEORIE DI CAMPO LIBERE
caso della teria di campo libera considerata il momento coniugato π è, secondo la definizione 2.21 π(x) = ∂0 ϕ si ottiene la densità hamiltoniana 2 1 2 2 2 H0 = π∂0 ϕ − L0 = π + ~∇ϕ + m ϕ 2
(2.47)
Si noti che la densità hamiltoniana è somma di termini positivi, dunque l’hamiltoniana H = H d 3 x, e quindi l’energia, è definita positiva. Si può verificare (esercizio) che valgono le equazioni di Hamilton scritte in termini delle parentesi di Poisson 2.26. R
Troviamo a questo punto le correnti di Nöether e le rispettive cariche derivanti dall’invarianza dell’azione sotto trasformazioni del gruppo di Poicarè. Consideriamo separatamente le correnti e cariche di Nöether dovute all’invarianza dell’azione sotto traslazioni spazio-temporali e quelle dovute all’invarianza dell’azione sotto trasformazioni del gruppo di Lorenz (rotazioni). 1. L’invarianza dell’azione sotto traslazioni spazio-temporali implica l’esistenza delle correnti di Nöether µ µ µ J(ν) = (∂ µ ϕ)(∂ν ϕ) − ην L ≡ T˜ν
µ
∂µ J(ν) = 0
da cui deriva la conservazione del quadrimpulso Z Z 2 1 2 2 2 3 ~ π + ∇ϕ + m ϕ d 3 x P0 = H = H d x = 2 Z
Pi =
π∂i ϕd 3 x
2. Poichè per un campo scalare δϕ = 0 l’invarianza dell’azione sotto rotazioni implica l’esistenza delle correnti di Nöether µ µ µ J(ρσ ) = xρ T˜σ − xσ T˜ρ
µ
∂µ J(ν) = 0
In questo caso le cariche conservate sono Z Mρσ = xρ T˜σ0 − xσ T˜ρ0 d 3 x = Lρσ questo implica dunque che una teoria di campo scalare descrive sistemi a spin 0. ESERCIZIO: scrivere le componenti del quadrimomento nello spazio dei momenti, considerando l’espressione esplicita delle soluzioni reali dell’equazione di Klein-Gordon 1.27, verificando che (dato che in questo caso a(~k) e a∗ (~k) commutano) Z
0
P =H =
ωk a(~k)a∗ (~k)d 3 x
ossia l’energia totale del sistema è la somma delle energie del sistema in ogni singolo stato, e i
P =
Z
ki a(~k)a∗ (~k)d 3 x
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)55
2.3.2
Teoria lagrangiana (classica) libera per un campo scalare (relativistico) complesso
Consideriamo ora un campo scalare complesso ϕ(x), ossia un campo che soddisfa le condizioni ϕ 0 (x0 ) = ϕ(x)
scalare (sotto Poincaré)
ϕ ∗ (x) 6= ϕ(x)
complesso
La possibile lagrangiana relativa a questa teoria di campo è ∗ L = ∂µ ϕ (∂ µ ϕ) − m2 ϕ ∗ ϕ −V (ϕ ∗ ϕ)
(2.48)
dove: • ∂µ ϕ
∗
(∂ µ ϕ) è detto termine cinetico, il quale è associato al quadrimomento;
• m2 ϕ ∗ ϕ è detto termine di massa; • V (ϕ ∗ ϕ) è detto termine di interazione, cioè V (ϕ ∗ ϕ) = (ϕ ∗ ϕ)n , con n ≥ 2. La densità di lagrangiana del caso libero (V (ϕ ∗ ϕ) = 0) è dunque ∗ L = ∂µ ϕ (∂ µ ϕ) − m2 ϕ ∗ ϕ
(2.49)
Rispetto al caso con il campo reale, ora considerare un campo complesso significa di fatto considerare due campi che possono essere scelti l’uno in maniera indipendente dall’altro. Un campo complesso ϕ si può infatti scrivere in termini di due campi reali ϕ = ϕ1 + iϕ2 con ϕ1 e ϕ2 campi reali indipendenti. Di conseguenza ϕ ∗ = ϕ1 − iϕ2 In sostanza, la nostra teoria lagrangiana e hamiltoniana dovrà tenere in costante considerazione sia ϕ che ϕ ∗ , costituenti due gradi di libertà differenti. Tramite l’equazione di Eulero-Lagrange 2.19 ∂L ∂L − ∂µ =0 ∂ϕ ∂ ∂µ ϕ scritte in funzione del campo ϕ, troviamo le equazioni del moto −m2 ϕ ∗ −
∂V − ϕ ∗ = 0 ∂ϕ
=⇒
∂V + m2 ϕ ∗ = − ∂ϕ
Invece, se scriviamo l’equazione di Eulero-Lagrange 2.19 ∂L ∂L − ∂µ =0 ∗ ∂ϕ ∂ ∂µ ϕ ∗ in funzione del campo ϕ ∗ , troviamo le equazioni del moto −m2 ϕ −
∂V − ϕ = 0 ∂ ϕ∗
=⇒
∂V + m2 ϕ = − ∗ ∂ϕ
56
CAPITOLO 2. TEORIE DI CAMPO LIBERE
Le equazioni del moto dei due campi diventano, nel caso di una teoria libera (V = 0), le equazioni di Kleing-Gordon 1.20 + m2 ϕ ∗ = 0 + m2 ϕ = 0 le cui soluzioni generali sono della forma 1.26. Per passare alla teoria hamiltoniana dobbiamo ora definire i momenti coniugati. Allora: • il momento coniugato del campo ϕ è ∂L = ∂0 ϕ ∗ ∂ ∂0 ϕ
π≡ • il momento coniugato del campo ϕ ∗ è π∗ ≡
∂L = ∂0 ϕ ∂ ∂0 ϕ ∗
Ora, per scrivere l’hamiltoniana bisogna tenere conto del fatto che in presenza di N campi ϕ1 , . . . , ϕN la densità hamiltoniana è N
H = ∑ πi (∂0 ϕi ) − L
(2.50)
i=1
Nel nostro caso ϕ1 ≡ ϕ e ϕ2 ≡ ϕ ∗ , perciò H = π (∂0 ϕ) + π ∗ (∂0 ϕ ∗ ) − L la quale considerando le definizioni dei momenti coniugati e l’espressione 2.48 della lagrangiana diventa H = π ∗ π + ππ ∗ − L = π ∗ π + ππ ∗ − (∂0 ϕ ∗ ) (∂0 ϕ) + ~∇ · ϕ ∗ ~∇ · ϕ + m2 ϕ ∗ ϕ +V (ϕ ∗ ϕ) | {z } ππ ∗
la quale, nel caso della teoria libera diventa ∗ ∗ ~ ~ H = π π + ∇·ϕ ∇ · ϕ + m2 ϕ ∗ ϕ ≥ 0
(2.51)
La densità di hamiltoniana, dunque la hamiltoniana, cioè l’energia, è definita positiva: questo significa che la lagrangiana 2.49 scelta è una buona lagrangiana. R si può verificare (esercizio) che le equazioni di Hamilton per l’hamiltoniana H = H d 3 x con la H della relazione 2.51 sono della forma 2.26, dove le parentesi di Poisson per N campi ϕ1 , . . . , ϕN sono N Z δA δB δA δB {A, B}t = ∑ − d3x (2.52) δ ϕi δ πi δ πi δ ϕi i=1 ESERCIZIO: calcolare le correnti e le cariche di Nöther associate all’invarianza dell’azione
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)57 sotto trasformazioni del gruppo di Poincaré. Si noti che l’invarianza dell’azione di N campi ϕ1 , . . . , ϕN δ S = S[ϕ1 + δ ϕ1 , . . . , ϕN + δ ϕN ] − S[ϕ1 , . . . , ϕN ] dove δ ϕ1 , . . . .δ ϕN sono le variazioni dei campi ϕ1 , . . . , ϕN , porta, in base alla 2.36, alle correnti di Nöther ! N N ∂L ∂L ρ µ µ ∂ρ ϕi Ξ(a) − ∑ Xi(a) , a = 1, . . . , n (2.53) J(a) = −L ηρ + ∑ i=1 ∂ ∂µ ϕi i=1 ∂ ∂µ ϕi
La teoria di campo che abbiamo costruito è invariante sotto trasformazioni del gruppo di Poincaré. Nel caso particolare di un campo complesso, tuttavia, essa prevede una simmetria interna aggiuntiva rispetto al gruppo U(1). Se infatti definiamo i campi ϕ 0 (x) = eiα ϕ(x) 0
ϕ ∗ (x) = e−iα ϕ ∗ (x) con α parametro globale (indipendente dal punto x), la lagrangiana 2.48 resta invariata. Infatti: ∗ 0 0 L = ∂µ ϕ 0 ∂ µ ϕ 0 − m2 ϕ ∗ ϕ 0 −V (ϕ ∗ ϕ 0 ) = ∗ = eiα e−iα ∂µ ϕ (∂ µ ϕ) − m2 ϕ ∗ ϕ −V ϕ ∗ |eiα{z e−iα} ϕ = L 1
Trattandosi di una simmetria interna (sui soli campi), allora la relazione 2.31, opportunamente riadattata al caso con N campi ϕ1 , . . . , ϕN ∂L Xi(a) , i=1 ∂ ∂µ ϕi N
µ
J(a) = ∑
a = 1, . . . , n
(2.54)
fornisce delle correnti conservate. Nel caso di due campi indipendenti ϕ e ϕ ∗ bisogna definire per esntambi le variazioni e i generatori delle rappresentazioni. Considerando dunque trasformazioni infinitesime si ha: 0 µ µ µ x = x δ x = 0 Ξ = 0 −→ δ0 ϕ(x) = iα(ϕ) −→ Xϕ = iϕ ϕ 0 (x) = (1 + iα)ϕ(x) 0∗ ∗ ∗ ϕ (x) = (1 − iα)ϕ(x) δ0 ϕ (x) = −iα(ϕ) Xϕ = −iϕ In virtù di ciò, in base alla 2.54, si trova che la corrente di Nöther associata alla simmetria interna rispetto U(1) è ← → µ JU(1) = i ∂µ ϕ ∗ ϕ − iϕ ∗ ∂µ ϕ = iϕ ∗ ∂ ϕ
(2.55)
Si noti che tali correnti di Nöether non sono altro che le quantità conservate 1.21 e 1.22 trovate "a mano" associate all’equazione di Klein-Gordon, a partire dalla sua equazione di continuità. In quel contesto, il fatto che tali correnti e le relative cariche associate non fossero definite positive creava dei grossi problemi, in quanto cadeva l’ipotesi iniziale di poter trattare le funzioni
58
CAPITOLO 2. TEORIE DI CAMPO LIBERE µ
d’onda in termini relativistici. Nel contesto delle teorie di campo, invece, le JU(1) non hanno nulla a che fare con alcuna densità di probabilità. ESERCIZIO: derivare il quadrimomento Pµ e la carica QU(1) nello spazio dei momenti, cioè in funzione di a(~k),a∗ (~k),b(~k) e b∗ (~k). ESERCIZIO: (facoltativo) definito il doppietto di campi scalari complessi ϕ1 φ= ϕ2 il cui coniugato è φ ∗ = ϕ1 ϕ2
la lagrangiana della teoria di campo associata è ∗ L = ∂µ φ (∂ µ φ ) − m2 φ ∗ φ Provare a studiare le possibili simmetrie interne del sistema.
2.3.3
Teoria lagrangiana e hamiltoniana classica di Dirac (campi spinoriali)
Nel caso di campi spinoriali la nostra teoria di campo deve fornire come equazioni del moto le equazioni di Dirac. Questo significa che la nostra lagrangiana dovrà essere lineare nelle derivate dei campi. Ipotizziamo allora una lagrangiana del tipo → i ← i ¯ µ ψ] − mψψ ¯ = ψ¯ ∂/ ψ − mψψ ¯ µ (∂µ ψ) − (∂µ ψ)γ ¯ LD = [ψγ 2 2
(2.56)
dove: •
i ¯ µ ¯ µ 2 [ψγ (∂µ ψ) − (∂µ ψ)γ ψ]
è il termine cinetico;
¯ è il termine di massa. • mψψ A questo punto, le relazioni 2.19 rispetto a ψ¯ forniscono le equazioni del moto per ψ e viceversa. Calcolando esplicitamente le derivate della lagrangiana rispetto ψ¯ si ottiene i i ∂/ψ − mψ + ∂/ψ = 0 −→ (i∂/ − m)ψ = 0 2 2 che è proprio l’equazione di dirac 1.59. Facendo i conti analoghi derivando per ψ si ottiene l’equazione di dirac aggiunta. Insomma, le equazione del moto sono → − i ∂/ − M ψ(x) = 0
← − ψ(x) i ∂/ + M = 0
La lagrangiana di Dirac 2.56 si può scrivere i ¯ ∂/ − m)ψ − ∂µ J µ LD = ψ(i 2
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)59 ¯ µ ψ. Dato che le lagrangiane differenti a meno di una quadridivergenza sono dove J µ = ψγ equivalenti, ciò significa che la lagrangiana ¯ ∂/ − m)ψ L 0 = ψ(i è equivalente alla 2.56.
(2.57)
18
ESERCIZIO: verificare che L 0 fornisce le stesse equazioni del moto di LD . Studiamo ora le cariche conservate associate all’invarianza dell’azione sotto trasformazioni del gruppo di Poincaré. Studiamo separatamente l’invarianza sotto traslazioni spazio-temporali e sotto trasformazioni del gruppo di Lorenz. • La corrente di Nöther associata all’invarianza dell’azione sotto traslazioni è il tensore energia impulso canonico ∂L ∂L ν ∂ ψ + ∂ ν ψ¯ − η µν L T˜ µν = ∂ ∂µ ψ ∂ ∂µ ψ¯ che di fatto corrisponde al tensore 2.39 dove però si tiene conto del contributo di ambo i ¯ campi ψ e ψ. Considerando in particolare la lagrangiana 2.57 si noti che poichè le correnti conservate si ottengono imponendo che i campi fisici soddisfino le equazioni del moto, cioè le equazioni di Dirac, questo implica che la lagrangiana 2.57 per i campi fisici è nulla. Questo iplica che il termine −η µν L è nullo e calcolando esplicitamente le derivate si ottiene il tensore energia impulso canonico i ¯ µ ∂ν ψ − (∂ν ψ)γ ¯ µ ψ] T˜ µν = [ψγ 2 il quale non è simmetrico. E’ sempre possibile simmetrizzare il tensore energia impulso definendo il tensore energia-impulso metrico Θµν = Si verifica che
( ∂µ T˜ µν = 0 ∂µ T˜ ν µ = 0
T˜ µν + T˜ ν µ 2 −→ ∂µ Θµν = 0
cioè il tensore energia impulso metrico è anch’esso corrente conservata. A tale corrente è associato come carica il quadrimomento Pµ : Pµ =
Z
d 3 xT˜ 0µ =
i 2
Z
d 3 x ψ + (∂ µ ψ) − (∂ µ ψ + )ψ
In particolare i d 3 x ψ + (∂ 0 ψ) − (∂ 0 ψ + )ψ 2 può essere scritto equivalentemente (verificare) Z
H=
d 3 xH =
Z
Z
H =i 18 Questo
d 3 xψ + (∂0 ψ)
implica che nel fare i conti l’utilizzo di una o dell’altra lagrangiana è assolutamente arbitrario.
(2.58)
60
CAPITOLO 2. TEORIE DI CAMPO LIBERE • Rotazioni: sottoponiamo il nostro sistema ad una trasformazioni di Lorenz infinitesima. Allora µ 0 µ µ µ = x µ + ω µ xν x ν Ξρσ = ηρ xσ − ησ xρ ψ 0 (x0 ) = 1 − 2i ω ρσ Σρσ ψ(x) → Xρσ = −iΣρσ ψ ¯ ¯0 0 ¯ ρσ ¯ Xρσ = iψΣ ψ (x ) = ψ(x) 1 + 2i ω ρσ Σρσ La corrente di Nöther associata è µ J(ρσ )
µ = T˜ν Ξνρσ
∂L ∂L − Xρσ + X¯ρσ ∂ ∂µ ψ ∂ ∂µ ψ¯
cioè, esplicitamente: (a me torna con un segno - !!!) µ µ µ ¯ µ Σρσ ψ J(ρσ ) = xσ T˜ρ − xρ T˜σ + ψγ dove il termine tra parentesi è la densità di momento angolare che avevamo anche nel caso di campo scalare. La corrente conservata associata è dunque Z
Jρσ =
d
3
0 xJ(ρσ )
Z
=
d 3 x (xρ pσ − xσ pρ ) + ψ + Σρσ ψ = Lρσ + Sρσ
dove in particolare Sρσ è l’operatore di spin tipico per il campo spinoriale: essendo questo derivante dall’operatore di spin 1/2 1.68 allora a campi spinoriali sono associate particelle di spin 1/2.
Anche in questo caso il sistema gode di una simmetria globale interna (non tocca le coordinate) di tipo U(1)19 : ( ( ( X = iψ δ ψ(x) = iαψ ψ 0 (x) = eiα ψ(x) → → 0 −iα ¯ ¯ δ ψ(x) = −iα ψ¯ X¯ = −iψ¯ ψ¯ (x) = e ψ(x) Calcolando esplicitamente la corrente di Nöther associata è (verificare) µ
JU(1) =
∂L ∂L ¯ µψ X + X¯ = · · · = ψγ ∂ ∂µ ψ ∂ ∂µ ψ¯
da cui la carica conservata
Z
Q=
d
3
0 xJU(1)
Z
=
¯ 0ψ d 3 xψγ
Per passare alla visuale hamiltoniana definiamo dapprima i momenti coniugati ai campi ψ e ¯ Utilizzando la lagrangiana 2.56 si ottiene ψ. i π = ψ+ 2
i π¯ = − γ 0 ψ 2
Come si può notare le due coppie di campi coniugati di fatto si riducono ad una coppia indipendente. Non a caso, infatti, usando la lagrangiana equivalente 2.57 si ottiene π = iψ +
π+ = 0
generale, dunque, ogni volta che consideriamo campi "complessi" ψ,ψ + esiste una simmetria globale interna che implica la conservazione della carica elettrica. 19 In
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)61 dove la seconda espressione di fatto è un semplice vincolo, che non produce una nuova coppia indipendente di campi coniugati. Le equazioni di Hamilton in questo caso sono della forma ψ˙ α (x) = {ψα (x), H}t π˙α (x) = {πα (x), H}t con α = 0, 1, 2, 3, quindi di fatto si tratta di 8 equazioni diverse. Le parentesi di Poisson sui campi, invece, usando la lagrangiana equivalente 2.57 sono {ψα (x), ψβ (y)} = {πα (x), πβ (y)} = 0 {ψα (x), πβ (y)} = δ 3 (x − y)δαβ Quest’ultima parentesi di Poisson concide con {ψα (x), ψβ+ (y)} = −iδ 3 (x − y)δαβ
2.3.4
Teoria classica relativistica di campo vettoriale (reale)
Vogliamo ora sviluppare una teoria classica relativistica di campo vettoriale (ci limitiamo al solo caso reale). Tale teoria sarà descritta dunque da un campo quadrivettoriale Aµ (x) = (A0 , ~A) il quale trasforma come un quadrivettore sotto trasformazioni del gruppo di Lorenz. Visto dal punto di vista delle rotazioni tridimensionali spaziali, il quadrivettore Aµ possiede 4 gradi di libertà: 1 derivante dallo scalare A0 , 3 derivanti dal vettore ~A. Un campo quadrivettoriale tuttavia dovrà descrivere particelle bosoniche di spin 1. In particolare: • nel caso massivo (m 6= 0) la particella avrà 3 gradi di libertà, uno per ogni valore di spin che può assumere: −1, 0, +1; • nel caso massless (m = 0), come per esempio quello del fotone, la particella avrà solo 2 gradi di libertà, poichè gli unici valori possibili dello spin sono ±1. Insomma, il quadrivettore Aµ sembra possedere più gradi di libertà di quelli richiesti. In realtà, come vedremo, esso in entrambi i casi sarà sottoposto in maniera naturale a dei vincoli che ne diminuiranno i gradi di libertà. Caso massivo (m 6= 0) Partiamo dal caso massivo libero. Denotiamo con V µ il campo che dovrà descrivere il nostro bosone massivo. Per prima cosa, dobbiamo cercare una densità lagrangiana che sia: • reale; • scalare sotto trasformazioni di Lorenz; • funzione di V µ e ∂ µ V ν ; • che sia, come nel caso scalare, quadratica in V µ e ∂ µ V ν .
62
CAPITOLO 2. TEORIE DI CAMPO LIBERE
Una prima possibilità è che la densità lagrangiana sia del tipo 1 1 L = − (∂µ Vν )(∂ µ V ν ) + m2V µ Vµ 2 2
(2.59)
Definendo l’oggetto antisimmetrico Vµν ≡ ∂µ Vν − ∂ν Vµ una seconda possibilità per la densità lagrangiana è che sia del tipo 1 1 L = − V µν Vµν + m2V µ Vµ 4 2
(2.60)
Si noti che questa lagrangiana ha i segni invertiti rispetto a quella della teoria di campo scalare: questo si rivelerà cruciale in seguito. Utilizziamo dunque la seconda lagrangiana per costruire la nostra teoria. Poichè ∂Vµ ∂Vσ ∂L = m2V µ = m2V µ ηµσ = m2V µ ηµσ = m2V σ ∂Vσ ∂Vσ ∂Vσ e, sfruttando l’antisimmetria di Vµν ∂Vµν ∂ ∂µ Vν ∂L 1 ρ = − V µν = −V µν = −V µν δµ δνσ = −V ρσ ∂ ∂ρ Vσ 2 ∂ ∂ ρVσ ∂ ∂ ρVσ allora le equazioni di Eulero-Lagrange della teoria sono m2V σ + ∂ρ V ρσ = 0 cioè l’equazione di Proca ( + m2 )V σ − ∂ σ (∂ρ V ρ ) = 0
(2.61)
L’equazione di Proca in realtà si può ridurre semplicemente all’equazione di Klein-Gordon con l’aggiunta di un vincolo: se infatti deriviamo l’equazione per ∂σ otteniamo (∂σ V σ ) + m2 (∂σ V σ ) − (∂σ V σ ) = 0 → m2 (∂σ V σ ) = 0 e poichè la teoria in questione riguarda una particella massiva (m 6= 0) allora ∂σ V σ = 0 In virtù di questo vincolo sul campo V µ ne consegue che l’equazione di Proca si possa riscrivere come ( + m2 )V µ = 0 con ∂µ V µ = 0 (2.62) cioè l’equazione di Klein-Gordon per ciascuna delle 4 componenti di V µ con il vincolo ∂µ V µ = 0. In virtù di ciò, le soluzioni dell’equazione di Proca avranno la forma delle soluzioni dell’equazione di Klein-Gordon. Limitandoci al caso reale, allora µ
V =
Z
d4k µ −ikx ∗µ ikx f (k)e + f (k)e (2π)4
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)63 Ora, V µ deve essere soluzione dell’equazione di Klein-Gordon, cioè Z d4k 2 µ 2 2 µ −ikx ∗µ ikx ( + m )V = =0 (−k + m ) f (k)e + f (k)e (2π)4 Definiamo allora la funzione f µ (k) come p µ f µ (k) = (2π)5/2 2ωk δ (k2 − m2 ) ∑ ε(λ ) (k)aλ (k) λ µ
dove il quadrivettore ε(λ ) è detto vettore di polarizzazione e descrive proprio i gradi di libertà di f µ (k), dove λ è un indice che indica lo stato di polarizzazione. Allora, la soluzione generale dell’equazione di Proca è 20 Z 1 d3k µ ∗µ µ −ikx ∗ ikx √ V (x) = ε (k)a (k)e + ε (k)a (k)e (2.63) ∑ (λ ) (λ ) (λ ) (λ ) k0 =ωk 2ωk λ (2π)3/2 Il campo quadrivettoriale V µ deve però soddisfare anche il vincolo ∂µ V µ = 0, il quale implica la condizione µ kµ ε(λ ) (k) = 0 (2.64) Questa condizione ci dice che non tutti i vettori di polarizzazione sono indipendenti: fissato il quadrimomento k µ solamente 3 vettori di polarizzazione possono essere scelti in maniera arbitraria, mentre il quarto deve essere scelto in modo tale che la 2.64 sia rispettato. Questo implica che il numero di gradi di libertà del sistema è ridotto a 3 e questo si concilia con il fatto che vogliamo descrivere una particella vettoriale massiva, la quale possiede 3 gradi di libertà. Si definiscono i vettori di polarizzazione εµ(1,2) = (0, eˆ1,2 ) trasversali ~ (2.65) ~k (3) | k| εµ = m , m longitudinale con ~k · eˆ1,2 = 0, ossia scegliendo la direzione del moto, cioè ~k, lungo il versore eˆ3 . Una differenza fondamentale tra le particelle vettoriali massive e massless sarà legata a tali vettori di polarizzazione: le particelle massless avranno solamente le componenti trasversali, mentre le particelle massive prevedono un’ulteriore componente longitudinale. In definitiva, i vettori di polarizzazione 2.65 descrivono i 3 gradi di libertà della particella massiva vettoriale. essi soddisfano le seguenti proprietà: (λ 0 )
ε (λ )µ εµ
= −δλ λ 0 ortogonalità 3 kµ kν (λ ) (λ ) (quasi) completezza ∑ εµ (k)εν (k) = − ηµν − m2 λ =1
(2.66) (2.67)
Formuliamo ora la teoria hamiltoniana. Il momento coniugato del campo quadrivettoriale V µ è il quadrivettore ∂L πµ = = −V 0µ (2.68) ∂ ∂0Vµ 20
Si ricordi che per l’invarianza della misura Z
d 4 kδ (k2 − m2 ) '
Z
d3k 2ωk
64
CAPITOLO 2. TEORIE DI CAMPO LIBERE
Si noti che, per l’antisimmetria di V µν , si ha che π 0 = −V 00 = 0 il che implica che V0 non ha il ruolo di variabile dinamica, bensì di costante 21 . Questo significa che i gradi di libertà fisici sono solamente le tre componente V1 ,V2 e V3 di V µ . Calcoliamo allora la densità hamiltoniana: H = π µ (∂0Vµ ) − L = 1 1 1 1 = π 0 ∂0V0 +π i ∂0Vi + V 0iV0i + V i jVi j − m2V 0V0 − m2V iVi | {z } 2 4 2 2 0
Sfruttando la definizione di momento coniugato e il fatto che quando si abbassa un indice spaziale si ottiene un cambio di segno, allora la densità hamiltoniana si può riscrivere come 1 1 1 1 H = πi2 − πi ∂iV0 + Vi2j + mVi2 − m2V02 2 4 2 2 Poichè −πi ∂iV0 = −∂i (πV0 ) + (∂i πi )V0 allora possiamo definire la densità hamiltoniana come 1 1 1 (2.69) H = πi2 + Vi2j + m2Vi2 2 4 2 dove abbiamo buttato via la tridivergenza, assolutamente ininfluente per il calcolo dell’hamiltoniana, e il termine 21 m2V02 , poichè V0 , essendo una costante e non una variabile dinamica, possiamo metterla a 0. Si noti che la densità hamiltoniana è definita positiva e questo è dovuto ai segni opportunamente scelti della densità lagrangiana 2.60. La densità hamiltoniana dipende poi dai soli gradi di libertà spaziali che, come detto, sono gli unici con un significato fisico. ESERCIZIO: dimostrare che la densità hamiltoniana che si ricava dalla densità lagrangiana 2.59 non è definita positiva e che la densità lagrangiana 2.59 porta ad avere come equazioni del moto le equazioni di Klei-Gordon 1.20. ESERCIZIO: dimostrare che la corrente di Nöther associata all’invarianza per traslazioni spaziotemporali è 1 1 µ T˜ µν = −Vρ ∂ν V ρ + η µν V ρσ Vρσ − m2 η µν V ρ Vρ 4 2 e che Z H = d 3 xT˜ 00 ESERCIZIO: dimostrare che la corrente di Nöther associata all’invarianza per trasformazioni del gruppo di Lorenz (rotazioni) è µ
µ
µ
µ
µ
J(ρσ ) = (xρ T˜σ − xσ T˜ρ ) + (Vρ Vσ −Vσ Vρ ) e la carica conservata è Lρσ + Sρσ ≡
Z
3
d x(xρ pσ − xσ pρ ) +
con Sρσ ≡ d 3 x(Vρ0Vσ −Vσ0Vρ ) l’operatore di spin 1. R
21 Questo
provoca la non covarianza della teoria di campo.
Z
d 3 x(Vρ0Vσ −Vσ0Vρ )
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)65 Caso massless (m = 0) Passiamo ora al caso massless (m = 0). La teoria di campo che vogliamo costruire dovrà presentare come equazioni del moto le equazioni di Maxwell: si tratta della teoria di campo dell’ elettromagnetismo. Le equazioni di Maxwell in forma covariante necessitano della definizione di tre oggetti: 1. il tensore elettromagnetico 22 ( F 0i = E i = F i j = εi jk Bk
(2.70)
1 F˜ µν = ε µνρσ Fρσ 2
(2.71)
F µν il quale è antisimmetrico; 2. il tensore elettromagnetico duale
3. la quadricorrente J µ = (ρ, ~j) In questo modo le equazioni di Maxwell in forma covariante sono ∂µ F µν = −J ν
∂µ F˜ µν = 0
(2.72)
La prima equazione implica la conservazione della quadricorrente J ν : prendendone infatti la quadridivergenza risulta ∂ν ∂µ F µν = 0 in quanto il tensore F µν è antisimmetrico nei due indici µ, ν mentre ∂µ ∂ν è simmetrico. Questo implica dunque che ∂µ J µ = 0. Definendo a questo punto il quadripotenziale Aµ (x) tale che F µν = ∂ µ Aν − ∂ ν Aµ
(2.73)
allora la seconda equazione è immediatamente verificata, fornendo l’identità per gli stessi argomenti di contrazione tra tensori. In questo caso la prima equazione di Maxwell diventa Aν − ∂ ν (∂µ Aµ ) = −J ν Limitandosi al caso della teoria libera (J ν = 0), in assenza cioè di cariche nello spazio, le equazioni di Maxwell si riducono a Aν − ∂ ν (∂µ Aµ ) = 0
(2.74)
Sviluppiamo dunque una teoria lagrangiana elettromagnetica libera, le cui equazioi di EuleroLagrange siano insomma le 2.74. La cosa più facile da fare è definire la lagrangiana dell’elettromagnetismo come quella di una teoria di campo vettoriale massivo imponendo però m = 0. In questo modo: 1 (2.75) LEM = − F µν Fµν 4 22 NB:
il tensore elettromagnetico che avevamo visto a suo tempo è definito con un segno - rispetto alla definizione 2.70, ripercuptendosi anche sulle equazioni di Maxwell (la quadricorrente ha un segno -).
66
CAPITOLO 2. TEORIE DI CAMPO LIBERE
Le equazioni del moto sono esattamente le equazioni di Maxwell libere: infatti 0=
∂ LEM ∂ LEM + ∂ρ = · · · = Aν − ∂ ν (∂µ Aµ ) ∂ Aµ ∂ ∂ρ Aµ
Nel caso massivo, come visto, prendere la quadridivergenza dell’equazione del moto portava all’introduzione di un vincolo che diminuiva i gradi di libertà del sistema, oltre che alla riscrittura delle equazioni del moto stesse (vedi 2.62). In questo caso, invece, applicare la quadridivergenza sull’equazione del moto porta all’identità Aµ = aµ e questo mantiene a 4 il numero di gradi di libertà del nostro sistema, che sono le 4 componenti del quadrivettore Aµ (x). La differenza principale tra caso massivo e massless è che, nel secondo caso, la teoria prevede una simmetria in più: si tratta di una simmetria di gauge. Dato il quadrivettore Aµ (x), la trasformazione 23 0 A µ (x) = Aµ + ∂ µ α(x) (2.76) con α(x) una generica funzione reale, è detta trasformazione di gauge. Come si può notare, si tratta di una trasformazione locale: il parametro della trasformazione dipende infatti dal punto x scelto. Dimostriamo l’invarianza del tensore elettromagnetico sotto tale trasformazione: F
0 µν
0
0
= ∂ µ A ν − ∂ ν A µ = F µν + ∂ µ ∂ ν α − ∂ ν ∂ µ α = F µν
Questo implica l’invarianza della lagrangiana, dunque delle equazioni di Maxwell libere, sotto trasformazioni di gauge. Si noti che nel caso massivo la teoria non è invariante sotto trasformazioni di gauge, non essendolo il termine 21 m2V m uVµ della lagrangiana 2.59. La scelta della gauge dunque non è fisica, in quanto l’operazione di gauge fixing non modifica la fisica descritta dalla teoria. La gauge più semplice da scegliere è la gauge di Coulomb ~∇ · ~A = 0 Si tratta di una condizione di gauge fixing esplicitamente non relativistica. Nel caso di una teoria libera, essa implica la possibilità di porre A0 = 0. In definitiva, nel caso di nostro interesse, la gauge di Coulomb corrisponde ad imporre ~∇ · ~A = 0,
A0 = 0
(2.77)
Nella gauge di Coulomb le equazioni del moto per una teoria di campo massless 2.74 si riducono alle equazioni di Klein-Gordon Aµ = 0 in quanto ∂ ν (∂µ Aµ ) = ∂ ν (∂0 |{z} A0 + ~∇ · ~A) = 0. Le soluzioni di questa equazione le conosciamo |{z} 0
0
e sono della forma 1 A (x) = (2π)3/2 µ
Z
d3k 3 µ −ikx ∗ ikx √ ∑ ε (k) aλ (k)e + aλ (k)e k0=|~k| 2ωk λ =0 (λ ) µ
avendo supposto che i vettori di polarizzazione ε(λ ) siano reali24 . Le condizioni di gauge di Coulomb implicano che: 23
ATTENZIONE: vedi anche la nota relativa alla trasformazione di gauge con segno invertito nel caso di teorie con interazione (vedi 3.14). 24 Si ricordi che l’indice λ indica le possibili polarizzazioni del quadripotenziale che, in generale, sono 4.
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)67 • A0 = 0 implica 0 ε(λ ) = 0,
λ = 0, 1, 2, 3
ossia tutti i vettori di polarizzazione hanno componente temporale nulla; • ~∇ · ~A = 0 implica ~k ·~ε(λ ) = 0,
λ = 0, 1, 2, 3
cioè il vettore ~ε(λ ) é ortogonale alla direzione del moto della particella descritta dal campo Aµ (x) . Fissando in particolare che la direzione del moto del fotone sia lungo l’asse z allora gli unici vettori di polarizzazione non nulli sono ( µ ε1 = (0, 1, 0, 0) con k µ = (k0 , 0, 0, |~k|) (2.78) µ ε2 = (0, 0, 1, 0) Questo significa che il fotone può possedere solo polarizzazione trasversale e non longitudinale, come precedentemente anticipato: i vettori di polarizzazione di cui sopra sono dunque i due gradi di libertà richiesti per descrivere il fotone ed essi, nel caso della teoria di campo vettoriale massless, emergono dall’invarianza sotto traformazioni di gauge. Normalmente nel caso relativistico si usa imporre la gauge di Lorenz ∂µ Aµ = 0
(2.79)
la quale è esplicitamente covariante. Si osservi che: 1. partendo da un generico Aµ (x) è sempre possibile ricavare una quadripotenziale che soddisfi la gauge di Lorenz attraverso un’opportuna trasformazione di gauge, ossia scegliendo opportunamente la funzione α(x). Se infatti Aµ (x) in generale non soddisfa la gauge 0 di Lorenz, il quadrivettore A µ (x) = Aµ (x) + ∂ µ (x) soddisfa la gauge di Lorenz se la funzione α(x) soddisfa la condizione α = −∂µ Aµ . Infatti: 0
0 = ∂µ A µ = ∂µ Aµ + α ⇒ α = −∂µ Aµ 2. l’operazione di gauge fixing in questo caso prevede la presenza di una gauge residua: infatti, se oltre alla traformazione di gauge 2.76 effettuiamo una seconda trasformazione di gauge 00 0 A µ = A µ + ∂ µβ che debba ancora soddisfare la gauge di Lorenz, allora 00 µ
0
= ∂µ A µ + β
0 = ∂µ A
0
la quale implica β = 0, visto che ∂µ A µ = 0 in quanto soddisfacente per ipotesi la condizione 1.34. Quest’ultima condizione non fissa completamente la funzione β (x), la quale dunque costituisce un grado di libertà del nostro sistema. In questo modo, la teoria di campo in esame non descrive 2 gradi di libertà, bensì 3. Anche nel caso della gauge di Lorenz le equazioni del moto della teoria sono le equazioni di Klein-Gordon Aν = 0
68
CAPITOLO 2. TEORIE DI CAMPO LIBERE
In questo caso, però, le soluzioni Aν (x) devono descrivere 3 gradi di libertà, dunque avranno la stessa forma delle soluzioni della teoria del caso massivo. In tal caso, tuttavia, uno dei 3 vettori di polarizzazione non avrà significato fisico. Passando alla costruzione della teoria hamiltoniana, mantenendo valida la gauge di Lorenz, ci si rende immediatamente conto della necessità di dover modificare qualcosa. I momenti coniugati πµ =
LEM = −F 0µ ∂ ∂0 Aµ
sono, per l’antisimmetria del tensore elettromagnetico, tali che π 0 = −F 00 = 0 quindi l’operazione di gauge fixing di Lorenz sottrae a A0 il ruolo di variabile dinamica. Questo implica una differenziazione tra i vincoli da imporre sulla componente temporale e quelli da imporre sulle componenti spaziali del quadrivettore Aµ (x), con conseguente perdita della covarianza della teoria. In questo caso varrebbe allora la pena di operare direttamente con la condizione di gauge fixing di Coulomb, la quale però non è covariante. Per risolvere la questione riscriviamo la lagrangiana 2.75 aggiungendovi un termine di gauge fixing: costruiamo cioè una teoria di campo vettoriale massless differente da quella elettromagnetica, descritta da una lagrangiana del tipo L = LEM + LGF Ora, visto che la condizione di gauge voluta è quella di Lorenz, scriviamo la lagrangiana nel modo seguente: 1 1 (2.80) L = − F µν Fµν − (∂µ Aµ )2 4 2ξ 1 con xi parametro arbitrario, dove LGF = − 2ξ (∂µ Aµ )2 è la lagrangiana di gauge fixing che "assomiglia" in forma alla condizione di gauge fizing di Lorenz. Quest’ultima non è invariante sotto trasformazioni di gauge, dunque non lo è neppure la lagrangiana 2.80, quindi la teoria di campo che stiamo sviluppando non può essere quella elettromagnetica che, invece, è gauge invariante. Le equazioni di Eulero-Lagrange relative a questa lagrangiana sono (verificare) ∂L ∂L ξ −1 µσ µ σ + ∂ρ = η − ∂ ∂ Aσ = 0 0= ∂ Aµ ∂ ∂ρ Aµ ξ
Data l’arbitrarietà del parametro ξ possiamo fissarlo al valore che vogliamo. Imponendo la condizione di gauge fixing residua di Feynman ξ =1
(2.81)
le equazioni del moto associata alla lagrangiana 2.80 è l’equazione di Klein-Gordon per un campo vettoriale massless: Aν = 0 (ξ = 1)
ESERCIZIO: verificare che la lagrangiana 1 1 L = − (∂µ Aν )(∂ µ Aν ) + 2 2 0
ξ −1 (∂µ Aµ )2 ξ
2.3. TEORIA LAGRANGIANA (CLASSICA) PER UN CAMPO SCALARE (RELATIVISTICO)69 è equivalente alla 2.80. Scegliamo dunque come densità lagrangiana 1 L = − (∂µ Aν )(∂ µ Aν ) 2
, (ξ = 1)
che corrisponde alla L 0 con l’applicazione della condizione di gauge fixing residua di Feynman. Ad essa è associata l’equazione di Eulero-Lagrange Aν = 0 La soluzione generale è della forma 1 A (x) = (2π)3/2 µ
d3k 3 µ −ikx ∗ ikx √ ε (k) a (k)e + a (k)e ∑ λ λ k0 =|~k| 2ωk λ =0 (λ )
Z
µ
con i vettori di polarizzazione ε(λ ) (k) supposti reali. Definiamo poi µ A+
1 ≡ (2π)3/2
µ A−
Z
1 ≡ (2π)3/2
Z
d3k 3 µ √ ε(λ ) (k)aλ (k)e−ikx ∑ 2ωk λ =0 d3k 3 µ √ ∑ ε (k)a∗λ (k)eikx 2ωk λ =0 (λ )
Essi descrivono 4 gradi di libertà e soddisfano le condizioni seguenti: µ
ε(λ ) (k)εµ(λ 0 ) = ηλ λ 0
(ortogonalità)
(2.82)
3 µ
∑ ε(λ )(k)ε(λν ) = η µν
(completezza)
(2.83)
λ =0
Definendo un quadrivettore di tipo tempo di modulo unitario nµ tale che k µ · nµ 6= 0 ossia un vettore del tipo nµ = (1, 0, 0, 0) e fissando k µ = (k0 , 0, 0, |k|) cioè identificando con l’asse z la direzione del moto, possiamo scrivere i vettori di polarizzazione in questo modo: • εµ0 (k) = nµ
(2.84)
detto vettore di polarizzazione scalare; •
kµ − (nk)nµ nk detto vettore di polarizzazione longitudinale; εµ3 (k) =
(2.85)
70
CAPITOLO 2. TEORIE DI CAMPO LIBERE (1,2)
• εµ
(k) tali che ( (1,2) (1,2) εµ k µ = εµ nµ ~ε (1,2) ·~ε (1,2) = −1
(2.86)
detti vettori di polarizzazione trasversale (ovviamente ortogonali a k µ ), della forma 2.78. ESERCIZIO: verificare le proprietà di ortogonalità e completezza. Costruiamo ora la teoria hamiltoniana. Il momento coniugato π µ (x) è πµ =
∂L = −∂ 0 Aµ ∂ ∂0 Aµ
che in generale ha componenti non nulle. Questo implica che tutte 4 le componenti del quadripotenziale Aµ (x) sono variabili dinamiche, costituendo dunque dei campi fisici. La densità hamiltoniana è (verificare) H = π µ (∂0 Aµ ) − L =
1 i 2 (π ) + (∂ i A j )2 − (π 0 )2 − (∂ i A0 )2 2
(2.87)
Come si può notare, essa non è definita positiva25 . Le parentesi di Poisson sono (verificare) ( Aµ (x), Aν (y) t = πµ (x), πν (y) t = 0 Aµ (x), πν (y) t = δ 3 (x − y)ηµν e le equazioni di Hamilton sono A˙ µ (x) = Aµ (x), H t
2.4 2.4.1
π˙ µ (x) = πµ (x), H t
Quantizzazione canonica di una teoria di campo relativistica Sistemi con un numero finito di gradi di libertà
Un sistema costituito da un numero finito di gradi di libertà (particelle) è caratterizzato da una lagrangiana L(q, q) ˙ e, una volta definito il momento coniugato p = ∂∂ Lq˙ , da una hamiltoniana H(p, q) = pq˙ − L. Esistono inoltre due "set" di parentesi di Poisson: i. le equazioni di Hamilton 2.10; ii. le parentesi di Poisson tra coordinate e momenti coniugati 2.12 e 2.13. Essi ci permettono di definire le prescrizioni della quantizzazione canonica: i. le variabili (qi , pi ) si sostituiscono con due operatori (Xi , Pi ): (qi , pi ) −→ (Xi , Pi ) 25 Nonostante
seguito.
(2.88)
questo sia, in effetti, un problema, proseguiamo con la trattazione: la questione verrà risolta in
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 71 ii. le parentesi di Poisson a tempo fissato vengono sostituite dal commutatore a tempo fissato tra gli operatori: i {·, ·}t −→ − [·, ·]t (2.89) h¯ Da tutto ciò segue che: 1. le equazioni di Hamilton 2.10 diventano i dX = − [X, H]t h¯ dt
dP i = − [P, H]t h¯ dt
(2.90)
Queste sono le equazioni che definiscono l’evoluzione temporale degli operatori X e P, cioè le equazioni del moto in visuale di Heisenberg (stati fissi, osservabili variabili nel tempo); 2. le relazioni 2.12 e 2.13 forniscono le condizioni di quantizzazione canonica ( Xi , X j = 0 = Pi , Pj Xi , Pj = i¯hδi j
2.4.2
(2.91)
Sistemi con un numero infinito di gradi di libertà: i campi
Un sistema costituito da un numero infinito di gradi di libertà (particelle) è caratterizzato da una lagrangiana L (ϕ, ∂µ ϕ) e, una volta definito il momento coniugato π = ∂∂∂Lϕ , da una densità 0 hamiltoniana H = π∂0 ϕ − L . In tal caso, i due "set" di parentesi di Poisson sono: i. le equazioni di Hamilton 2.26; ii. le parentesi di Poisson tra campi e campi coniugati 2.27 e 2.28. Ora, la quantizzazione canonica ha le seguenti prescrizioni: ˆ π): ˆ i. i campi classici (ϕ, π) si sostituiscono con due operatori (ϕ, ˆ π) ˆ (ϕ, π) −→ (ϕ,
(2.92)
ii. le parentesi di Poisson a tempo fissato tra i campi classici vengono sostituite dal commutatore a tempo fissato tra gli operatori: {·, ·}t −→ −i[·, ·]t
(¯h = 1)
(2.93)
Da tutto ciò segue che: 1. le equazioni di Hamilton 2.26 diventano d ϕˆ ˆ Hˆ t = −i ϕ, dt
d πˆ ˆ Hˆ t = −i π, dt
(¯h = 1)
(2.94)
dove Hˆ è l’operatore hamiltoniano. Queste sono le equazioni che definiscono l’evoluzione ˆ cioè le equazioni del moto in visuale di Heisenberg (stati temporale degli operatori ϕˆ e π, fissi, osservabili variabili nel tempo);
72
CAPITOLO 2. TEORIE DI CAMPO LIBERE 2. le relazioni 2.27 e 2.28 forniscono le condizioni di quantizzazione canonica26 ) ( ˆ x,t), ϕ(~ ˆ y,t)] = 0 = [π(~ ˆ x,t), π(~ ˆ y,t)] [ϕ(~ (2.96) 3 ˆ x,t), π(~ ˆ y,t)] = iδ (~x −~y) (¯h = 1) [ϕ(~
2.4.3
Campo reale scalare libero
Nel caso di una teoria libera di campo scalare reale ϕ le equazioni del moto coincidono con le equazioni di Klein-Gordon 1.20, le cui soluzioni reali sono 1.27. Dato che, per la prescrizione 2.92 i campi ϕ e π devono diventare operatori, allora la stessa cosa avverrà per a(~k) e a∗ (~k): essi diventano gli operatori hermitiani a( ˆ ~k) e aˆ+ (~k). In virtù di ciò: Z i 1 d 3 k h ~ −ik·x + ik·x ~ ˆ √ a( ˆ k)e + aˆ (k)e ϕ(x) = 0 2ωk (2π)3/2 k =ωk i ˆ π(x) =− (2π)3/2
Z
con 1 a(~ ˆ p) = (2π)3/2 aˆ+ (~p) =
1 (2π)3/2
i h d3k −ik·x + ik·x √ ωk a( ˆ ~k)e − aˆ (~k)e 0 2ωk k =ωk d3x ip·x ˆ + iπ(x)] ˆ √ e [ω p ϕ(x) 2ωk p0 =ω p Z d3x ˆ −i π(x) ˆ ]e−ip·x √ [ω p ϕ(x) |{z} |{z} 2ωk 0 ϕˆ + (x) πˆ + (x)
Z
p =ω p
27
Questo ci permette di trovare (esercizio) le condizioni di quantizzazione nello spazio dei momenti ( [a(~p), a(~k)]t = 0 = [a+ (~p), a+ (~k)]t (2.97) [a(~p), a+ (~k)]t = δ 3 (~p −~k) dalle quali si ricavano le 2.96, e viceversa. Le condizioni di quantizzazione 2.97 generalizzano le equazioni di un oscillatore armonico per un sistema con infiniti gradi di libertà. Invece di prendere degli operatori continui a(p) prendiamo degli operatori discreti a p le relazioni 2.97 diventano ( + [a p , ak ]t = 0 = [a+ p , ak )]t [a p , a+ k ]t = δ pk ossia a p e ak , poichè commutano, consistono in due oscillatori armonici indipendenti. D’ora in avanti a(~k) e a+ (~k) assumeranno rispettivamente il ruolo di operatore di distruzione e 26
Queste valgono solamente per un solo campo ϕ e il suo coniugato π. Nel caso di N campi ϕ1 , . . . , ϕN , i cui campi coniugati sono π1 , . . . , πN , le relazioni 2.96 si generalizzano: ( [ϕˆi (~x,t), ϕˆ j (~y,t)] = 0 = [πˆi (~x,t), πˆj (~y,t)] (2.95) [ϕˆi (~x,t), πˆj (~y,t)] = i¯hδ 3 (~x −~y)δi j (¯h = 1) 27
Da questo momento in avanti si ometterà il "cappuccio" ˆ visto che le quantità in considerazione sono inequivocabilmente operatori quantistici.
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 73 creazione. Definiamo l’operatore densità numero N (k) = a+ (k)a(k)
(2.98)
N + (k) = N (k) hermitiano ( [N (k), a(p)] = −a(p)δ 3 (~k −~p) [N (k), a+ (p)] = a+ (p)δ 3 (~k −~p)
(2.99)
che soddisfa le seguenti proprietà:
(2.100)
e l’operatore numero Z
N=
N (k)d 3 k
(2.101)
il quale soddisfa le proprietà seguenti: N + (k) = N(k) hermitiano ( [N, a(p)] = −a(p) [N, a+ (p)] = a+ (p)
(2.102) (2.103)
In virtù di ciò valutiamo nel dettaglio l’hamiltoniano. Considerando la densità hamiltoniana 2.47 si calcola che Z
H=
d 3 xH =
1 2
Z
ωk a+ (k)a(k) + a(k)a+ (k) d 3 k
che per i commutatori 2.97 diventa28 Z
H=
1 ωk N (k)d k + 2 3
Z
ωk [a(k), a+ (k)]d 3 k
Ora, la seconda quantità in realtà diverge all’infinito: infatti, per i commutatori 2.97 abbiamo che Z Z Z + 3 3 3 3 ωk [a(k), a (k)]d k = ωk δ (0)d k = δ (0) ωk d 3 k = ∞ integrando su un’infinità di stati. Questo termine, tuttavia, è del tutto eliminabile29 . Infatti, considerando la quantità equivalente nel caso finito abbiamo N
∑ ωi = C
i=1 28
ATTENZIONE: noi qui stiamo ragionando sin dall’inizio in termini quantistici, ossia consideriamo a e il suo coniugato già in versione operatoriale quantistica (perciò il coniugato di a diventa a+ , cioè l’aggiunto), quindi gli operatori a e a+ non commutano. Questo, come si vede immediatamente, porta ad una anomalia, seppur eliminabile, relativa all’energia dello stato fondamentale. Se invece noi avessimo ragionato in termini classici sino alla fine del conto, considerando cioè a e il suo coniugato come delle funzioni, che quindi commutano, avremmo R R ottenuto H = ωk a+ (k)a(k)d 3 k = ωk N (k)d 3 k, per poi passare solo ora in ambito quantistico considerando H come l’operatore hamiltoniano. Noi faremo la stessa cosa restando sin dall’inizio in ambito quantistico, ma solo dopo aver "buttato via" il termine aggiuntivo che ci resta, oppure, analogamente, definendo il prodotto ordinato normale. 29 Qualora si riuscisse a quantizzare la gravità ciò non sarebbe più possibile, visto che a tale energia infinita corrisponderebbe una certa massa infinita, da inserire opportunamente nella teoria.
74
CAPITOLO 2. TEORIE DI CAMPO LIBERE
con C costante arbitraria. Questo termine è quindi definibile come il livello energetico dello stato forndamentale, il quale può arbitrariamente essere messo a 0: così come si fa nella trattazione dell’oscillatore armonico quantistico, la quantità di interesse è infatti la differenza di energia rispetto allo stato fondamentale. In maniera del tutto analoga, l’operatore momento è Z
Pi = cioè
π (∂i ϕ) d 3 x =
1 2
Z
ki a+ (k)a(k) + a(k)a+ (k) d 3 k
1 ki [a(k), a+ (k)]d 3 k Pi = ki N (k)d k + 2 con il secondo termine, interpretabile come il trimomento dello stato fondamentale, viene "buttato via" con le stesse argomentazioni di prima. In definitiva, per un campo scalare reale gli operatori hamiltoniano e trimomento sono Z
3
Z
H= Z
Pi =
Z
ωk N (k)d 3 k
(2.104)
ki N (k)d 3 k
(2.105)
k µ N (k)d 3 k
(2.106)
ossia il quadrimomento è µ
P =
Z
Dunque, l’energia del sistema è in sostanza la somma dei prodotti delle energie relative ai singoli stati moltiplicate per il rispettivo numero di occupazione dello stato stesso e, analogamente, il trimomento del sistema è la somma dei prodotti dei trimomenti relativi ai singoli stati moltiplicati per il rispettivo numero di occupazione dello stato stesso. Come abbiamo detto, il termine di energia/trimomento dello stato fondamentale emerge a causa del fatto che gli operatori di creazione e distruzione non commutano, ma soddisfano la proprietà 2.97. Per eliminare formalmente questo termine di ambiguità, definiamo il prodotto ordinato normale: dato un generico operatore nello spazio dei momenti A , ossia scritto in funzione degli operatori di creazione a+ e distruzione a mettiamo a sinistra tutti i termini di creazione e a destra i termini di distruzione, formalmente + : A :≡ (a+ k1 . . . akN )(ak1 . . . akN )
(2.107)
Agli effetti pratici, questo significa sostituire dei termini del tipo aa+ con a+ a. In particolare, nel caso dell’hamiltoniano: 1 ωk a+ (k)a(k) + a(k)a+ (k) d 3 k := : H : =: 2Z 1 ωk a+ (k)a(k) + a+ (k)a(k) d 3 k = Z2 Z 3 + = ωk a (k)a(k) d k = ωk N (k)d 3 k Z
che è esattamente 2.104. In definitiva, il prodotto normale tutti gli operatori nello spazio dei momenti commutano. Nonostante questo, l’algebra che stiamo considerando non viene modificata, cioè è invariante per prodotto ordinato normale.
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 75 sino ad ora non abbiamo specificato nulla sullo spazio di Hilbert dei momenti su cui gli operatori di distruzione e creazione agiscono. Lo spazio di Hilbert in questione è il cosiddetto spazio di Fock, la cui definizione operativa è la seguente: 1. definiamo uno stato di vuoto |0i tale che N (k)|0i = 0
∀k
(2.108)
ossia lo stato che viene annichilato dall’operatore densità numero. |0i è chiamato stato di vuoto perchè: • dalla 2.108 deriva subito che N|0i = 0 cioè ha numero di occupazione30 0; • dalla 2.104 deriva H|0i = 0 cioè ha energia nulla; • dalla 2.105 deriva Pi |0i = 0 cioè ha trimomento nullo; 2. lo spazio di Fock è lo spazio di Hilbert che si ottiene applicando la costruzione a+ in maniera ripetitiva sullo stato di vuoto: |n1 n2 . . . nl i = C(a+ (k1 ))n1 (a+ (k2 ))n2 . . . (a+ (kl ))nl
(2.109)
con C costante di normalizzazione31 . Valutiamo alcuni stati particolari dello spazio di Fock: • consideriamo lo stato |1(p)i = Ca+ (p)|0i
(2.110)
Vediamo qual è il suo numero di occupazione: Z
N|1(p)i = C
N a+ (p)|0id 3 k
il quale, per la relazione 2.103, diventa N|1(p)i = Ca+ (p)|0i = |1(k)i Dunque, lo stato |1(k)i ha numero di occupazione pari a 1. In maniera del tutto analoga sono H|1(k)i = ω p |1(k)i Pi |1(k)i = pi |1(k)i cioè ha energia e trimomento rispettivamente pari a ω p e pi . Da un punto di vista fisico, interpretiamo lo stato 2.110 come lo stato rappresentante una particella di energia ω p e trimomento pi , i = 1, 2, 3; 30 ... 31
cioè l’autovalore dell’operatore numero Vedremo tra poco in che modo si definisce.
76
CAPITOLO 2. TEORIE DI CAMPO LIBERE • lo stato |n(k)i = C(a+ (p))n |0i
(2.111)
è fisicamente interpretabile dunque come lo stato rappresentante n particelle identiche di energia ω p e trimomento pi , i = 1, 2, 3. Infatti si vede facilmente che N|n(k)i = n|n(k)i
H|n(k)i = nω p |n(k)i
Pi |n(k)i = npi |n(k)i
Si tratta di particelle identichè poichè possiedono la stessa massa, poichè avendo stessa energia e momento automaticamente hanno la stessa massa, in base alla relazione ω p = p M 2 + |~p|2 . tutto questo significa necessariamente che la nostra trattazione riguarda esclusivamente bosoni e l’esistenza di particelle identiche deriva dalle particolari regole di commutazione tra a e a+ . Nel caso fermionico, infatti, il principio di esclusione di Pauli escluderebbe l’esistenza di particelle identiche; • lo stato |n1(p1 )n2 (p2 )i = C(a+ (p1 ))n1 (a+ (p2 ))n2 |0i
(2.112)
è fisicamente interpretabile dunque come lo stato rappresentante n1 particelle identiche di energia ω p1 e trimomento pi1 , i = 1, 2, 3 più n2 particelle identiche di energia ω p2 e trimomento pi2 , i = 1, 2, 3. Infatti: N|n1 (p1 )n2 (p2 )i = (n1 + n2 )|n1 (p1 )n2 (p2 )i H|n1 (p1 )n2 (p2 )i = (ω p1 + ω p2 )|n1 (p1 )n2 (p2 )i Pi |n1 (p1 )n2 (p2 )i = (pi1 + pi2 )|n1 (p1 )n2 (p2 )i Ora, qual è il significato del campo ϕ? Dato che la teoria di campo studiata è quella per un campo scalare reale libero, allora ϕ corrisponde alla soluzione reale delle equazioni di KleinGordon 1.27, la quale si può scrivere come ϕ = ϕ1 + ϕ2 con 1 ϕ+ (x) = (2π)3/2 ϕ− (x) =
1 (2π)3/2
d 3 k ~ −ik·x √ a(k)e 0 2ωk k =ωk Z d 3 k + ~ ik·x √ a (k)e 2ωk k0 =ωk Z
Notiamo ora che h0|1(p)i = h0|(a+ (p)|0i) = (h0|a( p))|0i = 0 Tuttavia: 1 d3k √ h0|ϕ+ (x)|1(p)i = h0|a(k)e−ikx a+ (p)|0i = 3/2 2ωk (2π) Z 1 1 d3k 3 ~ e−ikx −ikx √ p = δ ( k −~ p)e = 2ωk (2π)3/2 (2π)3/2 2ω p Z
il che implica che ϕ+ (x)|1(p)i ∝ |0i, cioè ϕ+ distrugge una particella nel punto x. Analogamente, si mostra che ϕ− (x)|0i ∝ |1(p)i, cioè ϕ− crea una particella nel punto x. In definitiva, ϕ+ e ϕ− sono rispettivamente le trasformate di Fourier di a e a+ .
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 77
Vediamo ora come fissare le costanti di normalizzazione presenti nelle definizioni degli stati nello spazio di Fock. L’assunzione preliminare è che lo stato di vuoto sia normalizzato: h0|0i = 1 Sulla base di ciò, considerando lo stato di 1 particella 2.110 allora, per le relazioni di commutazione 2.97 h1(k)|1(p)i = C2 h0|a(k)a+ (p)|0i = δ 3 (~k −~p)C2 Ma la delta tridimensionale non è un oggetto invariante sotto trasformazioni del gruppo di Lorenz, quindi la costante C deve essere scelta nella maniera opportuna. La costante di normalizzazione fissata per lo stato 2.110 è dunque p (2.113) C = (2π)3/2 2ω p In questo modo32 h1(k)|1(p)i = (2π)3
p p 2ω p 2ωk δ 3 (~k −~p) = (2π)3 2ω p δ 3 (~k −~p)
il quale è un oggetto invariante sotto trasformazioni del sottogruppo proprio di Lorenz 33 .
Sino ad ora ci siamo semplicemente preoccupati di quantizzare la nostra teoria, senza preoccuparci di verificare se quanto detto fosse compatibile con il principio di relatività ristretta. Vediamo ora che, in realtà, quanto fatto sino ad ora è coerente con il principio di relatività ristretta, ossia che la teoria costruita con i commutatori a tempo fissato è covariante. Consideriamo il commutatore covariante D(x − y) = [ϕ(x), ϕ(y)]
(2.114)
ossia l’estensione quadridimensionale dei commutatori 2.96, definiti a tempo fissato34 . Calcoliamo esplicitamente il commutatore 2.114, ricordando che ϕ = ϕ1 + ϕ2 : D(x − y) = [ϕ+ (x), ϕ+ (y)] + [ϕ+ (x), ϕ− (y)] + [ϕ− (x), ϕ+ (y)] + [ϕ− (x), ϕ− (y)] Dato che ϕ+ è l’antitrasformata di Fourier di a, quindi ϕ ∝ a e, analogamente, ϕ− ∝ a+ , allora per le regole di commutazione 2.97 si ha che il primo e il quarto commutatore vanno a zero, perciò: D(x − y) = [ϕ+ (x), ϕ− (y)] + [ϕ− (x), ϕ+ (y)] 32
NB: vale la proprietà f (x)δ (x − y) = f (y)δ (x − y)
33
Questa affermazione sarà una diretta conseguenza di un risultato che vedremo tra poco. Tali commutatori sono definiti per intervalli di tipo spazio: essendo infatti il campo ϕ valutato nell’istante t in due punti spaziali differenti ~x e ~y allora 34
ds2 = dt 2 − c2 |~x|2 = −c2 |~x|2 < 0
78
CAPITOLO 2. TEORIE DI CAMPO LIBERE
Le condizioni 2.97 implicano anche che 1 D+ (x − y) = [ϕ+ (x), ϕ− (y)] = (2π)3
Z
1 (2π)3
Z
=
d3k √ 2ωk
Z
d 3 p −ikx ipy p e e 2ω p
[a(k), a+ (p)] | {z } δ 3 (~k−~p)
p0 =ω p
=
k0 =ωk
d3k
−ik(x−y) e 2ωk k0 =ωk
e in maniera del tutto analoga: 1 D− (x − y) = [ϕ− (x), ϕ+ (y)] = − (2π)3
d 3 k ik(x−y) e 2ωk k0 =ωk
Z
Questi due commutatori sono covarianti, perchè tali sono gli esponenziali e perchè tale è la misura. Considerata infatti una generica funzione scalare f (k), allora vale la relazione Z 3 Z 3 d k d k 4 2 = f (k) δ (k − m2 ) θ (k0 ) f (k) | {z } 2ωk 2ω k k0 =ωk k0 =ωk
Questa quantità e invariante sotto trasformazioni del sottogruppo proprio di Lorenz. Infatti: 4 4 • d 4 k0 = | det | {zΛ} |d k = d k; 1
• δ 4 (k2 − m2 ) è invariante in quanto lo sono k2 = (k0 )2 − |~k|2 e m2 ; • la funzione di Heaviside
( 1, θ (k0 ) 0,
k0 ≥ 0 k0 < 0
non è invariante sotto una generica trasformazione di Lorenz, ma limitandosi ad un intorno dell’identità è invariante sotto le trasformazioni di Lorenz che non modificano il segno di k0 , quindi sotto le trasformazioni del sottogruppo proprio di Lorenz. Perciò, i seguenti commutatori 1 D+ (x − y) = [ϕ+ (x), ϕ− (y)] = (2π)3
Z
d3k 4 2 δ (k − m2 )θ (k0 )e−ik(x−y) 2ωk
(2.115)
1 d3k 4 2 δ (k − m2 )θ (−k0 )e−ik(x−y) (2.116) (2π)3 2ωk sono covarianti sotto trasformazioni del sottogruppo proprio di Lorenz, è così anche il commutatore 2.114. Definiti i circuiti orari C+ e C− rispettivamente attorno ai punti (ωk , 0) e (−ωk , 0) nel piano complesso (x, y) = (ℜ(k0 ), ℑ(k0 )) allora i due commutatori precedenti possono essere riscritti tramite integrali complessi: D− (x − y) = [ϕ− (x), ϕ+ (y)] = −
Z
e−ik(x−y) 4 d k 2 2 C+ k − m
(2.117)
e−ik(x−y) 4 d k 2 2 C− k − m
(2.118)
i D+ (x − y) = [ϕ+ (x), ϕ− (y)] = (2π)4
I
i (2π)4
I
D− (x − y) = [ϕ− (x), ϕ+ (y)] =
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 79 Covarianza e microcausalità Abbiamo dimostrato che per un intervallo di tipo spazio vale il commutatore 2.96 [ϕ(~x,t), ϕ(~y,t)] = 0 e la sua estensione quadridimensionale covariante 2.114 D(x − y) = [ϕ(x), ϕ(y)] per consistenza deve essere, per ogni intervallo (x − y)2 < 0 (tipo spazio) D(x − y) = [ϕ(x), ϕ(y)] = 0 Questo significa che il campo nel punto x è totalmente scorrelato al campo nel punto y, essendo commutativi. Questa proprietà è detta microcausalità: consistentemente con il principio di relatività ristretta, due punti nello spazio-tempo di Minkowski sono connessi causalmente solamente se possono scambiarsi tra loro un segnale luminoso, ossia se essi costituiscono un intervallo di tipo luce (x − y)2 = 0 o di tipo tempo (x − y)2 > 0.
2.4.4
Campo scalare complesso libero
Nel caso di una teoria di campo scalare complesso la condizione 2.92 deve essere applicata per ciascuna coppia di campi coniugati. Essendovi dunque sia i campi (ϕ, π) che i campi complessi coniugati (ϕ ∗ , π ∗ ) la teoria di campo considerata dipenderà dalle coppie di operatori aggiunti ˆ π) ˆ e (ϕˆ + , πˆ + ). Omettendo ora il simbolo ˆ, la condizione di quantizzazione canonica 2.93 (ϕ, prevede che tutti i commutatori tra gli operatori ϕ, ϕ + , π, π + siano nulli, eccezion fatta per i seguenti casi: [ϕ(x), π(y)]t = [ϕ + (x), π + (y)]t = iδ 3 (x − y) (¯h = 1) Considerando in particolare la teoria di campo libero, l’equazione del moto diventa l’equazione di Klein-Gordon 1.20, le cui soluzioni complesse sono della forma 1.26 (dove ϕ, a e b∗ vengono ˆ aˆ e bˆ + ) e sostituiti dagli operatori ϕ, r Z i ωk + 3 ikx −ikx ˆ ˆ π(x) = d k aˆ (k)e − be 0 3/2 2 k =ωk (2π) Inserendo ϕˆ e πˆ nelle precedenti regole di commutazione risulta che tutti i commutatori con le ˆ bˆ + sono nulli, eccezion fatta per i seguenti casi: varie combinazioni di a, ˆ aˆ+ , b, [a(k), a+ (p)]t = [b(k), b+ (p)]t = δ 3 (k − p) Queste regole di commutazione nello spazio dei momenti individuano due famiglie distinte di infiniti oscillatori armonici, quindi due operatori di costruzione (a+ , b+ ) e di distruzione (a, b), cioè due famiglie distinte di particelle, le quali tuttavia, soddisfacendo entrambe alla stessa equazione di Klein-Gordon, possiedono la stessa massa. A questo punto possiamo scrivere le varie quantità nello spazio dei momenti "sdoppiando" quelle trovate nel caso reale. • Definiamo gli operatori densità numero e numero Na (k) = a (k)a(k) −→ Na =
Z
d 3 kNa
Nb (k) = b (k)b(k) −→ Nb =
Z
d 3 kNb
+
+
i quali soddisfano entrambi le proprietà di commutazione 2.100 e 2.103.
80
CAPITOLO 2. TEORIE DI CAMPO LIBERE • Data la forma 2.51 e sostituendovi le forme esplicite dei vari campi, l’operatore hamiltoniano è Z H = d 3 kωk (Na (k) + Nb (k)) + INF analogamente a quanto visto nel caso reale. In virtù della relazione 2.107, possiamo definire l’operatore hamiltoniano normalmente ordinato Z
d 3 kωk (Na (k) + Nb (k))
: H :=
• Analogamente, il trimomento normalmente ordinato è : Pi :=
Z
d 3 kki (Na (k) + Nb (k))
• A questo punto possiamo costruire lo spazio di Fock a partire dallo stato di vuoto |0i tale da annichilare entrambi gli operatori di densità numero: ( Na (k)|0i = 0 (2.119) Nb (k)|0i = 0 In particolare, possiamo definire lo stato n
|n(p), n(k)i =
n¯
(a+ (p)) (b+ (p)) √ √ |0i n! n! ¯
(2.120)
Questo è lo stato che individua un sistema costituito da n particelle di tipo a e n¯ particelle di tipo b, costruito sottoponendo lo stato di vuoto all’azione dell’operatore di costruzione a+ per le particelle di tipo a per n volte e all’azione dell’operatore di costruzione b+ per le particelle di tipo b per n¯ volte. Le particelle a e b si differenziano per la carica elettrica. Scriviamo esplicitamente la carica di Nöther associata alla simmetria U(1) del sistema: allora, dalla relazione 2.55 si ottiene Z
Q = iq
d 3 x(πϕ − ϕ ∗ π ∗ )
che definito come operatore normalmente ordinato, sostituendo l’espressione esplicita dei campi, è Z : Q := q
d 3 k(Na (k) − Nb (k))
evidentemente non definita positiva. Ora, applicando questo operatore allo stato di Fock ¯ di particella singola |1(p)i di tipo a e di particella singola |1(p)i di tipo b si ottiene, grazie alle relazioni di commutazione 2.100 e 2.103 Z
Q|1(p)i = q +
+
3
d kNa (k)a (p)|0i − Z
= qa (p)|0i + q
Z
d 3 kNb (k)a+ (p)|0i =
d 3 k a+ (p)Na (k) |0i =
= q|1(p)i + qa+ (p)Na |0i = q|1(p)i + qa+ (p)0|0i = q|1(p)i e analogamente ¯ ¯ Q|1(p)i = −q|1(p)i
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 81 Come possiamo notare, dunque, le particelle di tipo a sono autostati dell’operatore carica relativi ad un autovalore opposto rispetto a quello delle particelle di tipo b. Questo implica dunque che le particelle a e b costituiscono un sistema particella-antiparticella35 . • I commutatori covarianti sono sempre nulli per tutte le combinazioni tra ϕ, ϕ + , π e π + sono tutti nulli, quindi covarianti, tranne i casi [ϕ(x), ϕ + (y)] e [π(x), π + (y)]. Analizzando in particolare il primo caso, abbiamo (con le stesse considerazioni fatte nel caso reale) + + [ϕ(x), ϕ + (y)] = [ϕ+ (x), ϕ− (y)] + [ϕ− (x), ϕ+ (x)]
che con considerazioni del tutto analoghe a quelle fatte nel caso reale si dimostra essere covariante, da cui dunque vale anche la microcausalità.
2.4.5
Quantizzazione canonica della teoria di Dirac
Applichiamo ora le prescrizioni della quantizzazione canonica 2.92 e 2.93 sulla teoria di campo spinoriale. Le equazioni del moto per i campi (che ricordiamo essere ora degli operatori) sono ψ˙ = −i[ψ(x), H]t
π˙ = −i[π(x), H]t
e i commutatori tra i campi diventano [ψα (x), ψβ (y)]t = [πα(x), πβ (y)]t = 0 [ψα (x), πβ (y)]t = −iδ 3 (x − y)δαβ → [ψα (x), ψβ+ (y)]t = δ 3 (x − y)δαβ In questo caso l’equazione del moto soddisfatta dal sistema è l’equazione di Dirac, dunque le soluzioni sono della forma 1.78 e analogamente ψ + (x) =
1 (2π)3/2
Z
d3k 2 + −ikx + + ikx √ d (k)v (k)e + c (k)u (k)e ∑ r r r r k0 =ωk 2ωk r=1
Gli operatori di creazione e distruzione sono allora 1 cr (k) = (2π)3/2
Z
d3x + √ ur (k)ψ(x)eikx 2ωk
1 dr (k) = (2π)3/2
Z
d3x + √ ψ (k)vr (x)eikx 2ωk
Sostituendo le espressioni dei campi nelle regole di commutazione nello spazio ordinario si ottengono le regole di commutazione nello spazio dei momenti [cr (k), cs (p)]t = [dr (k), ds (p)]t = 0 [cr (k), ds (p)]t = [dr (k), ds+ (p)]t = 0 + 3 [cr (k), c+ s (p)]t = [dr (k), ds (p)]t = δ (k − p)δrs 35 Talvolta
le a sono particelle e le b antiparticelle, talvolta è il contrario: per esempio, nel caso dell’elettronepositrone in questo caso le a sono antiparticelle (positroni, carica positiva) e le b le particelle (elettroni, carica negativa)
82
CAPITOLO 2. TEORIE DI CAMPO LIBERE
Quanto visto sino ad ora è del tutto analogo al caso di una teoria di campo scalare complesso: esistono infatti due famiglie indipendenti di particelle che rispettano l’algebra degli oscillatori armonici. Possiamo dunque definire due operatori densità numero differenti che soddisfano entrambi le proprietà di commutazione 2.100: Nc
(r)
( (r) [Nc (k), cs (p)]t = −cs (p)δ 3 (k − p)δrs
(k) = c+ r (k)cr (k) →
(r)
+ 3 [Nc (k), c+ s (p)]t = cs (p)δ (k − p)δrs
( (r) [Nd (k), ds (p)]t = −ds (p)δ 3 (k − p)δrs
(r) Nd (k) = dr+ (k)dr (k) →
(r)
[Nd (k), ds+ (p)]t = ds+ (p)δ 3 (k − p)δrs
A questo punto però sorgono due problemi: 1. lavorando nello spazio dei momenti l’hamiltoniano risulta Z
H=
2 + d 3 kωk ∑ c+ r (k)cr (k) − dr (k)dr (k) r=1
il quale secondo l’ordinamento normale del prodotto e le regole di commutazione tra gli operatori di creazione e distruzione diventa 2 (r) (r) d 3 kωk ∑ Nc (k) − Nd (k)
Z
: H :=
r=1
Esso in generale non è definito positivo e questo è inconsistente con il fatto che un sistema libero possiede energia non negativa. La carica, invece, (carica di Nöther della simmetria globale interna di tipo U(1)) è Z
Q=q
2
+ d k ∑ c+ r (k)cr (k) + dr (k)dr (k) 3
r=1
che secondo l’ordinamento normale del prodotto e le regole di commutazione tra gli operatori di creazione e distruzione diventa Z
: Q := q
2
(r) (r) d k ∑ Nc (k) + Nd (k) 3
r=1
Essa invece risulta definita positiva, inconsistentemente con il fatto che la carica possa essere sia positiva che negativa; 2. la costruzione usuale dello spazio di Fock è inconsistente con la natura fermionica delle particelle descritte da una teoria di campo spinoriale. Nella relazione 2.111 avevamo definito lo stato di n particelle identiche applicando n volte l’operatore di creazione sullo stato di vuoto. Come abbiamo notato, però, questo va bene solo se il sistema descritto è costituito da particelle bosoniche. Nel caso di particelle fermioniche, infatti, il principio di esclusione di Pauli esclude la possibilità di avere particelle con gli stessi numeri quantici, ossia particelle identiche, e la teoria di Dirac descrive proprio particelle fermioniche (spin ±1/2).
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 83 Questi due problemi evidenziano dunque un’inconsistenza delle prescrizioni di quantizzazione canonica con la teoria di Dirac. Per risolverli è necessario rivisitare tali prescrizioni. In particolare, se la 2.92 deve restare invariate, ciò che deve cambiare è la struttura dell’algebra degli oscillatori armonici: la 2.92 deve essere sostituita dalla seguente prescrizione fermionica, in cui cioè le parentesi di Poisson classiche devono essere sostituite da anticommutatori quantistici: ˆ π} ˆ {ϕ, π} −→ −i{ϕ,
(2.121)
Di conseguenza, le condizioni di quantizzazione canonica 2.96 fornite in termini di commutatori devono essere ora fornite in termini di anticommutatori: ( {ψα (x), ψβ (y)}t = {πα (x), πβ (y)}t = 0 (2.122) {ψα (x), πβ (y)}t = iδ 3 (x − y)δαβ → {ψα (x), ψβ+ (y)}t = δ 3 (x − y)δαβ Nello spazio dei momenti vengono dunque imposte le seguenti regole di anticommutazione 36 ( {cr (p), cs (k)}t = {dr (p), ds (k)}t = · · · = 0 (2.123) + 3 {cr (p), c+ s (k)}t = {dr (p), ds (k)}t = δ (k − p)δrs Definendo allora i due operatori densità numero (r)
(r)
Nc (k) = c+ r (k)cr (k)
Nd (k) = dr+ (k)dr (k)
si dimostra che il commutatore con gli operatori di distruzione (e analogamente di creazione) si può scrivere come somma di anticommutatori (r)
+ + [Nc (k), cs (p)]t = [c+ r (k)cr (k), cs (p)]t = cr {cr (k), cs (p)}t − {cr (k), cs (p)}cr (k)
da cui si ottengono le consuete regole di commutazione ( ( (r) (r) [Nc (k), cs (p)]t = −cs (p)δ 3 (k − p)δrs [Nd (k), ds (p)]t = −ds (p)δ 3 (k − p)δrs (r)
(r)
+ 3 [Nc (k), c+ s (p)]t = cs (p)δ (k − p)δrs
[Nd (k), ds+ (p)]t = ds+ (p)δ 3 (k − p)δrs (r)
Queste regole di commutazione sono fondamentali perchè sono quelle che assicurano che Nc (r) e Nd siano definiti positivi e come abbiamo visto esse vengono riprodotte anche da un’algebra di anticommutazione. Questa permette inoltre di risolvere i due problemi precedentemente incontrati: 1. applicando ora il prodotto normalmente ordinato 2.107 usufruendo delle nuove regole di anticommutazione introdotte e tenendo a mente che gli operatori di creazione e distruzione, agenti sullo spazio di Fock, commutano con u e v, che invece stanno nello spazio di Fourier, otteniamo Z 2 (r) (r) : H := d 3 kωk ∑ Nc (k) + Nd (k) r=1
Z
: Q := q
2
(r) (r) d k ∑ Nc (k) − Nd (k) 3
r=1
dove ora l’hamiltoniano è definito positivo mentre la carica elettrica no, consistentemente con quanto voluto; 36
I puntini indicano che tutte le possibili combinazioni danno anticommutatori nulli, eccezion fatta per quelli della seconda riga. Nei conti si tenga a mente che u e v non appartengono allo spazio spinoriale degli ψ, quindi commutano con essi.
84
CAPITOLO 2. TEORIE DI CAMPO LIBERE 2. definito lo stato di vuoto |oi il quale viene annichilato da ciascun operatore densità numero (come nelle 2.108) allora possiamo costruire: • lo stato di una particella di tipo c applicando sullo stato di vuoto l’operatore di creazione c+ r , ossia |1r (p)i ∝ c+ r (p)|0i il quale è autostato dell’operatore carica di autovalore 1 Q|1r (p)i = |1r (p)i • lo stato di una particella di tipo d applicando sullo stato di vuoto l’operatore di creazione dr+ , ossia |1¯ r (p)i ∝ dr+ (p)|0i il quale è autostato dell’operatore carica di autovalore -1 Q|1¯ r (p)i = −|1¯ r (p)i • lo stato di due particelle di tipo c lo costruiamo allora applicando due volte sullo stato di vuoto l’operatore c+ r , cioè + |2r (p)i ∝ c+ r cr |0i =
+ + + + {c+ c+ r , cr } r cr + cr cr |0i = |0i = 0 2 2
dove l’annullamento dell’anticommutatore è dovuto alle regole 2.122. Questo significa che lo stato formato da due (o più) particelle identiche ha numero di occupazione nullo, quindi lo spazio di Fock è costituito in maniera naturale da soli stati di singole particelle diverse. Nonostante la quantizzazione canonica fermionica imponga delle regole di anticommutazione, le equazione restano della forma seguente (verificare): ψ˙ = −i[ψ, H]t
π˙ = −i[π, H]t
In virtù di questi risultati possiamo affermare dunque che le prescrizioni di quantizzazione canonica in termini di commutatori valgono per un sistema RELATIVISTICO che segue la statistica di Bose-Einstein, mentre le prescrizioni di quantizzazione canonica in termini di anticommutatori valgono per un sistema RELATIVISTICO che segue la statistica di Fermi-Dirac 37 . Ancora una volta abbiamo quantizzato la teoria a tempo fissato. Tuttavia, questo non inficia la covarianza della teoria stessa. Considerando ora gli anticommutatori quadridimensionali tra i campi gli unici non banali sono (le matrici) Sαβ (x − y) = {ψα (x), ψ¯ β (y)} = {ψα+ (x), ψ¯ β − (y)} + {ψα− (x), ψ¯ β + (y)} = = Sαβ + (x − y) + Sαβ − (x − y) 37 L’aggettivo
relativistico è stato particolarmente evidenziato, vista la sua importanza: come vedremo con l’esempio della teoria di campo che prevede l’equazione di Schrödinger come equazione del moto, una teoria di campo non relativistica può essere quantizzata sia definendo un’algebra in termini di commutatori sia in termini di anticommutatori.
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 85 Calcoliamo esplicitamente i due addendi: 1 S+ (x − y) = (2π)3
Z
1 S− (x − y) = (2π)3
Z
d3k 2ωk d3k 2ωk
2
! −ik(x−y)
∑ ur (k)u¯r (k)e
r=1
k0 =ωk
!
2
∑ vr (k)v¯r (k)eik(x−y)
r=1
k0 =ωk
Le sommatorie ∑2r=1 ur (k)u¯r (k) e ∑2r=1 vr (k)v¯r (k) sono legate ai proiettori sugli spinori a energia positiva u e ad energia negativa v (vedi relazione 1.79). Dunque, possiamo scrivere 2m S(x − y) = (2π)3
Z
d3k Λ+ (k)e−ik(x−y) − Λ− (k)eik(x−y) 0 2ωk k =ωk
che si può scrivere (verificare) come 1 S(x − y) = (i∂/ + m) (2π)3
Z
d 3 k −ik(x−y) √ e − eik(x−y) = (i∂/ + m)D(x − y) 2ωk
Essendo dunque D(x − y) covariante come già dimostrato allora lo è anche S(x − y) e, di conseguenza, continua a valere il principio di microcausalità per gli intervalli di tipo spazio.
2.4.6
Quantizzazione canonica covariante per il campo elettromagnetico
Partiamo dalla teoria di campo elettromagnetica + gauge fixing, avente cioè come lagrangiane 2.80 o, equivalentemente 1 L = − (∂µ Aν )(∂ µ Aν ) 2
, (ξ = 1)
Le condizioni di quantizzazione canonica che imponiamo sono dunque le seguenti38 : ( [Aµ (x), πν (y)]t = iηµν δ 3 (x − y) ←→ [Aµ (x), ∂0 Aν (y)]t = −iηµν δ 3 (x − y) [Aµ (x), Aν (y)]t = [πµ (x), πν (y)]t = 0
(2.124)
Scrivendole in termini di componenti spaziali e temporali si ottiene ( [A0 (x), ∂0 A0 (y)]t = −iδ 3 (x − y) [Ai (x), ∂0 A j (y)]t = iδ 3 (x − y)δi j La seconda relazione fornisce le stesse regole di commutazione che avevamo nel caso di un campo scalare, relative ad un sistema di oscillatori armonici, mentre la prima equazione evidenzia un comportamento scomodo delle componenti temporali, le quali non soddisfano la stessa algebra di quelle spaziali, a causa della presenza di un segno - aggiuntivo. Ancora una volta, come nel caso della mancata positiva definitezza della densità hamiltoniana, i problemi sorgono da termini di tipo temporale. Inserendo l’espressione 1 A (x) = (2π)3/2 µ
38 Si
ricordi che π µ =
∂L ∂ ∂0 A µ
Z
d3k 3 µ −ikx ∗ ikx √ ∑ ε (k) aλ (k)e + aλ (k)e k0=|~k| 2ωk λ =0 (λ )
= −∂0 Aµ .
86
CAPITOLO 2. TEORIE DI CAMPO LIBERE
e quella di π µ (x) nelle relazioni precedenti si ottengono le regole di commutazione nello spazio dei momenti ( + 0 [aλ (k), aλ 0 (k0 ))]t = [a+ λ (k), aλ 0 (k ))]t = 0 (2.125) 0 )] = −η 0 δ 3 (x − y) [aλ (k), a+ (k t 0 λ λ λ Scrivendo la seconda relazione in termini delle componenti spaziali e temporali risulta ( 0 3 [a0 (k), a+ 0 (k ))]t = −δ (x − y) [ai (k), a+j (k0 ))]t = δ 3 (x − y)δi j evidenziando lo stesso problema precedentemente notato. Definiamo ora l’operatore densità numero, distinguendo però i due casi seguenti: • se λ = 1, 2, 3 allora possiamo definire tranquillamente Nλ (k) = a+ λ (k)aλ (k) che soddisfa le consuete regole di commutazione con gli operatori di creazione e distruzione; • se λ = 0 affinchè vengano soddisfatte le regole di commutazione suddette bisogna definire l’operatore densità numero con un segno - davanti: N0 (k) = −a+ 0 (k)a0 (k)
(2.126)
Solo in questo modo, infatti, si tratta di un operatore densità numero, soddisfacente cioè le condizioni ( + 3 [N0 (k), a+ 0 (p)]t = a0 (k)δ (k − p) [N0 (k), a0 (p)]t = −a0 (k)δ 3 (k − p) Gli operatori hamiltoniano e trimomento risultano (verificare) Z
: H :=
d 3 kωk
3
∑
Nλ (k)
Z
: Pi :=
λ =0
d 3 kki
3
∑ Nλ (k) λ =0
A questo punto sembra sorgere una contraddizione: di norma l’operatore densità numero è un operatore definito positivo, quindi l’hamiltoniano, somma di operatori numero, dovrebbe anch’esso essere definito positivo, mentre come abbiamo visto non lo è (vedi 2.87). In realtà, come vedremo immediatamente, l’operatore densità numero 2.126 non è definito positivo. Per mostrarlo costruiamo dapprima lo spazio di Fock della teoria. Definiamo come al solito lo stato di vuoto |0i tale da essere annichilato dall’operatore di distruzione o, equivalentemente, lo stato con numero di occupazione nullo: aλ (k)|0i = 0 ←→ Nλ (k)|0i = 0
λ = 0, 1, 2, 3
A questo punto: • nel caso in cui λ = 1, 2, 3 si ha la stessa situazione che si presenta nel caso di una teoria di campo scalare, ossia lo stato di n particelle di tipo λ ≡ i è ni |ni (k)i ' (a+ i ) |0i
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 87 • nel caso in cui λ = 0, invece, lo stato relativo ad una particella di tipo 0 è |10 (k)i ' a+ 0 (k)|0i Esso presenta un aspetto critico. Calcolando infatti la norma al quadrato di tale stato risulta + + 3 h10 (k)|10 (k)i = h0|a0 a+ 0 |0i = −δ (0) = −1 < 0 0 |0i = h0|[a0 , a0 ]|0i + h0|a0 a | {z } 0
la quale è evidentemente negativa: in questo modo essa non si concilia con il ruolo fisico di probabilità di trovare tale stato. In questo caso si verifica un secondo aspetto critico, legato al valor medio dell’operatore densità numero. Esso infatti risulta negativo (verificare): h10 (k)|N0 (p)|10 (k)i = −δ 3 (k − p) e, di conseguenza: h10 (k)|H(p)|10 (k)i = −ωk Questo significa che l’operatore densità numero non è definito positivo, e così l’hamiltoniano. Tuttavia, la cosa è piuttosto critica perchè l’ultima espressione implicherebbe un numero di occupazione medio negativo, cosa che non ha significato fisico. Il motivo per cui sorgono queste inconsistenze è il seguente: ricordiamo che noi non stiamo quantizzando la teoria elettromagnetica, ma una teoria di campo la cui hamiltoniana è la somma di quella elettromagnetica più quella di gauge fixing, le cui equazioni del moto sono quelle di Klein-Gordon e non quelle di Maxwell. Quello che dobbiamo fare è imporre delle opportune condizioni in modo tale da ricondurci alla teoria elettromagnetica, mantenendo allo stesso tempo la covarianza. Quello che vogliamo fare, insomma, è passare da una teoria che soddisfa l’equazione del moto Aν = 0 a una teoria che soddisfa la stessa equazione del moto ma con il vincolo della gauge di Lorenz ∂µ Aµ = 0. Per fare questo, proviamo con le seguenti opzioni: 1. imponiamo la relazione di gauge fixing voluta in termini operatoriali, ossia imponiamo che valga, appunto, ∂µ Aµ = 0. Come abbiamo visto, però, così facendo imponiamo una condizione troppo forte, la quale provoca la mancata covarianza della teoria nel momento in cui si decide di quantizzarla; 2. una seconda possibilità è considerare tra tutti gli stati dello spazio di Fock solamente alcuni stati, che chiamiamo stati fisici, che soddisfano la proprietà ∂µ Aµ |ϕPHY S i = 0 ossia gli stati fisici sono quelli tali per cui vale la condizione di gauge fixing di Lorenz che, in generale, non vale per tutti gli stati. Questa idea è suggestiva ma presenta un problema con lo stato di vuoto: infatti µ
µ
∂µ Aµ |0i = ∂µ A+ |0i + ∂µ A− |0i 6= 0 µ
µ
in quanto se ∂µ A+ |0i = 0 non si può dire altrettanto per ∂µ A− |0i39 ; 39 A +
infatti è proporzionale all’operatore di distruzione che, contratto col vuoto, dà 0, ma A− è proporzionale all’operatore di creazione che contratto col vuoto non dà 0.
88
CAPITOLO 2. TEORIE DI CAMPO LIBERE 3. la soluzione al nostro problema è la seguente: definiamo come stati fisici gli stati |ϕPHY S i dello spazio di Fock che soddisfano la condizione hϕPHY S |∂µ Aµ |ϕPHY S i = 0
(2.127)
che può essere scritta in maniera analoga in questi termini (nello spazio delle coordinate): µ
µ
∂µ A− |ϕPHY S i = 0
hϕPHY S |∂µ A+ = 0
(2.128)
Le due scritture precedenti, del tutto analoghe, sono la cosiddetta condizione di GuptaBleuer, la quale ci permette di distinguere gli stati fisici dagli stati dello spazio di Fock che invece non lo sono. Definendo l’operatore di Gupta-Bleuer 3
L(k) ≡ k µ
(λ )
∑ εµ
aλ (k)
(2.129)
λ =0
dato che µ ∂ µ A+
i =− (2π)3/2
Z
d3k 3 µ √ ∑ kµ ε(λ )(k)aλ (k)e−ikx 2ωk λ =0
la condizione di Gupta-Bleuer si può riscrivere in questo terzo modo (nello spazio dei momenti): hϕPHY S |L+ (k) = 0 L(k)|ϕPHY S i = 0 (2.130) La relazione 2.130 ci dice che gli stati fisici sono quelli annichilati dall’operatore di GuptaBleuer. Questo significa che tale operatore e il suo aggiunto possiamo interpretarli come degli operatori di distruzione e costruzione rispettivamente: chiamiamo allora L(k) e L+ (k) operatori di pseudofotoni ( o non fisici). Interpretiamo insomma L(k) e L+ (k) in termini di operatori di distruzione e creazione degli stati non fisici. Essi tuttavia non soddisfano le consuete regole di commutazione, ma commutano (verificare): [L(k), L+ (p)] = 0 A questo punto, scegliendo come base per i vettori di polarizzazione quella costituita dai vettori 2.84, 2.85 e 2.86, allora kµ µ − nµ a3 (k) L(k) = k nµ a0 (k) + kn e sfruttando la condizione k µ kµ = m2 = 0 (la teoria considerata è massless) allora L(k) = k µ nµ (a0 (k) − a3 (k)) ≡ c(a0 (k) − a3 (k))
(2.131)
Come possiamo notare l’operatore di Gupta-Bleuer non presenta termini relativi ai vettori di polarizzazione trasversali, i quali sono gli unici vettori di polarizzazione fisici (il fotone ha solo polarizzazione trasversa). Questo risultato è coerente con il fatto che tale operatore è relativo agli stati non fisici. Vediamo ora alcune proprietà. 1. Vale il seguente risultato: hϕPHY S |N0 + N3 |ϕPHY S i = 0 Infatti, la condizione 2.130 e la relazione 2.131 ci dicono che a0 |ϕPHY S i = a3 |ϕPHY S i, quindi + + hϕPHY S |N0 + N3 |ϕPHY S i = hϕPHY S |(a+ PHY S |L a0 |ϕPHY S i = 0 0 − a3 )a0 |ϕPHY S i = hϕ | {z } 0
2.4. QUANTIZZAZIONE CANONICA DI UNA TEORIA DI CAMPO RELATIVISTICA 89 2. la proprietà precedente permette di dimostrare che le polarizzazioni scalare (λ = 0) e longitudinale (λ = 3), cioè quelle non fisiche, non contribuiscono all’energia del sistema. Infatti hϕPHY S |H|ϕPHY S i =
Z
3
3
d kωk hϕPHY S |
∑ Nλ |ϕPHY S i =
Z
d 3 kωk hϕPHY S |N1 +N2 |ϕPHY S i
λ =0
dove al secondo passaggio si utilizza la proprietà di cui al punto 1 3. Ogni stato del tipo L+ |ϕPHY S i è non fisico, in quanto soddisfa le seguenti proprietà: • hanno norma nulla; • sono ortogonali agli stati fisici; • hanno energia nulla. ˆ Dimostriamo queste tre proprietà prendendo il caso particolare |ϕPHY S i = |1(k)i ≡ L+ (k)|0i. In questo caso: ˆ ˆ h1(k)| 1(k)i = h0|LL+ |0i = h0|L+ L|0i = 0 ˆ h1(k)|ϕ PHY S )i = h0| L|ϕPHY S )i = 0 | {z } 0
ˆ ˆ h1(k)|H| 1(k)i = ...verificare... = 0 4. Consideriamo lo stato 0 |ϕPHY S i ≡ |ϕPHY S i + |ψi
con |ψi stato non fisico. Lo stato appena definito è fisico: si dimostra facilmente che esso ha la stessa norma e la stessa energia dello stato |ϕPHY S i. Da un punto di vista 0 fisico, questo significa che gli stati |ϕPHY S i e |ϕPHY S i sono indistinguibili: l’aggiunta di uno stato non fisico ad uno stato fisico di fatto porta il sistema ad uno stato fisicamente equivalente. Possiamo quindi definire la classe di equivalenza {|ϕPHY S i} = {|ϕPHY S i + |ψi, ∀|ψi non fisico}
(2.132)
i cui rappresentativi sono, come detto, stati fisici equivalenti. La classe di equivalenza 2.132 degli stati fisici è associata all’invarianza di gauge della nostra teoria: questo dunque implica che la teoria costruita in questo modo è definita a meno di una trasformazione di gauge, descrivendo dunque a tutti gli effetti la teoria dell’elettromagnetismo. Dimostriamo quanto appena detto. Consideriamo il campo classico µ
Acl (x) ≡ h0|Aµ (x)|ϕPHY S i ed esprimiamo |ψi ∝
Z
d 3 k f (k)L+ (k)|0i
0 con f (k) una generica funzione. Considerando il rappresentativo |ϕPHY S i allora 0µ
0 Acl (x) ≡ h0|Aµ (x)|ϕPHY Si = µ
= h0|Aµ (x)|ϕPHY S i + h0|Aµ (x)|ψi = Acl (x) + h0|Aµ (x)|ψi
90
CAPITOLO 2. TEORIE DI CAMPO LIBERE Ora: µ
h0|A (x)|ψi ∝
Z
d 3 k f (k)h0|Aµ L+ (k)|0i
Z
d 3 k f (k)h0|
∝
Z
d3q
3
∑ ε(λ )(q)aλ (q)e−iqx L+(k)|0i µ
λ =0 + avendo tenuto conto che h0|a+ λ = 0. Inserendo ora l’espressione esplicita si L otteniamo
Z
µ
h0|A (x)|ψi ∝
Z
3
d k f (k)h0|
3
d3q
∑
µ
λ =0
Z
=
d 3 k f (k)
Z
3
ε(λ ) (q)aλ (q)e−iqx
0
kν ενλ (k)a+ ∑ λ 0 (k)|0i 0
λ =0 λ0
µ + d 3 qe−iqx ∑ ελ (q)εν (k)kν h0| [aλ (q), a+ q (k)] + aλ 0 aλ |0i λλ0
=−
Z
d 3 k f (k)e−ikx kν
0
µ
∑0 ελ (q)ενλ (k) ηλ λ 0
λλ
|
{z µ
}
ην
Reinserendo una costante i si ottiene µ
h0|A (x)|ψi = −i
Z
−ikx µ
3
d k f (k)e
k =∂
µ
Z
d 3 k f (k)e−ikx ≡ ∂ µ α
Questo significa dunque che aver cambiato rappresentativo della classe di equivalenza 2.132 significa aver effettuato la trasformazione di gauge 0µ
µ
Acl = Acl + ∂ µ α I questo caso il commutatore covariante è della forma Dµν = [Aµ (x), Aν (y)] che, separando la parte + dalla parte - si ottiene µν
µ
D+ (x − y) = [A+ (x), Aν− (y)]
µν
µ
D− (x − y) = [A− (x), Aν+ (y)] = 0
Gli altri commutatori covarianti sono invece nulli: µ
µ
[A+ (x), Aν+ (y)] = [A− (x), Aν− (y)] In particolare, detti D± (x − y) i commutatori covarianti per un campo scalare (reale o complesso non fa differenza, tanto coincidono), valgono le sequenti proprietà: ( µν D+ (x − y) = −η µν D+ (x − y) µν D− (x − y) = −η µν D− (x − y)
2.5
Teoria di campo di Schrödinger
Costruiamo una teoria di campo scalare non relativistica che abbia come equazione del moto l’equazione di Schrödinger 1. La lagrangiana della teoria dovrà essere reale e invariante sotto
2.5. TEORIA DI CAMPO DI SCHRÖDINGER
91
rotazioni tridimensionali e sotto traslazioni spaziali e temporali (queste ultime assicurano la conservatività della teoria). Ipotizziamo una densità lagrangiana del tipo 1 ~ ∗ ~ i ∗ (ϕ (∂t ϕ) − (∂t ϕ ∗ )ϕ) − (∇ϕ ) · (∇ϕ) −V (|~x|)ϕ ∗ ϕ 2 2m (2.133) Le equazioni del moto soddisfatte dai campi fisici si trovano minimizzando l’azione con la condizione che le variazioni dei campi al bordo del dominio di integrazione vadano a zero (δ ϕ(∂ ) = 0): Z Z ∂L ∂L ∂L ∂L 3 3 δS = d x + δ ∂l ϕ = d x − ∂l δϕ = 0 ∂ϕ ∂ ∂l ϕ ∂ϕ ∂ ∂l ϕ L (ϕ, ∂t ϕ, ∂i ϕ, ϕ ∗ , ∂t ϕ ∗ , ∂i ϕ ∗ ) =
dove l’indice l assume i "valori" t (temporale) e i (spaziale)40 . Quindi le equazioni del moto per una teoria di campo non relativistica sono ∂L ∂L − ∂l =0 ∂ϕ ∂ ∂l ϕ
(2.134)
Nel nostro caso i campi indipendenti sono due, cioè ϕ e ϕ ∗ , quindi derivando rispetto all’uno si trovano le equazioni del moto dell’altro. In particolare, derivando rispetto a ϕ la lagrangiana 2.133 si ottiene i 1 i (∂t ϕ) −V (|~x|)ϕ + (∂t ϕ) + ∂i ∂i ϕ = 0 2 2 2m da cui immediatamente si ottiene la 1: i(∂t ϕ) = −
1 2 ∇ ϕ +V (|~x|)ϕ 2m
Si verifica che la seguente densità lagrangiana L 0 = iϕ ∗ (∂t ϕ) −
1 ~ ∗ ~ (∇ϕ ) · (∇ϕ) −V (|~x|)ϕ ∗ ϕ 2m
(2.135)
è equivalente alla precedente. Il teorema di Nöther nel caso di una simmetria globale interna, ossia tale per cui δ0 ϕ = εl Xl porta ad una corrente conservata ∂l J l = ∂t Jt + ∂i J i = 0
Jl =
∂L δ0 ϕ ∂ ∂l ϕ
(2.136)
Infatti, azzerando la variazione dell’azione si ottiene Z ∂L ∂L ∂L 3 0 = δ0 S = d x − ∂l δ0 ϕ + ∂l δ0 ϕ ∂ϕ ∂ ∂l ϕ ∂ ∂l ϕ 40
Pur non essendo in contesto relativistico manteniamo la convenzione di Einstein sugli indici contratti. Ovviamente la posizione degli indici "in alto" e "in basso" ora è del tutto arbitraria, essendo una teoria non relativistica.
92
CAPITOLO 2. TEORIE DI CAMPO LIBERE
che per i campi fisici, cioè quelli che soddisfano l’equazione del moto 2.134, fornisce la corrente 2.136. L’equazione di continuità integrata nello spazio porta all’annullamento dell’integrale della tridivergenza (i campi si annullano infatti ai bordi), portando alla carica conservata Z
Q=
Jt d 3 x
(2.137)
ESERCIZIO: verificare che L e L 0 ammettono una simmetria globale interna di tipo U(1) cui è associata la carica conservata Z
QU(1) =
d 3 xϕ ∗ ϕ
ESERCIZIO: verificare che le cariche conservate relative all’invarianza dell’azione sotto traslazioni spaziali (x0 = x + εx ) e temporali (t 0 = t + εt ) sono Z 1 ~ ∗ ~ ∗ 3 (∇ϕ ) · (∇ϕ) +V (x)ϕ ϕ ≡ H Qt = d x 2m Qx =
i 2
Z
d 3 x (ϕ ∗ (∂i ϕ) − (∂i ϕ ∗ )ϕ) ≡ Pi
In generale, dunque, questa teoria ammette: • 7 cariche conservate derivanti da simmetrie per rototraslazioni, in particolare: – 3 dall’invarianza per traslazioni spaziali (trimomento); – 1 dall’invarianza per traslazioni temporali (energia) se la teoria è conservativa (il potenziale V non dipende dal tempo); – 3 dall’invarianza per rotazioni, cioè trasformazioni del gruppo SO(3) (momenti angolari orbitali); • 1 carica conservata derivante dalla simmetria globale interna di tipo U(1) (carica elettrica). Per quantizzare la nostra teoria dobbiamo dapprima passare alla visuale hamiltoniana. Definiti i momenti coniugati utilizzando la lagrangiana 2.133 π=
∂L i = ϕ∗ ∂ ∂t ϕ 2
π∗ =
∂L i = − ϕ ∂ ∂t ϕ ∗ 2
si ottiene che la densità hamiltoniana è H = π(∂t ϕ) + π ∗ (∂t ϕ ∗ ) − L =
1 ~ ∗ ~ (∇ϕ ) · (∇ϕ) +V ϕ ∗ ϕ 2m
Utilizzando la lagrangiana equivalente 2.135 si ottiene π=
∂L = −iϕ ∗ ∂ ∂t ϕ
π∗ =
∂L =0 ∂ ∂t ϕ ∗
(2.138)
2.5. TEORIA DI CAMPO DI SCHRÖDINGER
93
il che ci dice che ϕ ∗ non è una variabile dinamica, bensì una costante. La densità hamiltoniana che si ottiene è H 0 = π(∂t ϕ) − L 0 (2.139) la quale è equivalente alla 2.138 in quanto differente da essa solo per una tridivergenza, assolutamente ininfluente quando si va a stimare l’hamiltoniana H. Si verifica che le parentesi di Poisson della teoria sono ( {ϕ(~x,t), ϕ(~y,t)} = {π(~x,t), π(~y,t)} = 0 {ϕ(~x,t), π(~y,t)} = δ 3 (~x −~y) e le equazioni di Hamilton sono della forma ( ∂t ϕ(~x,t) = {ϕ(~x,t), H} ∂t π(~x,t) = {π(~x,t), H} Effettuiamo ora la quantizzazione canonica della teoria di campo. 1. Vediamo dapprima cosa accade quantizzando la teoria con la prescrizione bosonica 2.93, ossia con i commutatori. Le condizioni di quantizzazione canonica risultano dunque ( [ϕ(~x,t), ϕ(~y,t)]t = [π(~x,t), π(~y,t)]t = 0 [ϕ(~x,t), π(~y,t)]t = δ 3 (~x −~y) Come al solito occupiamoci della sola teoria libera (V = 0). La soluzione generale dell’equazione di Schrödinger libera è Z 1 3 −iωk t i~k·~x d k a(k)e e (2.140) ϕ(~x,t) = k2 ωk = 2m (2π)3/2 Notiamo che in questo caso abbiamo solo una componente a energia positiva ωk : nel caso ultrarelativistico vi era anche un’altra componente ad energia negativa, a causa del fatto che l’equazione è quadratica nelle derivate temporali. Inserendo la 2.140 nelle condizioni di quantizzazione si ottengono le regole di commutazione nello spazio dei momenti: ( [a(k), a(p)]t = [a+ (k), a+ (p)]t = 0 [a(k), a(p)]t = δ 3 (~k −~p) dove a(k) si ottiene antitrasformando la 2.140: 1 a(k) = (2π)3/2
Z
~
d 3 xeiωk t e−ik·~x ϕ(~x,t)
Ancora una volta abbiamo a che fare con un sistema infinito di oscillatori armonici. Possiamo dunque definire ancira una volta un operatore densità numero N (k) = a+ (k)a(k) che soddisfi le solite proprietà 2.99 e 2.100. L’hamiltoniana e la carica elettrica, che si conservano per quanto già detto, si scrivono allora (verificare) Z
H=
3
d xH =
Z
d xωk N (k) 3
Z
Q=q
d 3 qN (k)
Entrambi gli integrali sono definiti positivi. Questo ci dice che:
94
CAPITOLO 2. TEORIE DI CAMPO LIBERE • la teoria libera è consistente con la quantizzazione canonica perchè l’energia è non negativa; • stiamo considerando solo una particella senza la sua antiparticella. Anche ciò è consistente, in quanto le antiparticelle hanno origine ultrarelativistica. E’ importante sottolineare che per calcolare i due integrali di cui sopra NON serve applicare le regole di commutazione nello spazio dei momenti, dunque non serve definire un prodotto normalmente ordinato. Questa peculiarità sarà responsabile del fatto che H e Q avranno la stessa forma anche dopo, quando effettueremo la quantizzazione canonica secondo la prescrizione fermionica, cioè con gli anticommutatori. Le condizioni di quantizzazione imposte in precedenza ci permettono di definire lo spazio di Fock a partire dallo stato di vuoto. In particolare, con le suddette regole di commutazione si può costruire uno stato |ni ∝ (a+ )n |0i di n particelle identiche: stiamo dunque descrivendo una teoria bosonica41 . 2. Adesso quantizziamo secondo la prescrizione fermionica 2.121, in cui cioè le parentesi di Poisson dei soli campi vengono sostituite con gli anticommutatori tra gli operatori associati, moltiplicati per −i. Le condizioni di quantizzazione canonica sono allora della forma 2.122, cioè ( {ϕ(~x,t), ϕ(~y,t)}t = {π(~x,t), π(~y,t)}t = 0 {ϕ(~x,t), π(~y,t)}t = δ 3 (~x −~y) dove ora, ovviamente ϕ e π sono operatori quantistici. In questo caso, nello spazio dei momenti emergono le regole di anticommutazione ( {a(k), a(p)}t = {a+ (k), a+ (p)}t = 0 {a(k), a+ (p)}t = δ 3 (~k −~p) In maniera del tutto analoga al caso precedente possiamo dunque definire un operatore densità numero con le consuete proprietà e gli operatori hamiltoniano e di carica elettrica sono uguali al caso precedente, visto che per il loro calcolo non è ne cessario usare alcuna proprietà di anticommutazione: Z
H=
3
d xH =
Z
d xωk N (k) 3
Z
Q=q
d 3 qN (k)
Ciò che varia è, però, lo spazio di Fock. Infatti, le regole di anticommutazione permettono di costruire solamente lo stato |1i ∝ a+ |0i di una particella: gli stati di più particelle risultano tutti nulli. Questo significa che la quantizzazione canonica tramite gli anticommutatori fa sì che la nostra teoria descriva sistemi fermionici. In definitiva, una teoria di campo non relativistica può essere quantizzata canonicamente sia tramite la prescrizione bosonica sia tramite la prescrizione fermionica. Questo non è invece possibile, come visto, nel caso di una teoria di campo relativistica. Non a caso, l’equazione di Schrödinger coincide con il limite non relativistico sia dell’equazione di Klei-Gordon (bosonica, s = 0) sia dell’equazione di Dirac (fermionica, s = 1/2). 41
Lo spin è considerato.
Capitolo 3 Teorie di campo con interazione 3.1
Teorie di campo classiche con interazione
Sino ad ora abbiamo studiato solo teorie di campo libere, nelle quali cioè non vi erano termini di interazione. Prendiamo in rassegna i vari casi studiati e vediamo quali sono i possibili termini di interazione che possiamo inserire.
3.1.1
Teoria di campo scalare
Consideriamo dapprima il caso di un campo reale ϕ. Una possibile densità lagrangiana del nostro sistema fisico è la somma della lagrangiana libera 2.44 (in cui si pone V = 01 ) con una lagrangiana di interazione del tipo LINT = kϕ 3 + λ ϕ 4 + µϕ 5 + . . . Fissata una lagrangiana, per sviluppare la teoria di campo bisogna trovare le equazioni del moto. Per farlo, bisogna minimizzare l’azione, applicando cioè il principio di minima azione. Per fare questo, però, è necessario che l’interazione considerata possegga un punto di minimo. Per capire che tipo di termine di interazione è opportuno inserire nella teoria di campo valutiamo gli oggetti presenti nella nostra teoria da un punto di vista dimensionale2 . Per definizione l’azione è una quantità con le dimensioni di h¯ , la quale però è adimensionale. L’adimensionalità dell’azione implica dunque che sia di dimensione 4 in massa: [L ] = M 4 Infatti
Z
S=
(3.1)
d 4 xL = M 0
e poichè nel sistema di unità di misura naturali la lunghezza è il reciproco di una massa, quindi [d 4 x] = M − 4,si conclude che [L ] = M 4 . Questo ci permette di capire quale sia la dimensione del campo ϕ: considerando che la derivata ∂ ha le dimensioni di un momento che, per l’adimensionalità della velocità, ha le dimensioni di una massa: [∂ ] = M 1
Il termine di interazione si mette direttamente in LINT . ricordi che stiamo ragionando in termini di unità naturali (¯h = c = 1).
2 Si
95
(3.2)
96
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
Visto che un’equazione è consistente solo se ambo i suoi membri hanno la stessa dimensione, allora vale [(∂ ϕ)2 ] = M 4 , il che implica che il campo scalare ha dimensione 1 in massa: [ϕ] = M
(3.3)
In base a ciò, possiamo determinare immediatamente le dimensioni delle costanti di interazione nell’espressione generica di LINT : [k] = M,
[λ ] = M 0 (adimensionale),
[µ] = M −1 ,
...
Enunciamo ora la seguente 3 Definizione 3.1 (Teoria Rinormalizzabile). Una teoria di campo si dice rinormalizzabile se i termini di accoppiamenti hanno dimensione M α , con α ≥ 0. Una teoria di campo non rinormalizzabile (detta anche effettiva) è valida solo entro una certa scala di energia Λ. Dunque, è bene che una teoria di campo sia rinormalizzabile, in modo tale da valere per un qualsiasi range di energia. In base a questa definizione, la teoria di campo scalare reale è rinormalizzabile solo se si includono i primi due termini di interazione suggeriti, ossia se si considera la lagrangiana 1 1 (3.4) L = (∂µ ϕ)(∂ µ ϕ) − m2 ϕ 2 − kϕ 3 − λ ϕ 4 2 2 Termini di interazione successivi renderebbero non rinormalizzabile la teoria considerata. Nel caso complesso, la lagrangiana complessiva saràa la somma della lagrangiana 2.48 (con V = 0) e una larangiana di interazione del tipo LINT = λ (ϕ ∗ ϕ)2 + µ(ϕ ∗ ϕ)3 + . . . Affinchè la teoria sia rinormalizzabile è necessario fermarsi al primo termine di interazione (infatti [λ ] = M), dunque L = (∂µ ϕ)∗ (∂ µ ϕ) − m2 ϕ ∗ ϕ − λ (ϕ ∗ ϕ)2
3.1.2
(3.5)
Teoria di campo spinoriale
Consideriamo ora le possibili autointerazioni tra fermioni, cioè nel caso di una teoria di campo spinoriale. Il primo tentativo di spiegare le interazioi deboli, in particolare il fenomeno del decadimento β si deve a Enrico Fermi, il quale suggerì come lagrangiana della teoria l’oggetto ¯ ∂/ − m)ψ + G(ψΓψ)( ¯ ¯ L = ψ(i ψΓψ)
(3.6)
dove Γ è una qualsiasi combinazione delle matrici di Dirac 1.50 consistente con il fatto che la lagrangiana debba essere una quantità reale. Come detto, [L ] = M 4 , dunque deve valere ¯ [ψΓψ] = M4 Tenendo conto della relazione 3.2, si ottiene che il campo spinoriale ha dimensione 3/2 in massa: ¯ = M 3/2 [ψ] = [ψ] ¯ ¯ Quest’ultimo risultato implica che, dovendo valere [G(ψΓψ)( ψΓψ)] = M4, [G] = M −2 La teoria di Fermi non è dunque rinormalizzabile. 3 Tutte
le teorie di campo fondamentali sono rinormalizzabili (es/ Q.E.D.).
(3.7)
3.1. TEORIE DI CAMPO CLASSICHE CON INTERAZIONE
3.1.3
97
Teoria di campo di interazione tra campo scalare reale e campo spinoriale
Consideriamo ora una teoria che studi l’interazione tra un campo scalare reale ed un campo spinoriale, ossia l’interazione tra un bosone di spin 0 e un fermione di spin 1/2. La lagrangiana è L = LFREE + LINT dove: • la lagrangiana libera è la somma delle lagrangiane libere del caso scalare reale e spinoriale, cioè 1 1 ¯ ∂/ − m)ψ LFREE = (∂µ ϕ)(∂ µ ϕ) − m2 ϕ 2 + ψ(i 2 2 • la lagrangiana di interazione è del tipo ¯ + iy p ϕ ψγ ¯ 5 ψ + ωϕ 2 ψψ ¯ +... LINT = ys ϕ ψψ ¯ 5 ψ costituisce un accoppiamento di tipo pseudoscalaIn particolare, il termine iy p ϕ ψγ re4 .Affinchè la teoria considerata sia rinormalizzabile, essendo ¯ + iy p ϕ ψγ ¯ 5 ψ + ωϕ 2 ψψ ¯ + . . . ] = M4 [ys ϕ ψψ da cui [ys ] = [y p ] = M 0 (adimensionali)
[ω] = M −1
...
allora la lagrangiana deve essere 1 1 ¯ ∂/ − m)ψ + ys ϕ ψψ ¯ + iy p ϕ ψγ ¯ 5ψ L = (∂µ ϕ)(∂ µ ϕ) − m2 ϕ 2 + ψ(i 2 2
3.1.4
(3.8)
Teoria di campo di interazione tra campo vettoriale e campo spinoriale
Consideriamo ora una teoria che studi l’interazione tra un campo vettoriale ed un campo spinoriale, ossia l’interazione tra un bosone di spin 1 e un fermione di spin 1/2. La lagrangiana è L = LFREE + LINT dove: • la lagrangiana libera è la somma delle lagrangiane libere del caso vettoriale e spinoriale, cioè 1 ¯ ∂/ − m)ψ LFREE = − V µν Vµν + ψ(i 4 • la lagrangiana di interazione è un oggetto del tipo ¯ µ ψVµ + gA ψγ ¯ µ γ5 ψVµ LINT = gv ψγ µ ¯ ¯ 5 ψV µ Vµ + cv ψψV Vµ + icA ψγ ¯ µν ψVµν + idA ψσ ¯ µν γ5 ψVµν + . . . + dv ψσ 4 Infatti
¯ 5 ψ trasforma come uno pseudoscalare. ψγ
98
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE Ora, poichè [(∂Vµ )2 ] = M 4 , cioè [∂Vµ ] = M 2 , allora [Vµ ] = M
(3.9)
¯ = M 3 allora si ottiene che Considerando poi che [ψψ] [cv ] = [cA ] = [dv ] = [dA ] = M −1
[gv ] = [gA ] = M 0 (adimensionali)
...
Affinchè la teoria sia rinormalizzabile, la lagrangiana di interazione deve essere ¯ µ ψVµ + gA ψγ ¯ µ γ5 ψVµ LINT = gv ψγ
(3.10)
¯ µ ψVµ ) e di un termine di tipo pseudovetsomma di un termine di tipo vettoriale (gv ψγ ¯ µ γ5 ψVµ ). Questa lagrangiana di interazione può essere scritta in altri due toriale (gA ψγ modi equivalenti: 1. ¯ L ψVµ + gR ψγ ¯ R ψVµ LINT = gL ψγ µ
µ
(3.11)
avendo definito µ γL
≡γ
µ
1 − γ5 2
µ
= γ PL
µ γR
≡γ
µ
1 + γ5 2
= γ µ PR
dove PL e PR sono i proiettori di chiralità (vedi 1.82). In questo caso gL ≡ gv − gA
gR ≡ gv + gA
2. LINT = gL ψ¯ L γ µ ψLVµ + gR ψ¯ R γ µ ψRVµ
(3.12)
avendo definito ¯ R ψ¯ L ≡ ψP
ψL ≡ PL ψ
¯ L ψ¯ R ≡ ψP
ψR ≡ PR ψ
Anche in questo caso gL ≡ gv − gA
gR ≡ gv + gA
Scrivendo il termine di interazione in questo modo è possibile valutare più comodamente l’azione della parità. In particolare, si osserva che una teoria invariante sotto parità deve avere gL = gR =⇒ gA = 0 In caso contrario (gL 6= gR ) la parità non è una simmetria del sistema.
3.1.5
Quantum ElectroDynamics (Q.E.D.)
La Q.E.D. è una teoria che tratta l’interazione elettromagnetica, in particolare l’interazione tra un fermione e un fotone (mediatore dell’interazione)5 . Per sviluppare tale teoria facciamo le seguenti assunzioni: i. il fotone ha massa nulla mγ = 0 (ovvio); 5 Si
tratta dunque di un caso particolare di quanto trattato nel paragrafo precedente.
3.1. TEORIE DI CAMPO CLASSICHE CON INTERAZIONE
99
ii. il fotone è una particella vettoriale, non pseudovettoriale, quindi l’accoppiamento riguarda solo la parte vettoriale, cioè, considerando la 3.10, si ha che gA = 0. Questo implica che l’accoppiamento sia invariante sotto parità (è un input sperimentale); iii. la teoria deve relativistica, quindi Lorenz invariante, e rinormalizzabile. La lagrangiana della Q.E.D è dunque 6 1 ¯ ∂/ − m)ψ + qψγ ¯ µ ψAµ LEM = − F µν Fµν + ψ(i 4
(3.15)
La Q.E.D. è una teoria invariante sotto trasformazioni di tipo U(1)-gauge 7 . Per verificarlo dobbiamo dapprima definire tale trasformazione: abbiamo già definito una trasformazione di gauge per un campo quadrivettoriale (vedi 2.76), ma non per un campo spinoriale. Una trasformazione di tipo U(1)-gauge per i campo vettoriale e un campo spinoriale si definisce ( 0 A µ (x) = Aµ (x) + ∂ µ α(x) (3.16) ψ 0 (x) = eiqα(x) ψ(x) Questa è una trasformazione di gauge che coinvolge entrambi i campi: sia quello vettoriale che quello spinoriale. Abbiamo già dimostrato che F µν è invariante sotto tale trasformazione. Per proseguire, vediamo come trasforma la derivata covariante: (Dµ ψ)0 (x) = (∂µ − iqA0µ )ψ 0 (x) = (∂µ − iqAµ − iq∂µ α(x))eiqα(x) ψ(x) = eiqα(x) (iq∂µ α(x) + ∂µ − iqAµ − iq∂µ α(x))ψ(x) = eiqα(x) (Dµ ψ)(x) / da cui Per la notazione "slashed" di Dirac si ha che γ µ Aµ = A, / − m)ψ = ψ(i / − m)ψ ¯ ∂/ − m)ψ + qψγ ¯ µ ψAµ = ψ(i( ¯ ∂/ − iqA) ¯ D ψ(i Questo implica che la lagrangiana della Q.E.D. si possa scrivere nella forma 1 / − m)ψ ¯ D LEM = − F µν Fµν + ψ(i 4
(3.17)
6 ATTENZIONE: in questo caso il termine di interazione lo inseriamo con il termine positivo. Questo implica la necessità di specificare alcune convenzioni di segno:
• le trasformazioni di gauge 2.76 sui campi vettoriali non vengono toccate; • la derivata covariante 1.31 cambia il segno, cioè di definisce così: Dµ = ∂µ − iqAµ
(3.13)
Solo così la teoria è consistente. Qualora invece la teoria venga definita col termine di interazione avente un segno - davanti: • le trasformazioni di gauge 2.76 sui campi vettoriali cambiano di segno, in particolare 0
Aµ (x) = Aµ (x) − ∂µ α(x)
(3.14)
• la derivata covariante resta quella della forma 1.31. NON si possono mischiare le cose, cioè per esempio considerare la derivata covariante 3.13 con la trasformazione di gauge 3.14. 7 La notazione U(1) indica che il parametro in questione è 1: α(x).
100
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
concludendo immediatamente che essa è invariante sotto trasformazioni di tipo U(1)-gauge in quanto somma di termini invarianti sotto tale trasformazione. In particolare: / − m)ψ)0 = iψ¯ 0 γ µ (Dµ ψ)0 − mψ¯ 0 ψ 0 = ¯ D (ψ(i ¯ µ (eiqα(x) Dµ ψ) − m(e−iqα(x) ψ)(e ¯ iqα(x) ψ) = i(e−iqα(x) ψ)γ / − m)ψ ¯ µ (Dµ ψ) − mψψ ¯ = ψ(i ¯ D = iψγ
3.2
Quantizzazione canonica delle teorie di campo con interazione
Per quantizzare le teorie di campo con interazione saremmo intenzionati ad utilizzare il consueto procedimento utilizzato per le teorie libere: i. scrivere la lagrangiana L = LFREE + LINT ; ii. derivare il momento coniugato e la densità hamiltoniana; iii. scrivere le parentesi di Poisson; iv. applicare le regole di quantizzazione canonica (con i commutatori nel caso dei bosoni e con gli anticommutatori nel caso dei fermioni) trovando l’algebra nello spazio delle coordinate; v. ricavare le condizioni di quantizzazione nello spazio dei momenti usufruendo della soluzione dell’equazione del moto della teoria; vi. costruzione dello spazio di Fock. Questo procedimento, tuttavia, non funziona. Per capirne il motivo studiamo rapidamente il caso della teoria di campo scalare reale. La lagrangiana è della forma 3.4, in particolare 1 λ 1 L = (∂µ ϕ)(∂ µ ϕ) − m2 ϕ 2 − ϕ 4 2 2 4! L’equazione del moto non è più l’equazione di Klein-Gordon libera, ma è l’equazione di KleinGordon con un termine di interazione: ( + m2 )ϕ = −
λ 3 ϕ 3!
il momento coniugato non cambia rispetto al caso libero, ed è π µ = ∂0 ϕ, e risulta H = π(∂0 ϕ) − L = HFREE − LINT Le parentesi di Poisson sono (verificare) ( {ϕ(x), ϕ(y)}t = {π(x), π(y)}t = 0 {ϕ(x), π(y)}t = δ 3 (x − y) e le equazioni del moto sono (verificare) ˙ ϕ(x) = {ϕ(x), H}t
˙ π(x) = {π(x), H}t
3.2. QUANTIZZAZIONE CANONICA DELLE TEORIE DI CAMPO CON INTERAZIONE101 Procediamo a questo punto con la quantizzazione della teoria tramite i commutatori. Attraverso le prescrizioni 2.92 e 2.93 si ottengono le regole di commutazione ( [ϕ(x), ϕ(y)]t = [π(x), π(y)]t = 0 [ϕ(x), π(y)]t = iδ 3 (x − y) A questo punto, normalmente si cercano le regole di commutazione nello spazio dei momenti inserendo nelle precedenti relazioni la forma esplicita delle soluzioni dell’equazione del moto. Visto che però l’equazione del moto di questa teoria possiede un termine di interazione aggiuntivo, le funzioni della forma 1.27 non soddisfano l’equazione del moto della nostra teoria, ma di quella libera. Dunque non conosciamo la forma esplicita delle soluzioni dell’equazione del moto e questo ci impedisce di proseguire con il solito ragionamento.
3.2.1
Visuale di interazione
Per risolvere il problema della quantizzazione canonica cerchiamo delle soluzioni approssimate dell’equazione del moto della teoria, non conoscendone l’espressione esatta. Trattiamo in particolare le teorie debolmente accoppiate, in cui cioè le costanti di accoppiamento sono piccole (nel nostro caso λ 1): in questo modo, cerchiamo le soluzioni approssimate con la teoria delle perturbazioni8 . Per seguire l’approccio perturbativo in maniera più agevole utilizziamo la visuale di interazione della meccanica quantistica: si tratta di una visuale intermedia tra quella di Schrödinger e quella di Heisenberg (vedi appendice). Supponiamo che il nostro sistema sia descritto dall’hamiltoniana H = H0 + HINT dove: • H0 è l’hamiltoniana libera; • HINT è l’hamiltoniana di interazione. A questo punto, possiamo definire due differenti operatori di evoluzione temporale: • l’operatore di evoluzione temporale totale U(t,t0 ) = e−iH(t−t0 )
(3.18)
dipendente dall’hamiltoniano totale H = H0 + HINT ; • l’operatore di evoluzione temporale libero U0 (t,t0 ) = e−iH0 (t−t0 )
(3.19)
dipendente dall’hamiltoniano libero H0 . Detto questo, definiamo la visuale di interazione rispetto alla visuale di Schrödinger in questo modo: ( |ψ(t)iI = U0+ (t, 0)|ψ(t)iS (3.20) AI (t) = U0+ (t, 0)AS (t)U0 (t, 0) = U0+ (t, 0)AS (t0 )U0 (t, 0) Queste condizioni, basandosi sulla visuale di Schrödinger B.1, si possono interpretare così: 8 Nel
nostro caso l’approccio perturbativo può essere seguito, in quanto la costante di struttura fine è α ∼ 1. L’approccio perturbativo non va bene nel caso di interazioni non debolmente accoppiate, come per esempio l’interazione forte tra i quarks. In questo caso è necessario trovare un altra via per quantizzare la teoria. 10−2
102
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
• lo stato in visuale di interazione coincide con quello in visuale di Schrödinger al quale viene però sottratta l’evoluzione temporale libera, cioè rispetto ad H0 ; • l’osservabile in visuale di interazione coincide con quella in visuale di Schrödinger alla quale viene però aggiunta l’evoluzione temporale libera, cioè rispetto ad H0 . Gli stati e le osservabili in visuale di interazione vengono definiti rispetto un istante temporale di riferimento, che noi poniamo a 0. Esso non coincide necessariamente con l’istante t0 nel quale comincia l’evoluzione temporale. Studiamo dunque l’evoluzione del sistema in visuale di interazione. i. Vediamo qual è l’evoluzione temporale degli stati fisici in visuale di interazione. Valutiamo dunque come varia nel tempo lo stato |ψ(t)iI , ricordando in particolare le condizioni della visuale di Schrödinger B.1: d d d U0+ (t, 0)|ψ(t)iS = i U0+ (t, 0)U(t,t0 )|ψ(t0 )iS i |ψ(t)iI = i dt dt dt = −U0+ (t, 0)H0U(t,t0 ) +U0+ (t, 0)HU(t,t0 ) |ψ(t0 )iS = U0+ (t, 0)(H − H0 )U(t,t0 )|ψ(t0 )iS = U0+ (t, 0)HINT U(t,t0 )|ψ(t0 )iS = U0+ (t, 0)HINT |ψ(t)iS Considerando ora la prima condizione della visuale di interazione rispetto a quella di Schrödinger si ha che |ψ(t)iI = U0+ (t, 0)|ψ(t)iS ⇒ U0 (t, 0)|ψ(t)iI = |ψ(t)iS da cui si ottiene
d |ψ(t)iI = U0+ (t, 0)HINT U0 (t, 0)|ψ(t)iI dt Definendo l’hamiltoniana di interazione in visuale di interazione i
I HINT (t) ≡ U0+ (t, 0)HINT U0 (t, 0)
(3.21)
si ottiene l’equazione di evoluzione temporale degli stati in visuale di interazione: d I (t)|ψ(t)iI (3.22) i |ψ(t)iI = HINT dt L’equazione di evoluzione temporale degli stati fisici coincide in forma con quella nella visuale di Schrödinger con l’importante differenza che in visuale di interazione l’evoluzione temporale è dovuta soltanto all’hamiltoniana di interazione (in visuale di interazione). E’ importante sottolineare che l’hamiltoniana di interazione in visuale di interazione dipende esplicitamente dal tempo: questo è conseguenza del fatto che, in generale, il termine libero e di interazione dell’hamiltoniano non commutano: [HINT , H0 ] 6= 0 ii. Vediamo adesso qual è l’evoluzione temporale delle osservabili in visuale di interazione. Valutiamo dunque come varia nel tempo l’osservabile A(t)I 9 : d d i AI (t) = i U0+ (t, 0)ASU0 (t, 0) dt dt = −U0+ (t, 0)H0 ASU0 (t, 0) +U0+ (t, 0)AS H0U0 (t, 0) = −H0U0+ (t, 0)ASU0 (t, 0) +U0+ (t, 0)ASU0 (t, 0)H0 = [U0+ (t, 0)ASU0 (t, 0), H0 ] 9 In visuale di Schrödinger le osservabili sono costanti nel tempo, quindi nei conti immediatamente successivi non scriviamo la dipendenza dell’osservabile dal tempo, cioè poniamo AS (t) = AS (t0 ) ≡ AS .
3.2. QUANTIZZAZIONE CANONICA DELLE TEORIE DI CAMPO CON INTERAZIONE103 avendo sfruttato il fatto che [U0 , H0 ] = 0 in quanto entrambi funzioni di H0 che, tautologicamente, commuta con sè stesso. In virtù della definizione di visuale di interazione rispetto alla visuale di Schrödinger 3.20 si ottiene allora l’equazione di evoluzione temporale delle osservabili in visuale di interazione i
d AI (t) = [AI (t), H0 ] dt
(3.23)
Come possiamo vedere, l’evoluzione temporale delle osservabili in visuale di interazione coincide con quella della visuale di Heisenberg B.4, con l’importante peculiarità che l’evoluzione temporale delle osservabili in visuale di interazione è dovuta solamente all’hamiltoniana libera H0 . Questo implica che tutti i risultati validi per le osservabili di una teoria di campo libera in visuale di Heisenberg sono validi anche per un’osservabile di una generica teoria di campo con interazione, a patto che di utilizzi la visuale di interazione 3.20. Ritornando per un momento al problema della teoria di campo scalare reale, le soluzioni in visuale di interazione dell’equazione di Klein-Gordon con interazione possono essere scritte nella forma delle soluzioni dell’equazioni di Klein-Gordon libera, cioè φI ∼ a(k)e−ikx + a+ (k)eikx A questo punto, il procedimento di quantizzazione canonica può proseguire esattamente seguendo il ragionamento fatto per le teorie libere, a patto di restare nella visuale di interazione.10 In definitiva, supponendo di considerare il sistema fisico in visuale di interazione: • gli stati evolvono secondo l’equazione tipo Schrödinger 3.22, in cui l’unico pezzo di I (t) (vehamiltoniana responsabile dell’evoluzione degli stati è quello di interazione HINT di3.21) in visuale di interazione; • le osservabili evolvono secondo l’equazione tipo Heisenberg 3.23 n cui l’unico pezzo di hamiltoniana responsabile dell’evoluzione degli stati è quello libero H0 . Ecco dunque che la visuale di interazione è una visuale intermedia rispetto quelle di Schrödinger e Heisenberg, poichè sia gli stati che le osservabili evolvono nel tempo. Cerchiamo ora la forma esplicita dell’operatore di evoluzione temporale in visuale di interazione UI (t,t0 ). Per definizione, esso è l’operatore tale che |ψ(t)iI = UI (t,t0 )|ψ(t0 )iI Secondo la definizione della visuale di interazione 3.20 e di quella di Schrödinger B.1 abbiamo che |ψ(t)iI = U0+ (t, 0)|ψ(t)iS = U0+ (t, 0)U(t,t0 )|ψ(t0 )iS (
= U0+ (t, 0)U(t,t0 )U0 t0 , 0)|ψ(t0 )iI Questo permette di definire l’operatore di evoluzione temporale in visuale di interazione (
UI (t,t0 ) ≡ U0+ (t, 0)U(t,t0 )U0 t0 , 0) = eiH0t e−iH(t−t0 ) e−iH0t0 10 Più
(3.24)
volte viene evidenziato il fatto che tutti i ragionamenti e i risultati sin qui trovati valgono solo in visuale di interazione e la cosa può apparire ridondante. Ciononostante mi sembra doveroso specificarlo per non cadere altrimenti facilmente in inganno. Per questo penso di continuare a farlo.
104
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
E’ importante sottolineare il fatto che UI (t,t0 ) = eiH0t e−iH(t−t0 ) e−iH0t0 6= eiH0t−iH(t−t0 )−iH0t0 L’eventuale uguaglianza sarebbe valida solo se gli operatori H e H0 commutassero, cosa non vera perchè, come già detto, in generale [HINT , H0 ] 6= 0 ⇒ [H, H0 ] 6= 0 Questa particolarità dell’operatore 3.24 complica notevolmente la risoluzione dell’equazione di evoluzione temporale di UI (t,t0 ) stesso. Inserendo l’espressione |ψ(t)iI = UI (t,t0 )|ψ(t0 )iI nella 3.22 si ottiene l’equazione di evoluzione temporale per l’operatore di evoluzione temporale in visuale di interazione i
d I UI (t,t0 ) = HINT (t)UI (t,t0 ), dt
con UI (t0 ,t0 ) = 1
(3.25)
Come possiamo vedere, l’evoluzione temporale dell’operatore UI (t,t0 ) è identica a quella degli stati in visuale di interazione. Dato che [HINT , H0 ] 6= 0, come già visto, l’operatore hamiltoniano di interazione in visuale di interazione dipende dal tempo, il che implica, in particolare, che I I [HINT (t), HINT (t 0 )] 6= 0
Qualora non vi fosse dipendenza dal tempo, la situazione sarebbe facilmente risolvibile come nel caso della visuale di Schrödinger, in cui l’operatore di evoluzione temporale ha la forma B.2.
3.2.2
Espansione perturbativa dell’operatore di evoluzione temporale in visuale di interazione
L’equazione differenziale 3.25 è equivalente all’equazione integrale UI (t,t0 ) = 1 − i
Z t t0
I dτHINT (τ)UI (τ,t0 )
(3.26)
Per risolvere tale equazione imponiamo le seguenti ipotesi: • supponiamo che l’hamiltoniana di interazione in visuale di interazione sia proporzionale ad un certo accoppiamento con costante λ 1, cioè I HINT (t) ∝ λ
Nel caso della Q.E.D. λ = q; • supponiamo di voler cercare soluzioni del tipo ∞
UI (t,t0 ) =
∑ Un(t,t0),
con Un (t,t0 ) ∝ λ n
n=0
• supponiamo di conoscere la soluzione dell’equazione 3.26 solo fino all’ordine n-esimo, (N) N formalmente UI (t,t0 ) = ∑N n=0 Un (t,t0 ) = SOL O(λ )
3.2. QUANTIZZAZIONE CANONICA DELLE TEORIE DI CAMPO CON INTERAZIONE105 (N)
Detto questo, valutando l’equazione 3.26 per la nostra soluzione nota UI (N) UI (t,t0 ) = 1 − i
= 1−i
Z t t0 Z t t0
(N)
I dτHINT (τ)UI
(t,t0 ) si ha
(τ,t0 )
(N−1)
I dτHINT (τ)UI
(τ,t0 ) + O(λ N+1 )
dove al secondo passaggio si nota che per avere al membro di destra una grandezza ∝ λ N , esatI (τ) (la quale è ∝ λ ) per tamente come il membro di sinistra, è sufficiente moltiplicare HINT (N−1) (τ,t0 ) ∝ λ N−1 . In questo modo possiamo cercare la soluzione aggiungendo ricorsivaUI mente un pezzo per volta. • Soluzione di ordine 0: si tratta del termine della teoria libera, privo di accoppiamento, cioè λ = 0. Banalmente risulta (0) (3.27) UI (t,t0 ) = 1 In questo caso gli stati non evolvono: siamo nella visuale di Heisenberg. • Soluzione di ordine 1: la soluzione prevede il primo termine perturbativo, ossia quello di ordine λ . Allora (1) UI (t,t0 ) = 1 − i
= 1−i
Z t t0
Z t t0
(0)
I dτHINT (τ)UI (τ,t0 ) I dτHINT (τ) = U0 + U1 |{z} |{z} ∝λ =0
∝λ
• Soluzione di ordine 2: la soluzione prevede fino al secondo termine perturbativo, ossia quello di ordine λ 2 . Allora (2) UI (t,t0 ) = 1 − i
Z t
(1)
I dτHINT (τ)UI (τ,t0 ) t0 Z t Z τ1 I I = 1 − i dτ1 HINT (τ1 ) 1 − i dτ2 HINT (τ2 )
= 1−i
t0
t0
Z t
Z t
t0
I dτ1 HINT (τ) + (−i)2
t0
Z τ1
dτ1
t0
I I dτ2 HINT (τ1 )HINT (τ2 )
= U0 + U1 + U2 |{z} |{z} |{z} ∝λ =0
∝λ 2
∝λ
• Soluzione di ordine N: la soluzione prevede fino al n-esimo termine perturbativo, ossia quello di ordine λ n . La soluzione dell’equazione 3.26 è ∞
UI (t,t0 ) =
∑ Un(t,t0)
(3.28)
n=0
con Un (t,t0 ) = (−i)n
Z t t0
Z τn−1
dτ1 . . .
t0
I I dτn HINT (τ1 ) . . . HINT (τn )
(3.29)
106
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
Figura 3.1: Dominio di integrazione. Prima si fa variare τ2 tra t0 e τ¯1 (vedi doppia freccia nel primo grafico) e poi τ¯1 viene fatto variare tra t0 e t. Consideriamo a titolo di esempio il secondo termine perturbativo U2 (t,t0 ) = (−i)2
Z t
Z τ1
dτ1
t0
t0
I I dτ2 HINT (τ1 )HINT (τ2 )
Questo integrale prevede il seguente dominio di integrazione di figura 3.1. Tuttavia, lo stesso dominio di integrazione può essere ottenuto dapprima facendo variare τ1 tra τ¯2 e t, per poi far variare τ¯2 tra t0 e t. In questo modo, il precedente integrale diventa 2
U2 (t,t0 ) = (−i)
Z t t0
Z t
dτ2
I I dτ1 HINT (τ1 )HINT (τ2 )
τ2
Si noti che, nel dominio di integrazione considerato, in ambo i casi si ha che τ2 ≤ τ1 , quindi τ2 indica un istante precedente rispetto a τ1 . Ciò significa che possiamo scrivere Z t Z τ1 Z t Z t (−i)2 I I dτ1 dτ2 + dτ2 dτ1 HINT U2 (t,t0 ) = (τ1 )HINT (τ2 ) 2 t0 t0 t0 τ2 Z Z τ1 (−i)2 t I I dτ1 dτ2 HINT (τ1 )HINT (τ2 )+ = 2 t0 t0 Z Z t (−i)2 t I I dτ1 dτ2 HINT + (τ2 )HINT (τ1 ) 2 t0 τ1 I (τ ) e H I (τ ), che tenendo presente che al secondo passaggio non abbiamo commutato HINT 1 INT 2 come detto non commutano, ma semplicemente nel secondo integrale abbiamo invertito i nomi τ1 ↔ τ2 . Si noti che ora:
• nel primo integrale τ2 ≤ τ1 ; • nel primo integrale τ1 ≤ τ2 (a causa del cambio di nome). Per uniformare gli intervalli di integrazione introduciamo una funzione di Heaviside: (−i)2 U2 (t,t0 ) = 2
Z t t0
Z t
dτ1
t0
I I (τ2 )+ dτ2 {θ (τ1 − τ2 )HINT (τ1 )HINT
I I + θ (τ2 − τ1 )HINT (τ2 )HINT (τ1 ) In questo modo, il primo integrando è non nullo per τ1 ≥ τ2 mentre il secondo quanto τ2 ≥ τ1 11 . Si noti che in ambo gli integrandi l’operatore che agisce per primo, cioè quello più a destra, 11 La
funzione a gradino di Heaviside è nulla quando l’argomento è minore di 0 e pari a 1 altrimenti.
3.2. QUANTIZZAZIONE CANONICA DELLE TEORIE DI CAMPO CON INTERAZIONE107 è l’hamiltoniano di interazione in visuale di interazione calcolato nell’istante cronologicamente precedente. Forniamo ora la seguente Definizione 3.2 (Prodotto ordinato temporalmente,o T-prodotto). dati due operatori A(t) e B(t) dipendenti dal tempo si definisce il prodotto ordinato temporalmente, o T-prodotto, la quantità ( A(t1 )B(t2 ), per t1 > t2 (3.30) T[A(t1 ), B(t2 )] = ±B(t2 )A(t1 ), per t1 < t2 Nel caso t1 < t2 : • il segno + se si tratta di operatori bosonici; • il segno − se si tratta di operatori fermionici. analogamente a quanto avviene nel caso del prodotto ordinato normale. Nonostante la definizione generale suddivida il caso bosonico da quello fermionico, l’opeI (t) non costituisce alcun problema, essendo di tipo bosonico per tutte le teorie di ratore HINT campo considerate, anche quelle in cui sono coinvolti campi fermionici. Infatti, essi compaiono nei termini di interazione sempre almeno "in coppia", costituendo di fatto un sistema bosonico ¯ µ ψAµ ). (si pensi al termine di interazione della Q.E.D.: qψγ Questo significa che possiamo scrivere (−i)2 U2 (t,t0 ) = 2
Z t t0
Z t
dτ1
t0
I I dτ2 T HINT (τ1 )HINT (τ2 )
In generale, la soluzione 3.28 si può scrivere così 12 : (−i)n ∑ n=0 n! ∞
UI (t,t0 ) =
Z t t0
I I dτ1 . . . dτn T HINT (τ1 ) . . . HINT (τn )
(3.31)
cioè, usufruendo della serie esponenziale: Zt τ I UI (t,t0 ) = T exp −i d HINT (τ)
(3.32)
t0
Si noti che nel caso in cui l’hamiltoniano di interazione in visuale di interazione fosse indipendente dal tempo, ossia tale operatore calcolato in t commutasse con sè stesso calcolato in t 0 , allora l’operatore di evoluzione temporale sarebbe B.2, cioè quello esponenziale della visuale di Schrödinger. Insomma, la dipendenza esplicita dal tempo dell’operatore di interazione in visuale di interazione implica che l’operatore 3.24 si debba scrivere in termini di un TI (t)) e non come semplice prodotto prodotto di infiniti esponenziali (uno per ogni valore di HINT di esponenziali. 12 Il
fattore n! a denominatore è sintomatico del fatto che il dominio di integrazione può essere visto in n! modi diversi, tanti quanti le permutazioni tra gli n tempi in questione.
108
3.2.3
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
Matrice di interazione
Definizione 3.3 (Matrice di interazione S). La matrice di interazione S si definisce come S :=
lim
t→∞,t0 →−∞
UI (t,t0 ) ≡ UI (+∞, −∞)
(3.33)
Questa matrice è l’oggetto cruciale per lo studio dei processi di scattering e decadimento. In particolare, la matrice di interazione si può scrivere così: Z∞ I S = T exp −i dτHINT (τ) −∞ Z 4 I = T exp −i d xHINT (x) (3.34) (−i)n =∑ n=0 n! ∞
Z
4
Z
d x1 . . .
I I d 4 xn T HINT (x1 ) . . . HINT (xn )
Solitamente, nei casi che verranno trattati I I I = −LINT (φI ) HINT = −LINT
La matrice di interazione S soddisfa due proprietà: 1. è unitaria, in quanto esponenziale di operatori hermitiani, cioè S+ S = SS+ = 1 2. è covariante, cioè Lorenz-invariante, visto che la densità lagrangiana di una teoria di campo relativistica viene sempre definita covariante.
3.2.4
Processi di scattering
In generale un processo di scattering è un qualsiasi processo che prevede uno stato iniziale con N particelle ed uno stato finale con altre N particelle, non necessariamente uguali a quelle iniziali, frutto dell’interazione delle particelle di partenza. Consideriamo per semplicità il caso di uno scattering tra due particelle. Consideriamo uno stato iniziale all’istante t0 = −∞ costituito dalle particelle a(~p) e b(~q) 13 infinitamente distanti tra loro, cioè t0 = −∞ ∆x = ∞ Per continuare il discorso supponiamo che l’interazione decresca all’aumentare della distanza 14 : questo implica che le particelle a(~ p) e b(~q) non interagiscono tra loro, in quantoo infinitamente distanti. Questo significa che lo stato iniziale in visuale di interazione del processo di scattering è uno stato libero: |ψIN i = |ψ(t0 = −∞)iI = |a(p)b(q)i ∼ a+ (p)b+ (q)|0i 13~ p
e ~q sono i momenti. ipotesi è valida per la maggior parte delle teorie di campo (interazioni), quale la Q.E.D., ma non vale per esempio per la Q.C.D., descrivente l’interazione forte. 14 Questa
3.3. IL TEOREMA DI WICK E I PROPAGATORI DI FEYNMAN
109
Supponiamo che il sistema evolva con l’avvicinamento delle particelle sino ad una distanza finita, tale per cui l’interazione tra le due particelle non sia più nulla. Per un istante −∞ < t < ∞, allora, sulla base della relazione |ψ(t)iI = U(t,t0 )|ψ(t0 )iI si ha che |ψ(t)iI = UI (t, −∞)|ψIN i Aspettando un tempo infinito, lo stato del sistema evolverà. Lo stato |ψ(t = ∞)iI , evoluto di |ψIN i al tempo t = ∞ in visuale di interazione è allora |ψ(t = ∞)iI = UI (+∞, −∞)|ψIN i = S|ψIN i Quindi una volta fissato lo stato iniziale in visuale di interazione è possibile conoscerne l’evoluto all’istante t = ∞ nella stessa visuale tramite la matrice S: la matrice di interazione S contiene tutta l’informazione sull’interazione tra le particelle a(~p) e b(~q). Nello stato finale saranno presenti le due particelle a0 (~p0 ) e b0 (~q0 ) infinitamente distanti tra loro, cioè t =∞
∆x = ∞
D’altra parte, esso è uno stato della teoria libera, in quanto le particelle a0 (~p0 ) e b0 (~q0 ), infinitamente distanti, non interagiscono tra loro, quindi può essere scritto come |ψFIN i = ∑ αi | fi i i
dove | fi i è un generico stato nello spazio di Fock della teoria libera. Ora, qual è la probabilità di avere lo stato finale |ψFIN i a partire dallo stato iniziale |ψIN i? Essa è 15 P(ψIN , ψFIN ) = |hψFIN |ψ(t = ∞)iI |2 = |hψFIN |S|ψIN i|2 = |SFI |2 avendo definito l’elemento di matrice SFI ≡ hψFIN |S|ψIN i
(3.35)
Si noti che l’unitarietà della matrice di interazione e la proprietà
∑ |ψiihψi| = 1 i
assicurano la validità della proprietà PT OT = 1, supponendo che lo stato iniziale sia normalizzato. Infatti: ! P ψIN ,
∑
FIN≡ f
ψf
=
∑
hψIN |S+ |ψ f ihψ f |S|ψIN i =
FIN≡ f
= hψIN | |{z} S+ S |ψIN i = hψIN |ψIN i = 1 1
3.3
Il teorema di Wick e i propagatori di Feynman
La relazione 3.34 fornisce l’espressione della matrice di interazione in funzione del T-prodotto delle hamiltoniane di interazione in visuale di interazione. Ai fini pratici è importante capire come calcolare esplicitamente il T-prodotto suddetto. Lo strumento che ci permette di calcolarlo è il teorema di Wick, che enunceremo nella maniera più generale in seguito. Consideriamo le varie casistiche possibili, in base al tipo di campo considerato. 15 Tale
probabilità risponde alla domanda: " dato lo stato finale del sistema |ψFIN i qual è la probabilità di trovare lo stato |ψ(t = ∞)iI , evoluto dello stato iniziale |ψIN iI ?" In generale infatti |ψFIN i 6= |ψ(t = ∞)iI .
110
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
3.3.1
Campo scalare reale
Sia ϕ un campo scalare reale. Si definisce propagatore di Feynman la funzione 16 17 DF (x − y) ≡ ϕ(x)ϕ(y) := h0|T[ϕ(x)ϕ(y)]|0i
(3.36)
Ora, l’operatore18 ϕ si può scrivere come ϕ = ϕ+ + ϕ− |{z} |{z} ∝a
∝a+
ossia come la somma di due parti proporzionali una all’operatore di creazione e l’altra a quello di distruzione. Ricordando che, in particolare a|0i = 0
h0|a+ = 0
possiamo calcoliamo esplicitamente il propagatore di Feynman: DF (x − y) = θ (x0 − y0 )h0|ϕ(x)ϕ(y)|0i + θ (y0 − x0 )h0|ϕ(y)ϕ(x)|0i = θ (x0 − y0 )h0|a(x)a+ (y)|0i + θ (y0 − x0 )h0|a(y)a+ (x)|0i = θ (x0 − y0 )h0|[a(x), a+ (y)]|0i − θ (y0 − x0 )h0|[a+ (x), a(y)]|0i = θ (x0 − y0 )h0|[ϕ+ (x), ϕ− (y)]|0i − θ (y0 − x0 )h0|[ϕ− (x), ϕ+ (y)]|0i Si noti che al terzo passaggio abbiamo aggiunto il termine −θ (x0 − y0 )h0|a+ (y)a(x)|0i − θ (y0 − x0 )h0|a+ (x)a(y)|0i il quale è nullo per le suddette proprietà a|0i = 0, h0|a+ = 0. Poichè i commutatori sono funzioni, dunque, ai fini dell’algebra dei commutatori, degli scalari in quanto multipli dell’identità, e ricordando i commutatori covarianti 2.115 e 2.116 si ottiene DF (x − y) = θ (x0 − y0 )h0|[ϕ+ (x), ϕ− (y)]|0i − θ (y0 − x0 )h0|[ϕ− (x), ϕ+ (y)]|0i = θ (x0 − y0 )D+ (x − y) − θ (y0 − x0 )D− (x − y)
(3.37)
A questo punto, per proseguire è necessario dimostrare la seguente identità19 T[ϕ(x)ϕ(y)] = N[ϕ(x)ϕ(y)] + ϕ(x)ϕ(y)
(3.38)
Si tratta della forma semplificata del teorema di Wick: tale relazione infatti tratta il T-prodotto di soli due campi. Per dimostrarla, riscriviamola nella forma equivalente ϕ(x)ϕ(y) = T[ϕ(x)ϕ(y)] − N[ϕ(x)ϕ(y)] 16 Il
propagatore di Feynman non è un operatore, ma una funzione che, nell’algebra degli operatori, funge da scalare (insomma, è proporzionale all’identità). 17 La notazione che uso per contrarre due oggetti nel propagatore ha questo significato: sono contratti i due operatori che stanno "più a sinistra" e "più a destra" della sottolineatura. Se quindi per esempio scrivo ϕ1 ϕ2 ϕ3 ϕ4 significa che il propagatore di Feynman è tra ϕ1 e ϕ4 . Se invece scrivo ϕ1 ϕ2 ϕ3 ϕ4 significa che un propagatore di Feynman è tra ϕ1 e ϕ4 e l’altro tra ϕ2 e ϕ3 . 18 Ricordiamo infatti che i nostri campi ora sono osservabili, cioè operatori quantistici. 19 Il simbolo N indica il solito prodotto ordinato normale 2.107, ivi indicato con ::.
3.3. IL TEOREMA DI WICK E I PROPAGATORI DI FEYNMAN
111
Ora: T[ϕ(x)ϕ(y)] = θ (x0 − y0 ) {ϕ− (x)ϕ− (y) + ϕ+ (x)ϕ+ (y) + ϕ− (x)ϕ+ (y) + ϕ+ (x)ϕ− (y)} + θ (y0 − x0 ) {ϕ− (y)ϕ− (x) + ϕ+ (y)ϕ+ (x) + ϕ− (y)ϕ+ (x) + ϕ+ (y)ϕ− (x)} stando attenti di mettere a destra prima gli operatori in y(x) qualora x0 > y0 (y0 > x0 ), come nel primo (secondo) addendo, per mantenere il corretto ordine cronologico. Il prodotto ordinato normale prevede invece che agiscano prima (cioè stiano a destra) gli operatori di distruzione e poi quelli di creazione, senza alcuna importanza riguardo l’ordine dei punti x e y, differentemente dal termine precedente. Perciò, dato che θ (k) + θ (−k) = 1
∀k
possiamo scrivere 20 −N[ϕ(x)ϕ(y)] = −θ (x0 − y0 ) {ϕ− (x)ϕ− (y) + ϕ+ (x)ϕ+ (y) + ϕ− (x)ϕ+ (y) + ϕ− (y)ϕ+ (x)} − θ (y0 − x0 ) {ϕ− (y)ϕ− (x) + ϕ+ (y)ϕ+ (x) + ϕ− (x)ϕ+ (y) + ϕ− (y)ϕ+ (x)} In virtù di ciò, sommando i due termini risulta T[ϕ(x)ϕ(y)] − N[ϕ(x)ϕ(y)] = θ (x0 − y0 )[ϕ+ (x), ϕ− (y)] − θ (y0 − x0 )[ϕ− (x), ϕ+ (y)] = DF (x − y) La forma generale del teorema di Wick per n campi scalari reali è T[ϕ(x1 )ϕ(x2 ) . . . ϕ(xn )] = N[ϕ(x1 )ϕ(x2 ) . . . ϕ(xn )] +
∑
N[ϕ(x1 )ϕ(x2 ) . . . ϕ(xn )]
∑
N[ϕ(x1 )ϕ(x2 ) . . . ϕ(xi ) . . . ϕ(xn )]
1 contr.
+
2 contr.
(3.39)
+... +
∑
N[ϕ(x1 )ϕ(x2 ) . . . ϕ(xi ) . . . ϕ(xn )]
all contr.
ciò significa che al prodotto ordinato normale si aggiungono: • tutti i prodotti ordinati normali possibili in cui c’è una sola contrazione tra 2 campi; • tutti i prodotti ordinati normali possibili in cui ci sono due contrazioni tra 2 campi; • ...; • tutti i prodotti ordinati normali possibili in cui ci sono tutte le possibili contrazioni tra 2 campi. In particolare: – se i campi sono pari in numero allora ognuno di essi è coinvolto in una contrazione, cioè in un propagatore di Feynman; – se i campi sono dispari in numero allora ognuno di essi è coinvolto in una contrazione, cioè in un propagatore di Feynman, tranne uno che resta "libero". 20 si
noti che nel secondo termine della somma (quello per y0 > x0 ) scrivere ϕ− (y)ϕ− (x) + ϕ+ (y)ϕ+ (x) oppure ϕ− (x)ϕ− (y) + ϕ+ (x)ϕ+ (y) è la stessa cosa perchè i campi coinvolti commutano.
112
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
Altrettanto interessante è il seguente corollario del teorema di Wick: T [N[ϕ(x), ϕ(x)]ϕ(x1 ) . . . ϕ(xn )] = T ϕ 2 (x)ϕ(x1 ) . . . ϕ(xn ) NET
(3.40)
dove la sigla NET sta per No contractions at Equal Time. Questa formula ci dice che se il Tprodotto coinvolge un prodotto di operatori in cui si ripete 2 volte lo stesso identico operatore21 allora non si effettua la contrazione tra tale operatore e la sua "copia" identica. Per verificarlo, osserviamo che, tautologicamente: ϕ 2 (x) = ϕ(x)ϕ(x) = T[ϕ(x)ϕ(x)] = N[ϕ(x)ϕ(x)] + ϕ(x)ϕ(x) da cui N[ϕ(x)ϕ(x)] = ϕ(x)ϕ(x) − ϕ(x)ϕ(x) Inserendo questa espressione nel primo membro della 3.40 otteniamo, ricordando che il propagatore può essere portato fuori dal T-prodotto in quanto proporzionale all’identità: T [N[ϕ(x), ϕ(x)]ϕ(x1 ) . . . ϕ(xn )] = T [ϕ(x)ϕ(x)ϕ(x1 ) . . . ϕ(xn )] − ϕ(x)ϕ(x)T [ϕ(x1 ) . . . ϕ(xn )] Ora, il significato del primo addendo è quello di un normale T-prodotto del tipo 3.39, con la possibilità di contrarre a formare un propagatore anche ϕ(x) con sè stesso. Il secondo addendo invece "rimuove" questa possibilità: esso infatti è esattamente il primo addendo, a meno di rimuovere la possibilità di contrarre ϕ(x) con sè stesso. In generale, dunque, la somma è un T-prodotto tra operatori calcolati in punti diversi, in particolare a tempi diversi. Ecco dunque dimostrata la relazione 3.40. Ai fini pratici, nel calcolo del T-prodotto non si considerano propagatori di Feynman tra operatori calcolati nello stesso punto (tempo).
3.3.2
Campo scalare complesso
Il propagatore di Feynman in questo caso è definito come DF (x − y) ≡ ϕ(x)ϕ + (y) := h0|T[ϕ(x)ϕ + (y)]|0i
(3.41)
Si dimostra (verificare) che anche in questo caso vale la relazione 22 + + (y)]|0i DF (x − y) = θ (x0 − y0 )h0|[ϕ+ (x), ϕ− (y)]|0i − θ (y0 − x0 )h0|[ϕ− (x), ϕ+ = θ (x0 − y0 )D+ (x − y) − θ (y0 − x0 )D− (x − y)
dove, in questo caso + D+ (x − y) = [ϕ+ (x), ϕ− (y)] 21 Per
+ D− (x − y) = [ϕ− (x), ϕ+ (y)]
identico si intende anche calcolato nello stesso punto (tempo). in questo caso
22 ATTENZIONE:
ϕ− ∝ b+
ϕ++ ∝ b
ϕ−+ ∝ a+
ϕ+ ∝ a
(3.42)
3.3. IL TEOREMA DI WICK E I PROPAGATORI DI FEYNMAN
113
e il teorema di Wick per campi scalare complessi è l’estensione naturale di quello per campi scalari reali: T[ϕ(x1 )ϕ + (x2 ) . . . ϕ + (xn )] = N[ϕ(x1 )ϕ + (x2 ) . . . ϕ + (xn )] +
∑
N[ϕ(x1 )ϕ + (x2 ) . . . ϕ(xn )]
∑
N[ϕ(x1 )ϕ + (x2 ) . . . ϕ(xi ) . . . ϕ + (xn )]
1 contr.
+
2 contr.
(3.43)
+... +
∑
N[ϕ(x1 )ϕ + (x2 ) . . . ϕ(xi ) . . . ϕ + (xn )]
all contr.
Il corollario del teorema di Wick vale anche nel caso di campi scalari complessi. Si presti attenzione al fatto che ora, però, esistono tre tipi differenti di contrazioni possibili: 1. propagatori del tipo ϕ(x)ϕ + (y) = DF (x − y) 2. propagatori del tipo ϕ(x)ϕ(y) = 0 essendo infatti nullo il commutatore covariante [ϕ(x), ϕ(y)] = 0; 3. propagatori del tipo ϕ + (x)ϕ + (y) = 0 essendo infatti nullo il commutatore covariante [ϕ + (x), ϕ + (y)] = 0. Dunque, di fatto anche nel caso di campi scalari complessi esiste un solo propagatore di Feynman non nullo. anche in questo caso vale (verificare) l’identità T[ϕ(x)ϕ + (y)] = N[ϕ(x)ϕ + (y)] + ϕ(x)ϕ + (y)
3.3.3
Campo vettoriale (reale)
Il propagatore di Feynman in questo caso è definito come µν
DF (x − y) ≡ Aµ (x)Aν (y) := h0|T[Aµ (x)Aν (y)]|0i
(3.44)
Si dimostra (verificare) che anche in questo caso vale la relazione µ
µ
DF (x − y) = θ (x0 − y0 )h0|[A+ (x), Aν− (y)]|0i − θ (y0 − x0 )h0|[A− (x), Aν+ (y)]|0i µν
µν
= θ (x0 − y0 )D+ (x − y) − θ (y0 − x0 )D− (x − y)
(3.45)
Il caso con campi vettoriali (reali) è del tutto analogo a quello con campi scalari reali. L’unica accortezza che bisogna tenere è che ad ogni indice di Lorenz è associato un punto 23 . Nel caso particolare della gauge fixing residua di Feynman 2.81, cioè per ξ = 1, vale la proprietà µν
DF (x − y) = −η µν DF (x − y) 23 Non
si mischiano le cose: se per esempio abbiamo Aµ (x)Aν (y) non si può verificare qualcosa del tipo
Aν (x)Aµ (y).
114
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
dove DF (x − y) è il propagatore di Feynman del caso scalare reale. Anche in questo caso si verifica in maniera del tutto analoga la validità dell’identità T[Aµ (x)Aν (y)] = N[Aµ (x)Aν (y)] + Aµ (x)Aν (y)
(3.46)
e il teorema di Wick assume la forma T[Aµ (x1 )Aν (x2 ) . . . Aσ (xn )] = N[Aµ (x1 )Aν (x2 ) . . . Aσ (xn )] +
∑
N[Aµ (x1 )Aν (x2 ) . . . Aσ (xn )]
∑
N[Aµ (x1 )Aν (x2 ) . . . Aρ (xi ) . . . Aσ (xn )]
1 contr.
+
2 contr.
(3.47)
+... +
∑
N[Aµ (x1 )Aν (x2 ) . . . Aρ (xi ) . . . Aσ (xn )]
all contr.
e, come al solito, vale il corollario del teorema di Wick.
3.3.4
Campo spinoriale
Il caso di campi spinoriali è più delicato degli altri, visto che la teoria classica viene quantizzata per mezzo di anticommutatori. Questo fatto ha delle conseguenze rilevanti. Analizziamo innanzi tutto il prodotto normalmente ordinato, secondo il quale prima agiscono gli operatori di distruzione (cui sono proporzionali le componenti + dei campi): β
β
β
β
α α α α (x) (x)ψ¯ − (y) + ψ− (x)ψ¯ + (y) − ψ¯ − (y)ψ+ N[ψ α (x)ψ¯ β (y)] = ψ+ (x)ψ¯ + (y) + ψ−
Come possiamo notare, per ordinare normalmente il prodotto compare un segno - nell’ultimo addendo. Il passaggio, nel dettaglio, è il seguente: β
β
α α ψ+ (x)ψ¯ − (y) = −ψ¯ − (y)ψ+ (x)
Questo risultato si ottiene considerando le regole di anticommutazione 2.123 e trascurando il termine aggiuntivo derivante dalla delta di Dirac (come fatto al solito nella definizione del prodotto ordinato normalmente). Ai fini pratici, dunque: • la commutazione di due operatori bosonici non provoca cambi di segno; • la commutazione di due operatori fermionici provoca la comparsa di un segno -. Anche il T-prodotto ora segue le regole fermioniche. In particolare: β
β
α α T[ψ α (x)ψ¯ β (y)] = θ (x0 − y0 )ψ+ (x)ψ¯ − (y) − θ (y0 − x0 )ψ¯ − (y)ψ+ (x)
avendo inserito correttamente il segno -, stando alla definizione 3.30. In questo caso, il propagatore di Feynman è definito così: αβ
SF (x − y) ≡ ψ α (x)ψ¯ β (y) := h0|T[ψ α (x)ψ¯ β (y)]|0i
(3.48)
ATTENZIONE: in questo caso, per la definizione del T-prodotto 3.30 nel caso fermionico, il propagatore di Feynman è antisimmetrico, cioè ψ α (x)ψ¯ β (y) = −ψ¯ β (y)ψ α (x)
3.3. IL TEOREMA DI WICK E I PROPAGATORI DI FEYNMAN
115
Scritto esplicitamente (verificare): SF (x − y) = θ (x0 − y0 )h0|{ψ+ (x), ψ¯ − (y)}|0i − θ (y0 − x0 )h0|{ψ¯ + (y), ψ− (x)}|0i = θ (x0 − y0 )S+ (x − y) − θ (y0 − x0 )S− (x − y)
(3.49)
Come nel caso scalare complesso, la contrazione 3.48 è l’unica non nulla: le contrazioni ψ¯ α (x)ψ¯ β (y)ψ β (y)ψ α (x) = 0 essendo nulli i relativi anticommutatori covarianti (vedi 2.122). Si dimostra che il propagatore di Feynman spinoriale è legato a quello scalare tramite la relazione 24 SF (x − y) = (i∂/ + m)DF (x − y) (si ricordi che S(x − y) = (i∂/ + m)D(x − y)). Anche in questo caso vale (verificare) l’identità 25 T[ψα (x)ψ¯ β (y)] = N[ψα (x)ψ¯ β (y)] + ψα (x)ψ¯ β (y)
(3.50)
Consideriamo ora il seguente esempio per visualizzare bene la "delicatezza" degli spinori di Dirac: sia ψi ≡ ψ(xi ), con i = 1, . . . , 8 e consideriamo il prodotto ordinato normale 26 N[ψ1 ψ¯ 2 ψ3 ψ¯ 4 ψ5 ψ¯ 6 ψ7 ψ¯ 8 ] Consideriamo l’accoppiamento tra ψ1 e ψ¯ 6 : noi vogliamo scriverne il propagatore di Feynman e per farlo dobbiamo portare ψ¯ 6 vicino a ψ1 . Per farlo, però, bisogna anticommutare ψ¯ 6 con ogni termine che si frappone tra esso e ψ1 : essendovi 4 termini intermedi con cui anticommutare, per ognuno dei quali l’anticommutazione produce la comparsa di un −1, allora N[ψ1 ψ¯ 2 ψ3 ψ¯ 4 ψ5 ψ¯ 6 ψ7 ψ¯ 8 ] = (−1)4 N[ψ1 ψ¯ 6 ψ¯ 2 ψ3 ψ¯ 4 ψ5 ψ7 ψ¯ 8 ] Analogamente, volendo portare ψ5 prima di ψ¯ 2 , dovendo fare 3 step si ottiene che N[ψ1 ψ¯ 2 ψ3 ψ¯ 4 ψ5 ψ¯ 6 ψ7 ψ¯ 8 ] = (−1)7 N[ψ1 ψ¯ 6 ψ5 ψ¯ 2 ψ3 ψ¯ 4 ψ7 ψ¯ 8 ] essendo poi i propagatori di Feynman degli scalari ai fini del conto con gli operatori, essi possono essere portati fuori dal prodotto ordinato normale. Risulta: N[ψ1 ψ¯ 2 ψ3 ψ¯ 4 ψ5 ψ¯ 6 ψ7 ψ¯ 8 ] = (−1)7 ψ1 ψ¯ 6 ψ5 ψ¯ 2 N[ψ3 ψ¯ 4 ψ7 ψ¯ 8 ] 24 NB:
attenzione che in questo caso ψ+ ∝ c
25 ATTENZIONE:
ψ− ∝ d +
ψ¯ + ∝ d
ψ¯ − ∝ c+
se nei casi bosonici (vedi es/ campo scalare reale) la commutazione dei campi calcolati in x e in y non provoca alcun cambio di segno, ora invece sì. 26 ATTENZIONE: quanto viene detto ora vale solo se stiamo considerando le componenti degli spinori, e non gli spinori interi!!! Infatti, se consideriamo gli spinori in generale, ciò che si spostano sono i soli operatori di creazione e distruzione, mentre restano inalterati nelle posizioni gli spinori nello spazio dei momenti u, u, ¯ v, v¯ Spostare le componenti degli spinori coincide proprio con questa cosa appena detta.
116
3.3.5
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
Caso generale
Avendo analizzato singolarmente ciascun caso, passiamo ora ad enunciare la forma più generale del Teorema 3.3.1 (Wick). Siano Bi , i = 1, . . . , n generici operatori di tipo scalare reale, scalare complesso, vettoriale reale, vettoriale complesso o spinoriale. Allora: T[B1 (x1 )B2 (x2 ) . . . Bn (xn )] = N[B1 (x1 )B2 (x2 ) . . . Bn (xn )]+ + ∑(−1)Pi j Bi (xi )B j (x j )N[B1 (x1 ) . . . Bˆ i (xi )Bˆ j (x j ) . . . Bn (xn )]+ ij
+ ∑ (−1)Pi j (−1)Pkl Bi (xi )B j (x j ) Bk (xk )Bl (xl )· i jkl
· N[B1 (x1 ) . . . Bˆ i (xi )Bˆ j (x j ) . . . Bˆ k (xk )Bˆ l (xl ) . . . Bn (xn )]+ +... (3.51) dove: • gli operatori scritti con il ˆ all’interno del prodotto ordinato normale sono quelli che escono tramite la contrazione in propagatore; • i fattori (−1)Pi j e (−1)Pkl riguardano solo il caso di operatori fermionici. In particolare, Pi j e Pkl sono le permutazioni fermioniche necessarie per avvicinare gli operatori contratti nella formazione di un propagatore di Feynman. Gli unici propagatori di Feynman non nulli sono quelli tra operatori dello stesso tipo. In particolare: ϕ(x)ϕ(y) = DF (x − y) campi scalari reali ϕ(x)ϕ + (y) = DF (x − y)
campi scalari complessi
µν
Aµ (x)Aν (y) = DF (x − y) αβ
ψ α (x)ψ¯ β (y) = SF (x − y)
3.4
campi vettoriali (reali) campi spinoriali
Diagrammi di Feynman
I diagrammi di Feynman sono dei grafici che permettono di interpretare in maniera più intuitiva oggetti matematici piuttosto corposi presenti nelle teorie di campo con interazione. I diagrammi di Feynman sono validi per ogni teoria con interazione. Nel capitolo successivo tratteremo, in particolare, il caso della Q.E.D.
3.4.1
Interpretazione grafica dei propagatori di Feynman
I propagatori di Feynman possono essere interpretati graficamente usufruendo di particolari diagrammai di Feynman. Distinguiamo i vari casi. 1. Campo scalare reale. Il propagatore di Feynman è fornito dalla formula 3.36. In particolare esso può essere riscritto come DF (x − y) = θ (x0 − y0 )h0|ϕ+ (x)ϕ− (y)|0i + θ (y0 − x0 )h0|ϕ+ (y)ϕ− (x)|0i Distinguiamo ora i due casi in cui x0 > y0 e viceversa.
3.4. DIAGRAMMI DI FEYNMAN
117
(a) Se x0 > y0 allora il propagatore di Feynman è DF (x − y) = h0|ϕ+ (x)ϕ− (y)|0i Dato che ϕ− ∝ a+ e ϕ+ ∝ a, allora possiamo dare la seguente interpretazione: i. il termine ϕ− (y)|0i ci dice che nel punto y viene creata una particella di tipo a; ii. il termine h0|ϕ+ (x) ci dice che nel punto x viene distrutta una particella di tipo a. Al propagatore di Feynman suddetto possiamo dunque dare la seguente interpretazione: esso ci dice che nel punto y viene creata una particella, la quale si propaga fino al punto x per poi essere distrutta in tale punto. Graficamente possiamo interpretare così la situazione:
Figura 3.2: La particella viene creata in y, si propaga fino a x e in questo punto viene distrutta. (b) Se y0 > x0 allora il propagatore di Feynman è DF (x − y) = h0|ϕ+ (y)ϕ− (x)|0i Dato che ϕ− ∝ a+ e ϕ+ ∝ a, allora possiamo dare la seguente interpretazione: i. il termine ϕ− (x)|0i ci dice che nel punto x viene creata una particella di tipo a; ii. il termine h0|ϕ+ (y) ci dice che nel punto y viene distrutta una particella di tipo a. Al propagatore di Feynman suddetto possiamo dunque dare la seguente interpretazione: esso ci dice che nel punto x viene creata una particella, la quale si propaga fino al punto y per poi essere distrutta in tale punto. Graficamente possiamo interpretare così la situazione:
Figura 3.3: La particella viene creata in x, si propaga fino a y e in questo punto viene distrutta. Nessuna delle due condizioni x0 ≶ y0 è covariante: cioè che è covariante è invece la somma dei due casi. Il propagatore di Feynman DF (x − y) può essere dunque schematizzato così:
Figura 3.4: La particella viene creata in y, si propaga fino a x e in questo punto viene distrutta.
118
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE Sino ad ora si è parlato di particelle create e distrutte. A dire la verità non si sta parlando di particelle fisiche, bensì di particelle virtuali: Definizione 3.4 (Particelle fisiche e particelle virtuali). Si definisce particella fisica (detta ON-SHELL) una particelle tale che p2 = m2
(3.52)
Si definisce particella virtuale (detta OFF-SHELL) una particelle tale che p2 6= m2
(3.53)
Il propagatore di Feynman descrive dunque particelle di tipo virtuale27 . A questo punto scriviamo esplicitamente il propagatore di Feynman ricordando la forma esplicita dei termini D+ e D− , cioè Z 3 d k −ik(x−y) 1 e D+ (x − y) = [ϕ+ (x), ϕ− (y)] = (2π)3 2ωk k0 =ωk Z 3 1 d k ik(x−y) D− (x − y) = [ϕ− (x), ϕ+ (y)] = − e (2π)3 2ωk k0 =ωk sulla base della relazione 3.37 possiamo dunque scrivere d 3 k −ik(x−y) e 2ωk k0 =ωk Z 3 1 d k ik(x−y) + θ (y0 − x0 ) e (2π)3 2ωk k0 =ωk
1 DF (x − y) = θ (x0 − y0 ) (2π)3
Z
Mostriamo ora che possiamo scrivere il propagatore di Feynman anche nel seguente modo: I d 4 k e−ik(x−y) DF (x − y) = i (3.54) 4 2 2 CF (2π) k − m Consideriamo il seguente cammino CF nel piano complesso (Re(k0 ), Im(k0 )):
Figura 3.5: Cammino CF nel piano complesso (Re(k0 ), Im(k0 )) 27 Per
visualizzare meglio la questione consideriamo il seguente semplice esempio. Consideriamo un particella di Energia E che si sta avvicinando da sinistra ad una barriera di potenziale di altezza λ . La meccanica quantistica ci dice che anche nel caso E < λ è possibile che la particella "passi" da sinistra a destra rispetto alla barriera. nonostante sia la particella fisica a potersi trovare a destra della barriera, in realtà essa non è passata attraverso la barriera: in questo caso, la particella possiede un’incertezza sull’energia (dovuta al principio di indeterminazione di Heisenberg) tale per cui, in realtà, la particella fisica abbia effettivamente E > λ , in modo da poter scavalcare la barriera. Intuitivamente, però, è uso comune dire che la particella ha attraversato la barriera, ma così dicendo si sta considerando una particella virtuale.
3.4. DIAGRAMMI DI FEYNMAN
119
Dato che k0 ≡ ωk , allora il cammino scelto passa sotto il polo −m e sopra il polo m della −ik(x−y) funzione integranda ek2 −m2 . 28 0
Possiamo dunque scrivere 29 1 DF (x − y) = (2π)3
Z
3
i~k(~x−~y)
d ke
i · 2π
I CF
dk0
e−ik0 (x0 −y0 ) k02 − m2
A questo punto: • nel caso x0 > y0 il termine α ≡ −x0 + y0 presente nell’esponenziale è negativo. Ciò significa che, per calcolare l’integrale con il teorema dei residui, si deve chiudere il cammino di integrazione nel semipiano complesso con parte immaginaria negativa 30
Figura 3.6: Chiusura del cammino CF nel semipiano complesso con parte immaginaria negativa (Il circuito circolare lo chiamiamo C+ ). In questo caso, il circuito ottenuto è equivalente al circuito C+ che circonda il polo k0 = ωk . In virtù di ciò, per il teorema dei residui possiamo scrivere 31 I CF
dk0
e−ik0 (x0 −y0 ) e−ik0 (x0 −y0 ) = −2iπRes k =ω 0 k (k0 + ωk )(k0 − ωk ) k02 − ωk2
28 Come
possiamo notare, nei punti k = ±m la funzione integranda presenta due poli, quindi in essa non è definita. Questo giustifica a ma ggior ragione il fatto che stiamo considerando particelle virtuali, cioè con k2 6= m2 . 29 Si noti che k2 − m2 = k2 − |~k|2 − m2 = k2 − ω 2 . 0 0 k 30 Infatti, nel caso in cui la funzione integranda presenti un esponenziale del tipo eiαz : – se α > 0 la chiusura va fatta sopra; – se α > 0 la chiusura va fatta sotto. 31 ATTENZIONE:
orario.
si aggiunge un segno − (come in questo caso) qualora il circuito in questione sia in senso
120
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE Dato che il residuo di una funzione f (z) con z0 polo di ordine n è n−1 1 d n {Res f (z)}z=z0 = lim (z − z0 ) f (z) (n − 1)! z→z0 dzn−1
(3.55)
−ik (x −y )
0 0 0 allora, essendo nel nostro caso z ≡ k0 e f (k0 ) ≡ (ke +m)(k , si ottiene (per il caso 0 0 −m) k0 = ωk ): I e−ik0 (x0 −y0 ) e−iωk (x0 −y0 ) dk0 2 = −2iπ 2ωk k0 − ωk2 CF
Inserendo questo risultato nell’espressione 1 (2π)3
Z
3
−i~k(~x−~y)
d ke
i · 2π
e−ik0 (x0 −y0 ) dk0 2 k0 − ωk2 CF
I
si ottiene 1 (2π)3
Z
~
d 3 keik(~x−~y) ·
i e−iωk (x0 −y0 ) = D+ (x − y) (−2iπ) 2π 2ωk
• nel caso y0 > x0 , invece, il termine α ≡ −x0 + y0 presente nell’esponenziale è positivo. Ciò significa che, per calcolare l’integrale con il teorema dei residui, si deve chiudere il cammino di integrazione nel semipiano complesso con parte immaginaria positiva:
Figura 3.7: Chiusura del cammino CF nel semipiano complesso con parte immaginaria positiva (Il circuito circolare lo chiamiamo C+ ). In questo caso, il circuito ottenuto è equivalente al circuito C+ che circonda il polo k0 = −ωk . In virtù di ciò, per il teorema dei residui e svolgendo gli stessi passaggi del caso precedente si ottiene il termine D− (x − y).
3.4. DIAGRAMMI DI FEYNMAN
121
In definitiva, abbiamo dimostrato la validità della scrittura 3.54, in quanto abbiamo mostrato che DF (x − y) = θ (x0 − y0 )D+ (x − y) − θ (y0 − x0 )D− (x − y) = i
I CF
d 4 k e−ik(x−y) (2π)4 k2 − m2
Definendo il propagatore di Feynman nel caso di campi scalari reali nello spazio dei momenti i D˜ F (k) = 2 (3.56) k − m2 allora si può scrivere Z d 4 k −ik(x−y) ˜ DF (x − y) = e DF (k) (3.57) (2π)4 Quest’ultima equazione non è altro che la riscrittura del propagatore di Feynman in funzione della sua trasformata di Fourier D˜ F (x − y). 2. Campo scalare complesso. Il propagatore di Feynman è fornito dalla formula 3.41. In particolare esso può essere riscritto come + + DF (x − y) = θ (x0 − y0 )h0|ϕ+ (x)ϕ− (y)|0i + θ (y0 − x0 )h0|ϕ+ (y)ϕ− (x)|0i
Distinguiamo ora i due casi in cui x0 > y0 e viceversa. (a) Se x0 > y0 allora il propagatore di Feynman è DF (x − y) = h0|ϕ+ (x)ϕ− (y)|0i + Dato che ϕ− ∝ a+ e ϕ+ ∝ a, allora possiamo dare la seguente interpretazione: + i. il termine ϕ− (y)|0i ci dice che nel punto y viene creata una particella di tipo a; ii. il termine h0|ϕ+ (x) ci dice che nel punto x viene distrutta una particella di tipo a.
Al propagatore di Feynman suddetto possiamo dunque dare la seguente interpretazione: esso ci dice che nel punto y viene creata una particella di tipo a, la quale si propaga fino al punto x per poi essere distrutta in tale punto. Graficamente possiamo interpretare così la situazione:
Figura 3.8: La particella di tipo a viene creata in y, si propaga fino a x e in questo punto viene distrutta. (b) Se y0 > x0 allora il propagatore di Feynman è + DF (x − y) = h0|ϕ+ (y)ϕ− (x)|0i + Dato che ϕ− ∝ b+ e ϕ+ ∝ b, allora possiamo dare la seguente interpretazione:
122
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE i. il termine ϕ− (x)|0i ci dice che nel punto x viene creata una particella di tipo b; + ii. il termine h0|ϕ+ (y) ci dice che nel punto y viene distrutta una particella di tipo b. Al propagatore di Feynman suddetto possiamo dunque dare la seguente interpretazione: esso ci dice che nel punto x viene creata una particella di tipo b, la quale si propaga fino al punto y per poi essere distrutta in tale punto. Graficamente possiamo interpretare così la situazione:
Figura 3.9: La particella di tipo b viene creata in x, si propaga fino a y e in questo punto viene distrutta. come abbiamo potuto notare, il caso complesso presenta una differenza rispetto al caso reale: ora abbiamo 2 specie particellari distinte, una di tipo a e una di tipo b. Come abbiamo visto in precedenza, queste due specie particellari non sono altro che l’una l’antiparticella dell’altra. Convenzionalmente, la specie particellare di tipo a si identifica con la particella propriamente detta, mentre quella di tipo b con la sua antiparticella. Il diagramma di Feynman relativo al propagatore di Feynman nel caso scalare complesso è
Figura 3.10: La particella viene creata in y, si propaga fino a x e in questo punto viene distrutta (1◦ diagramma) e viceversa (2◦ diagramma). La differenza rispetto al caso reale è la presenza di una freccia: questa indica il moto della particella propriamente detta (cioè della specie a). Se consideriamo il moto di un’antiparticella, allora bisogna tenere a mente che il verso della freccia è sempre opposto a quello del moto dell’antiparticella. Si noti che i diagrammi di Feynman relativi a particelle scalari sono contraddistinti da linee tratteggiate. Anche nel caso scalare complesso possiamo scrivere d 4 k −ik(x−y) ˜ DF (k) e (2π)4 dove il propagatore nello spazio dei momenti è i D˜ F (k) = 2 k − m2 DF (x − y) =
Z
(3.58)
(3.59)
3.4. DIAGRAMMI DI FEYNMAN
123
3. Campo vettoriale (reale). Il propagatore di Feynman è fornito dalla formula 3.44. La situazione è fisicamente identica al caso del campo scalare reale. In questo caso, diagrammaticamente il propagatore è definito così:
Figura 3.11: La particella viene creata in y, si propaga fino a x e in questo punto viene distrutta. A differenza del caso scalare, per rappresentare una particella vettoriale si utilizza una linea ondulata. Inoltre, in corrispondenza dei punti solitamente si specificano gli indici di Lorenz ad essi associati. Ricordando poi che, nella condizione ξ = 1 vale µν
DF (x − y) = −η µν DF (x − y) allora anche in questo caso si può scrivere µν DF (x − y) =
Z
d 4 k −ik(x−y) ˜ µν e DF (k) (2π)4
(3.60)
dove il propagatore nello spazio dei momenti è η µν µν D˜ F (k) = −i 2 k − m2
(3.61)
4. Campo spinoriale. Il propagatore di Feynman è fornito dalla formula 3.48. In particolare esso può essere riscritto come αβ
β
β
α α (x)|0i SF (x − y) = θ (x0 − y0 )h0|ψ+ (x)ψ¯ − (y)|0i + θ (y0 − x0 )h0|ψ+ (y)ψ−
Dato che in questo caso ψ+ ∝ c
ψ− ∝ d +
ψ¯ + ∝ d
ψ¯ − ∝ c+
la situazione è del tutto analoga a quella relativa al caso scalare complesso: anche in questo caso esistono due specie particellari differenti, che sono l’una l’antiparticella dell’altra. In particolare: αβ
β
α (x)ψ ¯ − (y)|0i; (a) se x0 > y0 : SF (x − y) = h0|ψ+ αβ
β
α (y)|0i. (b) se y0 > x0 : SF (x − y) = h0|ψ¯ + (x)ψ−
Diagrammaticamente, il propagatore di Feynman nel caso spinoriale si rappresenta così:
Figura 3.12: La particella viene creata in y, si propaga fino a x e in questo punto viene distrutta (1◦ diagramma) e viceversa (2◦ diagramma).
124
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE Nel caso di particelle fermioniche i diagrammi di Feynman sono caratterizzati convenzionalmente da linee continue e la convenzione sulla freccia è la stessa vigente nel caso scalare complesso. Per propagatori di Feynman fermionici possiamo scrivere
SF (x − y) =
Z
d 4 k −ik(x−y) ˜ e SF (k) = (i∂/ + m)DF (x − y) (2π)4
(3.62)
dove il propagatore nello spazio dei momenti è 32 /k + m i = S˜F (k) = i 2 /k − m2 /k − m
(3.63)
ESERCIZIO: verificare che i propagatori di Feynman sono funzioni di Green dell’equazione del moto della teoria. In particolare, per il caso scalare reale, che ( + m2 )DF (x − y) = −iδ 4 (x − y) e, in generale, a meno di costanti moltiplicative, è uguale a iδ 4 .
3.4.2
Interpretazione grafica dei campi non contratti
Nel caso di contrazione per formare propagatori di Feynman abbiamo già visto come trattare la cosa. Nel caso di campi non contratti, invece, si ragiona in maniera leggermente diversa, ma sempre in linea con quanto precedentemente detto. In particolare:
• nel caso di un campo proporzionale ad un operatore di costruzione il diagramma di Feynman associato è costituito da una linea che comincia da un punto;
• nel caso di un campo proporzionale ad un operatore di distruzione il diagramma di Feynman associato è costituito da una linea che finisce in un punto.
Convenzionalmente, si dice che una linea inizia in un punto quando si sviluppa alla sua sinistra, mentre vi finisce. 33 I risultati relativi ai vari casi sono riassunti per comodità in figura 3.13. 32 Si 33 La
ricordi, come visto, che (/k + m)(/k − m) = k2 − m2 . spiegazione è poco rigorosa, ma in teoria intuitiva.
3.4. DIAGRAMMI DI FEYNMAN
Figura 3.13: Diagrammi di Feynman dei campi.
125
126
CAPITOLO 3. TEORIE DI CAMPO CON INTERAZIONE
Capitolo 4 Quantum ElectroDynamics (Q.E.D.) Applichiamo ora quanto imparato nel caso specifico della Q.E.D.. Da questo momento in avanti tutte le quantità considerate sono in visuale di interazione: la cosa non verrà più ripetuta per comodità. In particolare, non verranno ripetuti: I ≡H • nè i simboli I sulle grandezze fisiche, dandoli per scontati (per esempio HINT INT );
• nè il simbolo N del prodotto ordinato normale. Tutti i prodotti tra campi che troveremo sono normalmente ordinati. Eventualmente, queste cose saranno specificate le prime volte. Prima di proseguire diamo la seguente regola intuitiva per la realizzazione di un diagrama di Feynman: un diagramma di Feyman si disegna mettendo a sinistra tutte le particelle distrutte, costituenti cioè lo stato iniziale, e a destra le particelle create, costituenti cioè lo stato finale.
4.1
Espansione della matrice di interazione nello spazio delle coordinate
La lagrangiana della Q.E.D. è 1 ¯ µ ψAµ ¯ ∂/ + me )ψ + qe ψγ LQED = − F µν Fµν + LGF + ψ(i 4
(4.1)
dove: • LGF è un termine di gauge fixing; • la lagrangiana di interazione è ¯ µ ψAµ ] LINT = N[qe ψγ
(4.2)
• le grandezze con il pedice "e" sono relative all’elettrone. La densità hamiltoniana di interazione è ¯ µ ψAµ ] HINT = −LINT = N[−qe ψγ 127
(4.3)
128
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
Stando alla relazione 3.34, la matrice di interazione della Q.E.D. è Z 4 / SQED = T exp iqe d x ψ¯ Aψ
(4.4)
dove / ¯ µ ψAµ = ψ¯ Aψ ψγ Occupiamoci ora dell’espansione della matrice di interazione, assegnando a ciascun ordine perturbativo il corretto significato fisico. Ci basiamo sullo sviluppo della serie esponenziale (vedi 3.34). Termini di ordine 0 Si tratta del caso con costante di accoppiamento nulla, cioè in cui si pone q = 0: il fotone non si accoppia con particelle elettricamente neutre. Ciò significa che S(0) = 1 Termini di ordine 1 In questo caso Z
/ x ]] = d 4 xT[N[(ψ¯ Aψ)
Z
/ x] = d 4 xN[(ψ¯ Aψ)
Z
d 4 xN[(ψ¯ + + ψ¯ − )x (A/+ + A/− )x (ψ+ + ψ− )x ]
S(1) = iqe = iqe = iqe
dove al secondo passaggio si utilizza il corollario del teorema di Wick1 . La matrice di interazione al primo ordine perturbativo è la somma di 8 termini. Sulla base delle regole grafiche imparate, ad essi sono associati i diagrammi fi Feynman riportati in figura 4.1. Facciamo un paio di osservazioni. • In Q.E.D. le frecce che indicano il flusso delle particelle fermioniche propriamente dette devono essere un continuo: questa è una conseguenza della conservazione della carica2 . • I diagrammi di Feynman riportati in figura 4.1 sono detti diagrammi di vertice: essi descrivono le interazioni fondamentali di Q.E.D., ossia quelle con interazioni al primo / ordine (del tipo ψ¯ Aψ). In seguito risulterà chiaro come distinguere tra processi fisici e non, ma per il momento l’unico modo che abbiamo per verificarlo è controllando che tali fenomeni siano dinamicamente consistenti con la conservazione del quadrimomento. Sulla base di ciò, si può dimostrare che i diagrammi di vertice della Q.E.D. descrivono eventi non fisici, in quanto non si conserva il quadrimomento a causa del fatto che mγ = 0. 1I
campi nel prodotto normale sono infatti tutti quanti calcolati allo stesso tempo, quindi non vi è alcuna contrazione nella formazione di propagatori di Feynman. 2 Non si possono presentare ad esempio situazioni con due frecce dirette verso lo stesso punto o fuoriuscenti dallo stesso punto
4.1. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DELLE COORDINATE129
Figura 4.1: Diagrammi di vertice della Q.E.D. Termini di ordine 2 Consideriamo ora il termine di ordine 2 nella costante di accoppiamento qe della matrice di interazione S, ossia Z (iqe )2 / x ]N[(ψ¯ Aψ) / y] S(2) = d 4 xd 4 yT N[(ψ¯ Aψ) 2! Come al solito, utilizziamo il teorema di Wick per scrivere esplicitamente il T-prodotto. In particolare, ricordando il corollario del teorema, secondo cui
T[N()x N()y ] = T[()x ()y ]NET allora le uniche contrazioni possibili sono tra campi calcolati in x e campi calcolati in y, senza la possibilità di trovare propagatori di Feynman relativi a campi calcolati nello stesso punto. In definitiva: / x ]N[(ψ¯ Aψ) / y ] = N[(ψ¯ Aψ) / x (ψ¯ Aψ) / y] T N[(ψ¯ Aψ) | {z } A
/ x (ψ¯ Aψ) / y ] + N[(ψ¯ Aψ) / x (ψ¯ Aψ) / y] + N[(ψ¯ Aψ) | {z } B1
/ x (ψ¯ Aψ) / y] + N[(ψ¯ Aψ) | {z } B2
/ x (ψ¯ Aψ) / y] + N[(ψ¯ Aψ) {z } | C1
/ x (ψ¯ Aψ) / y] / x (ψ¯ Aψ) / y ] + N[(ψ¯ Aψ) + N[(ψ¯ Aψ) | {z } C2
/ x (ψ¯ Aψ) / y] + N[(ψ¯ Aψ) | {z } B2
130
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
Figura 4.2: Generico diagramma di tipo A di S(2) . Valutiamo singolarmente ciascuno dei singoli termini. A) Questo termine non prevede alcun tipo di propagatore di Feynman. Il termine di S(2) relativo a questo caso è Z q2e A / x (ψ¯ Aψ) / y] d 4 xd 4 yN[(ψ¯ Aψ) S(2) = − 2! Non essendoci alcun propagatore che collega il punto x con il punto y, questo termine corrisponde al prodotto di due diagrammi di vertice del tutto indipendenti tra di loro, ossia diagrammi del tipo mostrato in figura 4.2. Dato che i diagrammi di vertice non descrivono fenomeni fisici, e quindi non è fisico neppure il loro prodotto, questo termine non fornisce un contributo interessante, in quanto non fisico. B1 ) Questo termine descrive processi che coinvolgono un propagatore fermionico. Il termine di S(2) ad essi relativo è B1 S(2)
q2 =− e 2!
Z
n o / / / / ¯ ¯ ¯ ¯ d xd y N[(ψ Aψ)x (ψ Aψ)y ] + N[(ψ Aψ)x (ψ Aψ)y ] 4
4
Consideriamo per un momento il secondo addendo del T-prodotto. sulla base dell’anticommutatività dei campi quantistici fermionici si ha che 3 / y (ψ¯ Aψ) / x] / x (ψ¯ Aψ) / y ] = (−1)4 N[(ψ¯ Aψ) N[(ψ¯ Aψ) Ora, essendo le variabili x e y mute, possiamo scambiarne il nome nel secondo addendo, cioè x ↔ y. Così facendo, il secondo addendo diventa identico al primo, da cui si ottiene B1 S(2)
= −q2e
Z
/ y] / x (ψ¯ Aψ) d 4 xd 4 yN[(ψ¯ Aψ)
Nel caso della Q.E.D. avviene sempre questo tipo di semplificazione: i termini topologicamente equivalenti descrivono lo stesso processo fisico e rimuovono il fattore n! a denominatore tramite una semplice cambio di nome delle variabili di integrazione e, in generale, degli indici muti. In questo caso, i due termini di tipo B1 sono topologicamente equivalenti e rimuovono il denominatore 2!. B1 Prima di analizzare nel dettaglio ciascun prodotto ordinato normale che compare in S(2) 3
ATTENZIONE: anche in questo caso si deve operare spostando i soli operatori di creazione e distruzione o, equivalentemente, le componenti degli spinori ψα , con α = 1, 2, 3, 4.
4.1. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DELLE COORDINATE131
Figura 4.3: Generico diagramma di tipo B1 di S(2) . ¯ è un propagavalutiamone le caratteristiche generali. In questo caso il termine ψ(x)ψ(y) / x e rispettivatore fermionico che collega i punti x e y, nei quali, poi, gli operatori (ψ¯ A) / mente (Aψ)y creano/distruggono un fotone e un fermione. I diagrammi di Feynman sono quindi del tipo mostrato in figura 4.3, caratterizzati da una linea fermionica e una fotonica sia a destra che a sinistra e da un propagatore fermionico nel mezzo. Riscrivendo i campi nelle componenti + e − e portando il propagatore di Feynman fuori dal prodotto ordinato normale si ha B1 S(2)
= −q2e
Z
¯ ¯ x (A/+ + A/− )x (A/+ + A/− )y (ψ+ + ψ− )y ] d 4 xd 4 yψ(x)ψ(y)N[( ψ¯ + + ψ)
Questo prodotto ordinato normale produce 24 = 16 termini diversi, in cui vengono rappresentati tutti i casi possibili, da quello in cui ci sono 4 particelle nello stato iniziale e 0 nello stato finale (schematicamente 4 → 0) a quello in cui ci sono 0 particelle nello stato iniziale e 4 nello stato finale (schematicamente 0 → 4), passando per tutti i casi intermedi. Non tutti questi però sono dei processi fisici, poichè: • in alcuni di essi non si conserva il quadrimpulso; • in alcuni di essi o il numero di vertici non è corretto oppure in almeno un vertice c’è un numero errato di linee. Infatti, in Q.E.D.: – il numero di vertici coincide con l’esponente della costante di accoppiamento relativo al termine perturbativo considerato della matrice di interazione (in questo caso, poichè consideriamo il termine perturbativo di S all’ordine 2 allora ci devono essere 2 vertici); – ciascun vertice possiede 3 linee totali, somma tra quelle entranti e uscenti, dove 3 è il numero di campi che interagiscono4 . In generale, in Q.E.D., sono fisici solo i processi che prevedono un numero uguale di particelle tra stato iniziale e finale. Dunque, nel caso particolare da noi considerato, sono fisici solo i processi di tipo 2 → 2. In definitiva, il prodotto ordinato normale relativo al termine di tipo B1 produce solo i seguenti termini fisici 5 ¯ x (A/+ + A/− )x (A/+ + A/− )y (ψ+ + ψ− )y ] = (ψ¯ + A/− )x (A/− ψ+ )y + (ψ¯ − A/+ )x (A/+ ψ− )y N[(ψ¯ + + ψ) + (ψ¯ + A/+ )x (A/− ψ− )y + (ψ¯ + A/− )x (A/+ ψ− )y + (ψ¯ − A/+ )x (A/− ψ+ )y + (ψ¯ − A/− )x (A/+ ψ+ )y 4 La
/ e lagrangiana di interazione della Q.E.D. è data dalla relazione 4.2: essa coinvolge solo i 3 campi ψ Aψ quindi ciascun vertice vuole solo 3 linee. Se una teoria di campo prevede un numero diverso di campi moltiplicati normalmente tra loro nella lagrangiana di interazione allora il numero di linee per ciascun vertice può cambiare. 5 Omettiamo il propagatore di Feynman ψ(x)ψ(y) ¯ che è a fattor comune di tutti questi termini, in quanto moltiplica il prodotto ordinato normale.
132
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
Figura 4.4: Diagrammi di Feynman B1 di S(2) . Con la conveniente notazione del tipo (ψ¯ + A/+ )x (A/− ψ− )y ≡ (+ + −−) si riportano in figura 4.4 i diagrammi di Feynman relativi a ciascun pezzo. Si noti che: • alcuni diagrammi prevedono il propagatore in verticale. Questo è dettata sia dall’esigenza di mettere due fermioni nello stato iniziale (particelle distrutte) o finale (particelle create) sia dal fatto che la linea fermionica deve essere continua (seguendo la freccia); • lo stesso fenomeno può essere descritto da più grafici di Feynman (e quindi termini del prodotto ordinato normale) che sono topologicamente indipendenti, come per esempio: – lo scattering Compton e+ γ → e+ γ, rappresentato dai diagrammi (+ + −−) e (+ − +−); – lo scattering Compton e− γ → e− γ, rappresentato dai diagrammi (− + −+) e (− − ++). Dunque non tutti i diagrammi di Feynman descrivono processi diversi rispetto a quelli descritti da altri diagrammi.
4.1. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DELLE COORDINATE133 B2 ) Questo termine descrive processi che coinvolgono un propagatore fermione. Il termine di S(2) relativo a questi processi è B2 S(2)
q2 =− e 2!
Z
/ x (ψ¯ Aψ) / y] d 4 xd 4 yN[(ψ¯ Aψ)
Anche in questo caso gli unici processi fisici sono quelli del tipo 2 → 2. Si lascia per esercizio lo studio dettagliato di questi termini. Noi trattiamo in dettaglio solo un caso particolare. ESERCIZIO: scrivere l’elemento di matrice S al secondo ordine che descrive il processo di scattering e+ e− → e+ e− . I termini che ci interessano sono quelli che coinvolgono i seguenti operatori: • gli operatori di creazione di elettrone e positrone, rispettivamente ψ¯ − e ψ− ; • gli operatori di distruzione di elettrone e positrone, rispettivamente ψ+ e ψ¯ + . Gli operatori fermionici costituiscono il propagatore di Feynman 3.44, quindi sono a fattor comune. In definitiva, l’elemento di matrice S al secondo ordine che ci interessa è questo: + − →e+ e−
Se(2)e
Z q2e µν d 4 xd 4 yDF (x − y) N[(ψ¯ − γµ ψ− )x (ψ¯ + γν ψ+ )y ] 2! + N[(ψ¯ + γµ ψ+ )x (ψ¯ − γν ψ− )y ] + N[(ψ¯ − γµ ψ+ )x (ψ¯ + γν ψ− )y ] + N[(ψ¯ + γµ ψ− )x (ψ¯ − γν ψ+ )y ]
=−
A questo punto, consideriamo il primo e il secondo addendo. Essi in realtà sono uguali: per mostrarlo e sufficiente effettuare un numero pari di permutazioni di campi spinoriali e poi rinominare, in uno dei due addendi, gli indici e le variabili mute µ → ν e x → y, sfruttando il fatto che il propagatore di Feynman vettoriale è simmetrico, in quanto proporzionale al tensore metrico, che è simmetrico 6 . In questo modo, i due contributi si sommano e "rimuovono" il fattore 2! a denominatore. La stessa identica cosa vale per il terzo e il quarto addendo. Insomma: + − →e+ e−
e e S(2)
= −q2e
Z
d 4 xd 4 yDF (x − y){N[(ψ¯ − γµ ψ− )x (ψ¯ + γν ψ+ )y ] {z } | µν
a
+ N[(ψ¯ − γµ ψ+ )x (ψ¯ + γν ψ− )y ]} | {z } b
I termini a e b sono topologicamente indipendenti. Infatti: • il termine a è relativo ad un diagramma di canale S, ossia nel quale tutta l’energia dello stato iniziale "fluisce" nello stato finale trasportata dal propagatore (il propagatore è orizzontale); 6 ATTENZIONE:
in questo caso possiamo fare questo giochetto anche dopo aver esplicitato i termini + e − µν µν dei campi. Questo è concesso soprattutto perchè vale DF (y − x) = DF (x − y), cosa che invece non è vera per i propagatori fermionici, per i quali vale invece SF (x − y) = −SF (y − x)! Ecco perchè nel caso dei termini B1 non abbiamo fatto questo tipo di riordinamento dopo aver esplicitato le componenti + e − dei campi.
134
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
Figura 4.5: Diagrammi di Feynman di tipo B2 di S(2) . Si noti che, essendo il propagatore fotonico, a ciascun punto è assegnato un indice di Lorenz che viene (spesso) specificato. • il termine b è relativo ad un diagramma di canale Q, ossia nel quale l’energia dello stato iniziale non viene trasportata allo stato finale dal propagatore (il propagatore è verticale). Il tutto è mostrato in figura 4.5. C1 ) Questo termine descrive processi che coinvolgono 2 propagatori fermionici. Il termine di S(2) ad essi relativo è q2e / x (ψ¯ Aψ) / y] d 4 xd 4 yN[(ψ¯ Aψ) 2! Z q2e αβ γδ =− d 4 xd 4 yN[Aµ (x)Aν (y)](ψ¯ α γµ ψβ )x (ψ¯ γ γµ ψδ )y 2! Z
1 SC(2) =−
Ora, tenendo conto che i campi spinoriali quantistici anticommutano e ricordando che il propagatore di Feynman fermionico è della forma ψ ψ¯ allora possiamo scrivere q2e αβ γδ d 4 xd 4 yN[Aµ (x)Aν (y)](ψ¯ α γµ ψβ )x (ψ¯ γ γµ ψδ )y 2! Z q2 αβ γδ = − e d 4 xd 4 yN[Aµ (x)Aν (y)](−1)3 (ψδ (y)ψ¯ α (x))γµ (ψβ (x)ψ¯ γ (y))γν 2! 2Z γδ αβ 3 qe = −(−1) d 4 xd 4 yN[Aµ (x)Aν (y)]SFδ α (y − x)γµ SFβ γ (x − y)γν 2!
1 SC(2) =−
Z
Aver esplicitato gli indici spinoriali permette di vedere come l’espressione scritta non sia altro che una traccia di matrici (il primo e l’ultimo indice, che formalmente sono quelli della matrice risultante, sono uguali a δ : formalmente corrisponde ad avere una matrice Xδδ = Tr[X]). Insomma: 1 SC(2)
2Z 3 qe
= −(−1)
2!
d 4 xd 4 yTr[SF (y − x)γµ SF (x − y)γν ]N[Aµ (x)Aν (y)]
La comparsa della traccia suddetta è giustificata dalle caratteristiche particolari dei diagrammi di Feynman in questione. come possiamo notare, tutte le componenti spinoriali sono "inglobate" nei propagatori di Feynman, mentre i campi fotonici sono nel prodotto ordinato normale. Questo significa che i diagramma di Feynman considerati, rappresentati in figura 4.6, prevedono 2 propagatori fermionici e una linea fotonica nello stato iniziale e una nello stato finale. I diagrammi di figura 4.6 sono detti diagrammi di loop fermionico e soddisfano le seguenti proprietà:
4.1. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DELLE COORDINATE135
Figura 4.6: Generico diagramma di Feynman si loop fermionico.
Figura 4.7: Generico diagramma di Feynman di loop. • tutte le linee fermioniche sono "chiuse", sintomo della traccia che compare nel 1 termine SC(2) ; • per riordinare correttamente i campi spinoriali per formare i propagatori di Feynman è sempre necessario un numero dispari di permutazioni, con la conseguente comparsa di un fattore (−1) aggiuntivo (nel nostro caso: (−1)3 = −1). C2 ) Questo termine descrive processi che coinvolgono un propagatore fermionico e un propagatore fotonico. Il termine di S(2) ad essi relativo è 2 SC(2) =−
q2e 2!
Z
/ x (ψ¯ Aψ) / y ] + N[(ψ¯ Aψ) / x (ψ¯ Aψ) / y ]} d 4 xd 4 y{N[(ψ¯ Aψ)
Senza entrare nel dettaglio del conto, in questo caso si può riscrivere 2 SC(2) = −q2e
Z
¯ d 4 xd 4 yDF (y − x)SF (x − y)N[ψ(x)γ µ γν ψ(y)] µν
Anche in questo caso gli unici processi fisici sono quelli con egual numero di particelle tra stato iniziale e finale. In particolare, sono processi fisici quelli del tipo 1 → 1, in cui stato iniziale e stato finale sono costituiti da un fermione (il fotone svolge il ruolo di propagatore). Anche in questo caso i diagrammi di Feynman associati, mostrati in figura 4.7, sono contraddistinti da due propagatori che si "chiudono" l’uno nell’altro, anche se stavolta si tratta di propagatori di tipo diverso. In questo caso si parla di diagrammi di loop7 . D) Questo termine descrive processi che coinvolgono 2 propagatori fermionici e un propagatore fotonico. Il termine di S(2) ad essi relativo è SD (2) 7 Si
q2 =− e 2!
Z
/ x (ψ¯ Aψ) / y] d 4 xd 4 yN[(ψ¯ Aψ)
parla di diagramma di loop tutte le volte che ci sono più propagatori che si "chiudono" l’uno con l’altro.
136
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
Figura 4.8: Generico diagramma di Feynman di vuoto. In questo caso, tutte e tre le particelle coinvolte svolgono il ruolo di propagatori, con conseguente assenza di linee "libere". I diagrammi di Feynman associati, mostrati in figura 4.8, sono detti diagrammi di vuoto. Essi infatti contribuiscono alla definizione dell’energia del vuoto, quindi non fornisce alcun contributo ai processi fisici studiati8 . ESERCIZIO: dare una descrizione sommaria dei processi del 3◦ ordine dello sviluppo perturbativo della matrice S.
4.2
Espansione della matrice di interazione nello spazio dei momenti
A questo punto ci poniamo un nuovo problema: che cosa facciamo quando vogliamo studiare un processo specifico del quale conosciamo soltanto lo stato iniziale e lo stato finale? Supponiamo di fissare lo stato iniziale |ii del sistema: per farlo, diciamo che all’istante t0 = −∞ abbiamo un elettrone di momento ~p e un positrone di momento ~q a distanza infinita tra di loro. Specificando il momento delle particelle e il fatto che sono infinitamente distanti tra loro, essendo l’interazione elettromagnetica un’interazione che decresce con l’aumento della distanza, automaticamente stiamo fissando uno specifico stato dello spazio di Fock della teoria libera, ossia stiamo fissando lo stato iniziale in questo modo: |ii = |e− (~p)e+ (~q)i Lasciando evolvere il sistema, esso all’istante +∞ si troverà ad un certo stato finale. Ora, lo stato evoluto | f i di |ii all’istante t = +∞, nel quale le particelle del sistema sono infinitamente distanti tra loro, quindi non interagenti, è anch’esso uno stato della teoria libera, dunque | f i = |e− (p0 )e+ (q0 )i Quello che vogliamo studiare è la quantità 3.35, cioè SFI = h f |S|ii Infatti, poichè la matrice di interazione è unitaria, la quantità |SFI |2 ha proprio il significato di probabilità di transizione tra lo stato |ii e lo stato | f i. Per stimarla, dovremo contrarre con questi due stati tutti quei campi che, nell’espressione della matrice di interazione, non sono contratti tra loro nella formazione di propagatori di Feynman. Si parla di contrazione perchè il risultato questa operazione fornisce un numero a partire da un’operatore quantistico. Cominciamo considerando tutte le possibili contrazioni tra operatori e stato iniziale |ii. In primo 8 La
definizione dell’energia del vuoto ai nostri scopi è del tutto arbitraria.
4.2. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DEI MOMENTI137 luogo consideriamo il caso in cui lo stato iniziale sia costituito da un elettrone libero si spin s e momento p, cioè 9 |ii = |e− s (p)i Un generico termine fuoriuscente dal T-prodotto nello sviluppo perturbativo della matrice S potrebbe avere il campo ψ+ (x) libero. Esso dunque si va a contrarre con lo stato |ii. Vediamo qual è il risultato di questa contrazione. Allora: ψ+ (x)|e− s (p)i =
1 (2π)3/2 s
Z
Z
=
d3k
p d3k √ ur (k)cr (k)e−ikx (2π)3/2 2ω p c+ ∑ s (p)|0i 2ωk r
2ω p −ikx e ur (k)cr (k)c+ ∑ s (p)|0i 2ωk r
Utilizzando ora le regole di anticommutazione 2.123 si ottiene −ipx ψ+ (x)|e− |0i s (p)i = us (p)e
In maniera del tutto analoga si verifica facilmente che ¯ + (x)|e− ¯ − (x)|e− ψ− (x)|e− s (p)i = ψ s (p)i = 0 s (p)i = ψ Scegliendo ora come stato iniziale quello di positrone singolo, cioè |ii = |e+ s (p)i si dimostra in maniera del tutto analoga che l’unica contrazione non nulla è la seguente: −ipx |0i ψ¯ + (x)|e+ s (p)i = v¯s (p)e
mentre scegliendo come stato iniziale lo stato di fotone singolo |ii = |γλ (p)i allora si mostra che l’unica contrazione non nulla è A+ (x)|γλ (p)i = ελ (p)e−ipx |0i µ
µ
Se per esempio studiassimo la Scalar QED, ossia l’interazione tra un fotone e un campo scalare reale s di momento p, allora risulterebbe che l’unica contrazione non nulla è ϕ+ |s(p)i = e−ipx |0i Facciamo ora la stessa identica cosa sugli stati finali del sistema, supponendo separatamente i casi in cui tale stato finale sia costituito da un elettrone, un positrone, un fotone o un campo scalare reale liberi 10 . Così facendo, anche in questo caso emergono solo 4 contrazioni non 9 Ricordiamo 10 Se
che gli stati iniziale e finale sono tutti stati di particella libera. il campo scalare è complesso nella 4.6 l’ultima relazione è hs(p)|ϕ−+ (x) = eipx h0|
138
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
nulle. I risultati sono riassunti di seguito: 11 −ipx |0i ψ+ (x)|e− s (p)i = us (p)e ψ¯ (x)|e+ (p)i = v¯ (p)e−ipx |0i + s s µ µ A+ (x)|γλ (p)i = ελ (p)e−ipx |0i ϕ |s(p)i = e−ipx |0i
(stato iniziale)
(4.5)
(stato finale)
(4.6)
+
ipx − hes (p)|ψ¯ − (x) = u¯s (p)e h0| he+ (p)|ψ (x) = v (p)eipx h0| − s s ∗ µ hγλ (p)|A− (x) = ελµ (p) eipx h0| hs(p)|ϕ (x) = eipx h0| −
Detto tutto questo facciamo le due seguenti osservazioni. Nel caso in cui la contrazione considerata è non nulla, emergono sempre i due seguenti termini: 1. un termine che indica la polarizzazione del campo, ossia lo spin della particella 12 ; 2. un esponenziale che fissa il momento della particella considerata. A questo punto riprendiamo lo sviluppo della matrice di interazione S e vediamone i risultati della contrazione con gli stati |ii e | f i. i. Termine di ordine 0. Considerato che in questo caso S(0) = 1 allora ( 1, se |ii = | f i h f |S|ii = h f |ii = 0, se |ii 6= | f i Il primo caso non è di nostro interesse: il fatto che |ii = | f i implica che non c’è stata interazione, mentre noi stiamo studiando proprio i processi in cui è coinvolto un processo di interazione. Dunque possiamo concludere che il termine di ordine 0 dello sviluppo perturbativo della matrice di interazione non contribuisce. ii. Termine di ordine 1. Questo termine dello sviluppo perturbativo della matrice S è costituito dalla somma di 8 termini, come già visto. Studiamo in dettaglio solo uno dei processi rappresentati, in particolare scegliamo e− → e− γ quindi significa scegliere gli stati iniziale e finale |ii = |e− s (p)i
0 0 | f i = |e− s0 (p )γλ 0 (k )i
e il seguente termine di S(2) : e− →e− γ
S(2)
= N[(ψ¯ − A/− ψ+ )x ]
In definitiva, dobbiamo studiare la contrazione (1) e− →e− γ h f |S(2) |ii = S f i
Z
= iq
0 − 0 ¯ / d 4 xhe− s0 (p )γλ 0 (k )|ψ− (x)A− (x)ψ+ (x)|es (p)i
ossia, detto a parole: 11 A
differenza di quanto fatto precedentemente, ora consideriamo i vettori di polarizzazione come vettori complessi. In Q.E.D. considerare tali vettori reali o complessi non ne modifica la sostanza. 12 Cioè i termini u , ε µ , . . . . Si noti che nel caso di campo scalare tale termine è semplicemente un fattore 1 r λ perchè lo spin della particella rappresentata ha spin 0, dunque il campo non ha polarizzazione.
4.2. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DEI MOMENTI139 0 ¯ • e− s0 (p ) è contratto con ψ− (x);
• e− s (p) è contratto con ψ+ (x); • γλ−0 (k0 ) è contratto con A/− (x). Ora, sfruttando le relazioni 4.6 e 4.5 si ha che (1) Sfi
= iq
∗µ ελ 0 u¯s0 (p0 )γµ us (p)
Z
0
0
d 4 xe−i(p−p −k )x h0|0i | {z } 1
il che implica, sfruttando la definizione 1.8 della delta di Dirac 4-dimensionale, (1)
S f i = (2π)4 δ 4 (p − p0 − k0 )M f i
∗µ
con M f i = iqελ 0 u¯s0 (p0 )γµ us (p)
La quantità M f i è detta ampiezza di Feynman. Ora, l’elemento di matrice considerato è coerente con il fatto che i processi di interazione al primo ordine in q non sono processi fisici. Infatti la delta di Dirac δ 4 (p − p0 − k0 ) è non nulla solamente se p = p0 + k0 , ossia se si conserva il quadrimomento tra stato iniziale e finale del sistema. Tuttavia, essendo il fotone massless, questo è impossibile e quindi p 6= p0 + k0 con conseguente annullamento della delta di Dirac. Coerentemente con il fatto che stiamo considerando termini al primo ordine perturbativo in q, l’ampiezza di Feynman è proporzionale a q. Questo conto matematico però è la via più lunga di scrivere l’ampiezza di Feynman. Essa infatti può essere scritta in maniera agevole utilizzando il diagramma di Feynman relativo al processo considerato.
Figura 4.9: Processo e− → e− γ. Le regole di Feynman per ricavare M f i direttamente dal diagramma sono le seguenti: (a) si comincia considerando la linea fermionica e la si segue percorrendola nel verso opposto alla freccia partendo dalla fine della linea stessa. Questo significa che, nell’ordine: i. c’è il termine di polarizzazione dell’elettrone nello stato finale, cioè u¯s0 (p0 ); ii. c’è il fattore relativo al vertice di destra, cioè iqγ µ ; iii. c’è il termine di polarizzazione dell’elettrone nello stato iniziale, cioè us (p). (b) Una volta conclusa la linea fermionica si considera il resto. In particolare, nel nostro caso abbiamo un fotone nello stato finale, il cui termine di polarizzazione è εµ∗ (k0 ). Riscrivendo i vari termini nell’ordine appena seguito si ottiene M f i = u¯s0 (p0 )iqγ µ us (p)εµ∗ (k0 ) che coincide con quello scritto in precedenza.
140
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
iii. Termine di ordine 2. Anche in questo caso i processi fisici descritti sono più di uno. Studiamo nel dettaglio lo scattering Compton e− γ → e− γ Questo significa fissare gli stati iniziale e finale |ii = |e− s (p)γλ (k)i
0 0 | f i = |e− s0 (p )γλ 0 (k )i
e scegliere di studiare il seguente termine: e− γ→e− γ
S(2)
= (iq)2
Z
d 4 xd 4 y N[(ψ¯ − A/− )x SF (x − y)(A/+ ψ+ )y ] + N[(ψ¯ − A/+ )x SF (x − y)(A/− ψ+ )y ]
I diagrammi di Feynman relativi a questo processo sono i (− + −+) e (− − ++) rappresentati in figura 4.4. Studiamo separatamente la contrazione dei due addendi con gli stati iniziale e finale. (− − ++) Considerando tutte le possibili contrazioni non nulle dobbiamo dunque studiare h f |S(2) |ii = −q
2
Z
− 0 0 / ¯ / d 4 xd 4 yhe− s0 (p )γλ 0 (k )|N[(ψ− A− )x SF (x−y)(A+ ψ+ )y ]|es (p)γλ (k)i
Utilizzando le relazioni 4.6 e 4.5 e riscrivendo il propagatore fermonico nello spazio dei momenti di ottiene Z
2
h f |S(2) |ii = −q Z
4
d4q u¯ 0 (p0 )/ ε ∗λ 0 (k0 )S˜F (q)/ ε λ (k)us (p) (2π)4 s
−i(q−p0 −k0 )x
Z
d xe
d 4 ye−i(q−p−k)y h0|0i | {z } 1
Z
d4q
u¯ 0 (p0 )/ ε ∗λ 0 (k0 )S˜F (q)/ ε λ (k)us (p)δ 4 (q − p0 − k0 )δ 4 (q − p − k) (2π)4 s = −q2 (2π)4 u¯s0 (p0 )/ ε ∗λ 0 (k0 )S˜F (p + k)/ ε λ (k)us (p)δ 4 (p + k − p0 − k0 ) = −q2 (2π)4 (2π)4
Perciò h f |S(2) |ii = (2π)4 δ 4 (p + k − p0 − k0 )M f i con l’ampiezza di Feynman M f i = −q2 u¯s0 (p0 )/ ε ∗λ 0 (k0 )S˜F (p + k)/ ε λ (k)us (p) Notiamo ora due cose: • anche in questo caso è possibile ricavare facilmente l’ampiezza di Feynman direttamente dal diagramma di Feynman relativo al processo studiato. In particolare, con riferimento al diagramma (− − ++) di figura 4.4, seguendo le regole di Feynman dette in precedenza, cioè considerando dapprima la linea fermionica, dunque il resto, otteniamo 13 ∗ 0 M f i = u¯s0 (p0 )(iqγ µ )S˜F (p + k(iqγ ν ))us (p)εµλ 0 (k )ενλ (k)
che coincide con il risultato precedente; 13 Essendo
coinvolti dei fotoni, assegnamo al vertice di destra l’indice µ e a quello a sinistra l’indice ν.
4.2. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DEI MOMENTI141 • la conservazione del 4-momento avviene su ogni singolo vertice di interazione per i diagrammi di canale S 14 . Infatti, con riferimento ai momenti assegnati alle varie particelle, si ottiene che p + k = q relativamente al vertice sinistro e q = p0 + k0 relativamente al vertice destro. Il propagatore fermionico, poi, assicura che tutto il quadrimomento q relativo al primo vertice sia trasportato al secondo, da cui p + k = p0 + k0 . (− + −+) ESERCIZIO: verificare che S f i = (2π)4 δ 4 (p + k − p0 − k0 )M f i con l’ampiezza di Feynman M f i = −q2 u¯s0 (p0 )/ ε λ (k)S˜F (p − k0 )/ ε ∗λ 0 (k0 )us (p) ESERCIZIO: calcolare le ampiezze di Feynman dei due seguenti processi: e+ γ → e+ γ e+ e− → e+ e− iv. Termine di ordine 2 con loop fermionico. Studiamo ancora una volta per semplicità un caso particolare. Scegliamo il processo di self energy del fotone, cioè γ →γ Questo significa fissare gli stati iniziale e finale |ii = |γλ (p)i
| f i = |γλ 0 (p0 )i
e studiare l’elemento di matrice γ→γ S(2)
q2 =− 2!
Z
d 4 xd 4 y(−1)Tr[SF (y − x)γµ SF (x − y)γν ]N[(A+ + A− )x (Aν+ + Aν− )y ] µ
µ
In questo caso particolare, possono presentarsi più possibilità di contrazione, infatti, così µ come possiamo contrarre A+ con |γλ (p)i e Aν− con hγλ 0 (p0 )| possiamo alternativamente µ contrarre Aν+ con |γλ (p)i e A− con hγλ 0 (p0 )|. Le due situazioni sono del tutto identiche, ossia topologicamente equivalenti: basta scambiare in una delle due i nomi delle variabili mute x ↔ y e µ ↔ ν e sfruttare le regole del prodotto ordinato normale per campi fotonici, oltre che l’antisimmetria del propagatore fermionico. Questo provoca un fattore 2 che elimina quello a denominatore. Insomma, ci si ritrova a studiare l’elemento di matrice γ→γ h f |S(2) |ii = q2 14 Infatti
Z
d 4 xd 4 yTr[SF (y−x)γµ SF (x−y)γν ]hγλ 0 (p0 )|(A+ + A− )x (Aν+ + Aν− )y |γλ (p)i µ
µ
in generale il quadrimomento si deve conservare solo tra stato finale e iniziale: solo in diagrammi di canale S il propagatore trasporta il quadrimomento dello stato iniziale allo stato finale.
142
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.) Sfruttando come al solito le relazioni 4.6 e 4.5, riscrivendo i propagatori fermionici nello spazio dei momenti e riordinando opportunamente gli esponenziali si ottiene γ→γ h f |S(2) |ii = q2
Z
d4q (2π)4
Z
Z
i(p0 −q−q0 )x
4
d 4 q0 Tr[S˜F (q0 )γµ S˜F (q)γν ]εµ∗ (p0 )εν (p) (2π)4 Z
d xe
0
d 4 ye−i(p−q−q )y
d4q d 4 q0 =q Tr[S˜F (q0 )γµ S˜F (q)γν ]εµ∗ (p0 )εν (p)· 4 4 (2π) (2π) 4 4 4 0 · (2π) (2π) δ (p − q − q0 )δ 4 (p − q − q0 ) 2
Z
Z
4 4
0
= (2π) δ (p − p)q
2
Z
d4q ε λ (p)] Tr[S˜F (q − p)/ ε ∗λ 0 (p0 )S˜F (q)/ 4 (2π)
Perciò h f |S(2) |ii = (2π)4 δ 4 (p0 − p)M f i γ→γ
con l’ampiezza di Feynman M f i = q2
Z
d4q ε λ (p)] Tr[S˜F (q − p)/ ε ∗λ 0 (p0 )S˜F (q)/ (2π)4
Come possiamo vedere, il "mescolamento" delle delta di Dirac in virtù dell’integrazione in dq0 fa sì che l’argomento della delta di Dirac restante non contenga la variabile di integrazione rimanente. Questo implica che il momento q (da non confondere con la costante di accoppiamento q ≡ qe ) non è fissato, ma deve essere integrato su tutti i possibili valori. Anche in questo caso valgono le regole di Feynman per poter scrivere l’ampiezza di Feynman a partire dal diagramma. In particolare, con riferimento alla figura 4.6, nel percorrere la linea fermionica si può scegliere un qualsiasi punto. Scegliendo in particolare il vertice di interazione sinistro (al quale assegnamo l’indice ν, mentre a quello di destra l’indice µ), percorrendo la freccia al contrario si ottiene µ∗ S˜F (q − p)(iqγ µ )S˜F (q)(iqγ ν )ελ 0 (p0 )ελν (p)
In questo caso però questa quantità non corrisponde all’ampiezza di Feynman. Per scrivere quest’ultima bisogna utiizzare delle accortezze aggiuntive: • visto che non ci sono linee spinoriali esterne nel diagramma, allora tutti i termini spinoriali, relativi ai propagatori, vanno inclusi in una traccia, preceduta da un segno − che deriva dal corretto ordinamento degli spinori fatto in principio; • poichè il momento q non è fissato bisogna integrare rispetto a tale variabile (dividendo per (2π)4 ). • Con queste operazioni ulteriori risulta M f i = −(1)
Z
d4q µ∗ Tr[S˜F (q − p)(iqγ µ )S˜F (q)(iqγ ν )]ελ 0 (p0 )ελν (p) 4 (2π)
risultato equivalente a quello scritto prima. In definitiva, in caso di loop fermionico bisogna effettuare le seguenti accortezze per
4.2. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DEI MOMENTI143 calcolare correttamente l’ampiezza di Feynman: ( R d4q LOOP → (2π) 4 LOOP FERMIONICO → (−1)Tr[ ]
(4.7)
ESERCIZIO: calcolare l’ampiezza di Feynman relativa al processo e− → e− . Soluzione: dati gli stati |ii = |e− s (p)i risulta M f i = −q2
Z
0 | f i = |e− s0 (p )i
d 4 q ˜ µν DF (q)u¯s0 (p)γµ S˜F (p + q)γν us (p) (2π)4
Il diagramma di Feynman relativo al processo è quello di figura 4.7. I diagrammi di loop presentano una criticità legata alla loro divergenza. Di essi infatti riusciamo a scriverne l’ampiezza di Feynman, ma non a calcolarla esplicitamente. In tal caso l’integrale relativo al termine di matrice S presenta una divergenza quadratica,la quale deve essere inclusa nei parametri della teoria stessa effettuando un’opportuna rinormalizzazione.
4.2.1
Regole di Feynman
Elenchiamo allora le cosiddette regole di Feynman utili per calcolare le ampiezze di Feynman direttamente dai diagrammi. 1. Il punto di partenza è il calcolo di h f |S|ii = (2π)4 δ 4 (pIN − pFIN )M f i dove la delta assicura che un processo fisico deve conservare il 4-momento tra stato iniziale e finale, altrimenti essa si annulla. Tutta l’informazione fisica riguardante l’interazione risiede nell’ampiezza di Feynman M f i . 2. Dato un preciso processo, l’ampiezza di Feynman ad esso relativa è (n)
Mfi = ∑Mfi
(4.8)
n
dove (n) indica l’ordine perturbativo che stiamo considerando. 3. Fissato l’ordine perturbativo sino al quale voler calcolare M f i si disegnano i diagrammi topologicamente indipendenti. Se per esempio consideriamo il processo di scattering e+ e− → e+ e− sino al quarto ordine perturbativo allora
Figura 4.10: Diagrammi di Feynmnan del processo e+ e− → e+ e− sino al 4◦ ordine perturbativo.
144
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
4. Si considerano separatamente i diagrammi topologicamente indipendenti e su ciascuno di essi si applicano le seguenti regole di Feynman: (a) Linee esterne. In figura si riportano i diagrammi di Feynman relativi alle linee esterne e i relativi termini di polarizzazione associati.
Figura 4.11: Regole di Feynman per le linee esterne. Si noti in particolare che nel caso del campo sclare la freccia va messa solo nel caso in cui si tratti di un campo scalare complesso. (b) Linee interne = PROPAGATORI. In figura si riportano i diagrammi di Feynman relativi ai propagatori e le relative forme esplicite nello spazio dei momenti.
Figura 4.12: Regole di Feynman per le linee interne, cioè i propagatori. NB: quando si guarda il propagatore spinoriale per un’antiparticella, ossia quando il momento k va nel verso opposto al segno della freccia, questa provoca l’insorgere di un segno − nella forma esplicita del propagatore. (c) Vertici di interazione. Quanto riportato ai due punti precedenti è valido per una qualsiasi teoria di campo. Ciò che varia da teoria a teoria è invece la regola di Feynman relativa al vertice di interazione. Mostriamo come trovare esplicitamente la regola di Feynman per il vertice di interazione per una generica teoria di campo con interazione considerando il caso particolare della Q.E.D.. La densità hamiltoniana di interazione della Q.E.D. è / HINT = −LINT = −qψ¯ Aψ
4.2. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DEI MOMENTI145 Per procedere, si considera il termine di matrice S all’ordine più basso con interazione, aldilà del fatto che i processi descritti siano fisici o no. Nel caso della Q.E.D., dunque, si considera il termine S(1) : Z
S(1) = iq
/ d 4 x(ψ¯ Aψ)
Questo termine fornisce diagrammi di vertice. Ora, si considera un generico diagramma di vertice, per esempio quello relativo al processo e− → e− γ (vedi figura 4.1) e si applicano al diagramma stesso le regole di Feynman sopra elencate sulle linee esterne, mantenendo anche tutti i fattori aggiuntivi presenti nel termine di matrice S considerato, ossia, in questo caso, iq e la matrice γµ (infatti del termine A/ solo Aµ è il campo fisico al quale viene associato il termine di polarizzazione nella scrittura dell’ampiezza di Feynman). In questo modo, l’ampiezza di Feynman che risulta è µ M f i = iqu(p)γ ¯ µ u(p)ε (k) Infine, si ottiene immediatamente la regola di vertice togliendo tutti termini di polarizzazione. In questo caso, togliendo dunque gli spinori e il vettore ε si ottiene la regola di vertice della Q.E.D.:
Figura 4.13: Regole di Feynman per i vertici di interazione. In figura è riportata anche la regola di vertice relativa all’interazione di Yukava, ossia tra due campi fermionici e uno scalare. In questo caso la densità hamiltoniana di interazione è YUKAWA ¯ 1)ψ HINT = −yϕ ψ( 5. Si può scrivere l’ampiezza di Feynman con le regole di cui sopra mettendo in ordine i termini opportuni, seguendo la linea fermionicca in senso opporto alla freccia. 6. Qualora il diagramma preveda loop ci si deve ricordare di aggiungere i dettagli della formula 4.7, dove la traccia coinvolge la struttura fermionica. Tutto questo, grazie alle regole appena viste, viene in maniera piuttosto automatica. Nei seguenti casi bisogna però prestare particolare attenzione: i. Se ho più di un diagramma di Feynman relativo allo stesso processo si devono tenere in considerazione i segni relativi che vi sono tra di essi. L’unico modo per capirlo è scrivere esplicitamente ogni elemento di matrice S che descrive il processo, riordinando normalmente i campi in modo che a sinistra vi siano tutti gli operatori di creazione (componenti
146
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.) − dei campi) e a destra tutti gli operatori di distruzione (componenti + dei campi). Nel fare questo bisogna prestare attenzione alle permutazioni fermioniche, ognuna delle quali provoca la comparsa di un fattore (−1): ecco da dove può comparire un segno − relativo tra i vari diagrammi. Facciamo un esempio. Consideriamo il processo e− e− → e− e− . Il termine della matrice S che lo descrive è quello dove compaiono gli operatori di creazione e distruzione dell’elettrone, cioè − − − − Se(2)e →e e
= −q2e
Z
d 4 xd 4 yDF (x − y)N[ψ¯ − (x)γµ ψ+ (x)ψ¯ − (y)γν ψ+ (y)] µν
Gli stati iniziale e finale sono − |ii = |e− s (p)er (q)i
0 − 0 | f i = |e− s0 (p )er0 (k )i − − →e− e−
e e Quando si considera la contrazione hi|S(2) renti:
| f i si possono presentare 2 casi diffe-
• il caso in cui in x si distrugge l’elettrone p, s e si crea l’elettrone p0 , s0 mentre in y si distrugge l’elettrone q, r e si crea l’elettrone q0 , r0 ; • il caso in cui in x si distrugge l’elettrone p, s e si crea l’elettrone q0 , r0 mentre in y si distrugge l’elettrone q, r e si crea l’elettrone p0 , s0 . Nel primo caso la contrazione dà tale contributo: 0 − 0 − − ¯ ¯ he− s0 (p )er0 (k )|N[ψ− (x)γµ ψ+ (x)ψ− (y)γν ψ+ (y)]|es (p)er (q)i 0 − 0 ¯ − − ¯ = (−1)he− s0 (p )er0 (k )|ψ− (x)γµ ψ− (y)ψ+ (x)γν ψ+ (y)|es (p)er (q)i
dove si hanno le seguenti contrazioni, non disegnate per semplicità: • es0 (p0 ) contratto con ψ¯ − (x) (prima posizione a sx); • er0 (q0 ) contratto con ψ¯ − (y) (seconda posizione a sx); • es (p) contratto con ψ+ (x) (prima posizione a dx); • er (q) contratto con ψ+ (y) (seconda posizione a dx). ATTENZIONE: ancora una volta gli scambi devono coinvolgere i soli operatori di creazione e di distruzione: quanto scritto vale allora solo per le singole componenti degli spinori, che non sono state erroneamente esplicitate. Valutando correttamente il secondo caso, ci si accorge che per avere il corretto ordine bisogna fare 2 permutazioni fermioniche, cioè scambiare l’ordine prima tra ψ¯ − (y) e ψ+ (x) e poi tra ψ¯ − (y) e ψ¯ − (x) (perchè noi vogliamo creare in y l’elettrone p0 , s0 che si trova nella prima posizione nella scrittura dello stato finale!). Questo provoca l’aggiunta di un fattore (−1)2 = 1 che quindi non modifica il segno. Dunque, nel primo caso emerge un segno − mentre nel secondo no: ecco come può emergere un segno − relativo. Considerare correttamente eventuali segni − relativi è fondamentale per il corretto calcolo della probabilità di transizione: quando infatti si prende M f i il risultato è diverso se, per esempio, si tratta del modulo di una somma oppure di una differenza;
4.2. ESPANSIONE DELLA MATRICE DI INTERAZIONE NELLO SPAZIO DEI MOMENTI147 ii. una volta disegnato il diagramma bisogna scegliere una convenzione sui momenti. Per esempio, la convenzione più intuitiva è quella che prevede come entranti nel vertice i momenti dello stato iniziale e invece uscenti dal vertice quelli dello stato finale. La regola da seguire è la seguente: la somma dei momenti entranti in un vertice deve coincidere con la somma dei momenti uscenti dallo stesso vertice, ossia il quadrimomento è conservato su ogni singolo vertice. In questo modo, si capisce qual è il momento relativo al propagatore; iii. in Q.E.D. il fattore di simmetria 1/n! si cancella sempre quando ci sono più diagrammi di Feynman topologicamente equivalenti che descrivono lo stesso processo fisico, ma ciò non è vero per una generica teoria di campo. Quest’ultima considerazione, comunque, non interessa per quelli che sono i nostri scopi.
148
CAPITOLO 4. QUANTUM ELECTRODYNAMICS (Q.E.D.)
Appendice A Funzionali e derivata funzionale Un funzionale F è una mappa da una varietà di funzioni (C ) in R o C: C −→ R, C f 7−→ F[ f ] In fisica siamo interessati prevalentemente a funzionali su R, come per esempio l’azione 2.15. La lagrangiana e l’hamiltoniana di una teoria di campo Z
L(t) =
Z
L (~x,t)d x 3
H(t) =
H (~x,t)d 3 x
possono essere considerate come dei funzionali qualora decidiamo di calcolarle in un istante t fissato: in questo caso, t è un semplice parametro e L e H diventano funzionali dei campi calcolati ad un istante t fissato L = L[ϕt (x)] = L[ϕ(~x,t)] H = H[ϕt (x)] = H[ϕ(~x,t)] dove i campi ϕ calcolati in un istante t fissato sono delle funzioni
R3 −→ R ~x 7−→ ϕt (~x) Definendo la variazione di un funzionale come δ F = F[g + δ g] − F[g] allora possiamo definire la derivata funzionale rispetto ad una funzione g D −→ R, C x 7−→ g(x) come la quantità
δF δg
tale che Z
δ F[ϕ] = D
δF δg
δg
Essa, come suggerisce il nome, gode di tutte le proprietà di cui godono le derivate di funzioni continue, ossia: 149
150
APPENDICE A. FUNZIONALI E DERIVATA FUNZIONALE
1. è un operatore lineare; 2. si annulla se calcolata per funzionali costanti; 3. soddisfa la regola di composizione di Leibnitz (derivata del prodotto). Ogni funzione può essere scritta come il funzionale identità, ossia Z
g(y) =
δ (x − y)g(x)d x ≡ FID [g]
In base alla definizione, allora, la derivata funzionale del funzionale identità è δ g(y) = δ (x − y) δ g(x) In particolare: • nel caso 4-dimensionale δ ϕ(~x,t) = δ 3 (~x −~y)δ (t − t 0 ) = δ 4 (x − y) δ ϕ(~y,t 0 ) • per campi calcolati a t fissato δ ϕt (~x) = δ 3 (~x −~y) δ ϕt (~y) ESERCIZIO: calcoliamo L’hamiltoniana è
δ Ht δ ϕt
e
δ Ht δ πt .
Z
H[ϕt , πt ] =
H (ϕt , πt )d 3 x
Considerando ora la variazione sincrona dell’hamiltoniana, le derivate funzionali per definizione tali che Z δ Ht δ Ht δ0 H[ϕt , πt ] = δ0 ϕt + δ0 πt d 3 x δ ϕt δ πt
δ Ht δ ϕt
e
δ Ht δ πt
sono
Calcoliamo esplicitamente la variazione sincrona di H[ϕt , πt ]: Z Z ∂H ∂H 3 δ0 H[ϕt , πt ] = δ0 H (ϕt , πt )d x = δ0 ϕt + δ0 πt d 3 x ∂ ϕt ∂ πt da cui si ottiene dunque che 1 δ Ht ∂H ˙ x,t) = = −π(~ δ ϕt (~x) ∂ ϕt
δ Ht ∂H ˙ x,t) = = ϕ(~ δ πt (~x) ∂ πt
sfruttando le equazioni di Hamilton. 1
NB: si noti ora che le variabili indipendenti ora sono solamente ϕt e πt , dunque eventuali termini del tipo in generale non sono nulli. Si consiglia di calcolare esplicitamente le variazioni per trovare la corretta forma delle derivate funzionali. ∂ ∂µ ϕ ∂ϕ
151 ESERCIZIO: verifichiamo la forma delle equazioni di Hamilton tramite le parentesi di Poisson e le proprietà delle parentesi di Poisson2 : Z δ ϕ (~x) δ H δ ϕ (~ x) δ Ht ∂H δ H t t t t ˙ − d3y = = ϕ = {ϕt (~x), Ht } = δ ϕt (~y) δ πt (~y) δ πt (~y) δ ϕt (~y) δ πt (~x) ∂ πt | {z } | {z } δ 3 (~x−~y)
{ϕt (~x), ϕt (~y)} =
Z
δ ϕt (~x) δ πt (~y) δ ϕt (~x) δ πt (~y) − d 3 z = δ 3 (~x −~y) δ ϕ (~ z) δ π (~ z) δ π (~ z) δ ϕ (~ y) t t t t | {z } | {z } | {z } | {z } δ 3 (~x−~z) δ 3 (~y−~z)
2
0
0
0
Faremo solo due delle cinque dimostrazioni richieste. Il resto è lasciato per esercizio.
152
APPENDICE A. FUNZIONALI E DERIVATA FUNZIONALE
Appendice B Meccanica quantistica - visuali di Schrödinger e di Heisenberg La visuale di Schrödinger della meccanica quantistica prevede che, dato un sistema fisico, l’evoluzione temporale del sistema stesso coinvolga gli stati e non le osservabili: ( |ψ(t)iS = U(t,t0 )|ψ(t0 )iS (B.1) AS (t) = AS (t0 ) dove U(t,t0 ) è l’operatore unitario di evoluzione temporale. Imponendo che gli stati soddisfino l’equazione di Schrödinger 1 si ricava che i
d U(t,t0 ) = HU(t,t0 ) dt
da cui l’operatore di evoluzione temporale U(t,t0 ) = e−iH(t−t0 )
(B.2)
che soddisfa la proprietà U(t0 ,t0 ) = 1. La visuale di Heisenberg della meccanica quantistica prevede invece che, dato un sistema fisico, l’evoluzione temporale del sistema stesso coinvolga le osservabili e non gli stati: ( |ψ(t)iH = |ψ(t0 )iH (B.3) AH (t) = U + (t,t0 )AH (t0 )U(t,t0 ) dove U(t,t0 ) è l’operatore B.2. Derivando la seconda equazione delle B.3 si ottiene l’equazione di Heisenberg d i AH (t) = [AH (t), H] (B.4) dt Il passaggio da una visuale all’altra è possibile attraverso le trasformazioni unitarie ( |ψ(t)iH = U + (t,t0 )|ψ(t)iS AH (t) = U + (t,t0 )AS (t)U(t,t0 ) Le due visuali sono del tutto equivalenti: è possibile verificare che le variabili fisiche, ossia i valori medi delle osservabili, non dipendono dalla visuale scelta, cioè < AH >H =< AS >S 153
154APPENDICE B. MECCANICA QUANTISTICA - VISUALI DI SCHRÖDINGER E DI HEISENBERG
Appendice C Tensore di Levi-Civita
155
156
APPENDICE C. TENSORE DI LEVI-CIVITA
Appendice D Gammologia Riportiamo di seguito le proprietà delle matrici γ introdotte nella teoria di Dirac. 1. Algebra di Clifford: {γ µ , γ ν } = 2η µν con
(γ0 )2 = (γ5 )2 = 1
{γ µ , γ5 } = 0 (γi )2 = −1
2. Proprietà di contrazione (si sottintende sempre l’indentità 1) : γ µ γµ = 4 γ µ γ ν γµ = −2γ ν γ µ γ ν γ ρ γµ = 4η νρ 3. Proprietà della traccia: Tr[γµ ] = Tr[γ5 ] = 0 Tr[γ µ γ ν ] = 4η µν Tr[γ µ γ ν γ ρ ] = 0 = Tr[numero dispari di matrici γ] Tr[γ µ γ ν γ ρ γ σ ] = 4(η µν η ρσ − η µρ η νσ + η µσ η νρ ) Tr[γ µ γ5 ] = Tr[γ µ γ ν γ5 ] = Tr[γ µ γ ν γ ρ γ5 ] = · · · = 0 Tr[γ µ γ ν γ ρ γ σ γ5 ] = −4iε µνρσ
(unico caso non nullo)
4. Le matrici γ possono costituire una base per le matrici 4 × 4. Ogni matrice A 4 × 4 può essere infatti scritta come A = ∑ cα Γα α
dove il coefficiente della combinazione lineare è cα = 41 Tr[AΓα ], dove Γ è la seguente base: Γ = {1, γ5 , γµ , iγ5 γµ , σˆ µν } Il simbolo di "cappuccio" sopra la σµν indica che si stanno considerando le sole componenti indipendenti di questo tensore che, essendo antisimmetrico, sono 6: in pratica, per esempio, contano una volta i termini σi j e σ ji = −σi j . Come nel caso 2 × 2 le matrici possono essere scritte come combinazione lineare dell’identità e delle 3 matrici di Pauli, per un totale di 4 matrici di base, nel caso 4 × 4 ci sono 4 · 4 = 16 matrici di base. 157