K. Lechner - Campi Elettromagnetici

  • December 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View K. Lechner - Campi Elettromagnetici as PDF for free.

More details

  • Words: 139,145
  • Pages: 415
CAMPI ELETTROMAGNETICI

Kurt Lechner

Prefazione Le conoscenze sperimentali e teoriche acquisite finora sul comportamento della materia a livello microscopico, portano a concludere che l’interezza dei fenomeni fisici microscopici pu`o essere interpretata assumendo che tutta la materia sia costituita da particelle elementari puntiformi, soggette a solo quattro tipi di interazioni fondamentali: gravitazionale, elettromagnetica, debole e forte. Tra queste l’interazione gravitazionale `e quella nota da pi` u tempo, mentre quella elettromagnetica `e la pi` u studiata avendo trovato una sua solida formulazione teorica nell’Elettrodinamica Quantistica, a met`a del secolo scorso. La quasi totalit`a dei fenomeni fisici quotidiani – dalla stabilit`a della materia alla propagazione della luce – `e infatti riconducibile a questa teoria. Le interazioni deboli e forti, che a differenza di quelle elettromagnetica e gravitazionale si manifestano solo a distanze microscopiche, hanno trovato una formulazione analoga nell’ambito del Modello Standard delle particelle elementari – che include la stessa Elettrodinamica Quantistica – mentre l’interazione gravitazionale risulta tuttora in conflitto con le leggi della Meccanica Quantistica, nonostante i progressi maturati nell’ambito della Teoria delle Superstringhe. Nonostante il comune ruolo di mediatrici dell’azione reciproca tra i costituenti elementari della natura, ciascuna delle quattro interazioni fondamentali `e contrassegnata da propriet`a esclusive tali da comportare fenomeni fisici peculiari. Cos`ı le interazioni forti sono le sole a dar luogo al fenomeno del confinamento, che confina i quark e i gluoni all’interno dei nucleoni, mentre le interazioni deboli sono le uniche ad essere mediate da particelle massive, le W ± e la Z 0 . Analogamente l’interazione elettromagnetica `e l’unica a essere mediata da particelle – i fotoni – le quali, non essendo dotate di carica elettrica non sono soggette a loro volta a un’interazione elettromagnetica reciproca. E infine, l’interazione gravitazionale `e l’unica che si esercita tra tutte le particelle elementari, compresi i mediatori delle interazioni stesse. Di fronte a queste distinzioni importanti appare alquanto sorprendente come le quattro interazioni fondamentali siano rette da un’impalcatura teorica comune, che ne determina fortemente la struttura generale; impalcatura elegante nella sua forma e matematicamente solida, le cui profonde origini fisiche sono in parte ancora da scoprire. Tra i pilastri

principali di questa impalcatura unificante ricordiamo i seguenti: tutte le interazioni fondamentali soddisfano il principio di relativit`a einsteiniana e ammettono una formulazione covariante a vista, con conseguente conservazione del quadrimomento e del momento angolare quadridimensionale. Ciascunca delle interazioni `e mediata da una o pi` u particelle bosoniche, rappresentate a livello classico da un insieme di campi vettoriali {Aµ }, la cui dinamica `e controllata da un’invarianza di gauge locale. Il teorema di Noether associa poi a ciascun bosone vettore una grandezza conservata. Infine, il pilastro forse pi` u misterioso ma non per questo meno fondante `e rappresentato dal fatto che l’intera dinamica riguardante l’insieme delle interazioni fondamentali pu`o essere dedotta da un principio variazionale. Il presente testo costituisce un trattato sull’Elettrodinamica classica di particelle puntiformi, ed `e stato costruito attorno agli argomenti svolti nel corso “Campi Elettromagnetici” che ho tenuto negli anni accademici 2004/05–2008/09 per la Laurea Magistrale in Fisica presso l’Universit`a di Padova. Nella sua stesura mi sono fatto guidare in prima linea dall’intento di enucleare gli aspetti che accomunano l’Elettrodinamica alle altre interazioni fondamentali – vale a dire i pilastri sopra nominati – mettendo anche in evidenza, ove possibile, analogie e differenze. La rinuncia pi` u pesante che questa impostazione ha comportato consiste nell’aver trascurato quasi completamente l’argomento importante dei campi elettromagnetici nei materiali. Le altre linee guida che ho seguito si riassumono come segue. Ho cercato di formulare l’Elettrodinamica classica come una teoria basata su un sistema di postulati – essenzialmente il principio di relativit`a einsteininana e le equazioni di Maxwell e di Lorentz – da cui l’intera e ricca fenomenologia delle interazioni elettromagnetiche tra particelle cariche pu`o essere dedotta in modo stringente. Per poter impostare queste equazioni in modo matematicamente rigoroso `e indispensabile ambientarle nello spazio delle distribuzioni. Particolare attenzione `e poi stata dedicata alle propriet`a di consistenza interna e fisica dell’Elettrodinamica. In questo contesto viene svolta un’analisi accurata delle divergenze ultraviolette che accompagnano la reazione di radiazione, e che rendono l’Elettrodinamica classica – in ultima analisi – una teoria internamente inconsistente. Ogni argomento teorico `e illustrato con una serie di esempi fisicamente rilevanti che vengono svolti in

dettaglio, cos`ı come l’introduzione di ogni nuovo strumento matematico viene motivata e accompagnata da esemplificazioni pratiche. Infine, la soluzione dei problemi proposti a conclusione dei capitoli comporta una migliore comprensione di alcuni argomenti trattati nel testo, pur non condizionando la comprensione dei capitoli successivi. Organizzazione del materiale. A grandi linee gli argomenti del testo sono suddivisi in tre parti. La prima parte (capitoli 1–4) espone le basi concettuali e matematiche su cui si fonda la costruzione dell’Elettrodinamica di un sistema di particelle cariche puntiformi. Questa parte iniziale presenta in particolare gli strumenti matematici necessari per una formulazione precisa della teoria, vale a dire il formalismo covariante come sede naturale di una qualsiasi teoria relativistica, e la teoria delle distribuzioni, strumento indispensabile per una trattazione corretta delle singolarit`a implicate dalla natura puntiforme delle particelle cariche. Dopo l’introduzione delle equazioni fondamentali dell’Elettrodinamica – le equazioni di Maxwell e di Lorentz – e una loro analisi strutturale preliminare, si analizzano le leggi di conservazione da esse implicate. Conclude la prima parte l’introduzione del metodo variazionale. Questo metodo viene presentato come approccio alternativo per la formulazione di una generica teoria di campo che ne codifica la dinamica in modo conciso ed elegante, e come ingrediente fondamentale per la validit`a del teorema di Noether. Lo stretto nesso esistente in generale tra questo teorema e il principio variazionale viene poi esemplificato in dettaglio nel caso dell’Elettrodinamica di particelle puntiformi. La seconda parte (capitoli 5–11) – la pi` u estesa – verte maggiormente sulle applicazioni dell’Elettrodinamica e comprende in particolare una trattazione sistematica della generazione di campi elettromagnetici da parte di particelle cariche in moto arbitrario, e un’analisi approfondita del fenomeno dell’irraggiamento, sia nel limite non relativistico che in quello ultrarelativistico. Cos`ı si svolge un’analisi sistematica delle distribuzioni angolare e spettrale della radiazione emessa in diverse situazioni fisicamente rilevanti, come ad esempio quelle riguardanti le antenne, gli acceleratori ultrarelativistici, le collisioni tra particelle cariche e la diffusione della radiazione da parte di particelle cariche. In questa parte vengono inoltre trattati in dettaglio alcuni argomenti che nei libri di testo raramente vengono presentati in modo sistematico. Cos`ı si risolve, ad esempio, il problema del campo elettromagnetico creato da una particella carica priva di massa, si esegue un confronto

dettagliato tra la radiazione elettromagnetica e quella gravitazionale, e si presenta una trattazione teorica sistematica dell’effetto Cerenkov. La terza parte (capitoli 12–13) verte su argomenti pi` u speculativi, e delicati, che nei testi spesso vengono trattati con superficialit`a. Il capitolo 12 `e dedicato alla reazione di radiazione e affronta con cura il problema delle divergenze ultraviolette da cui essa `e inevitabilmente affetta. Lo scopo di questo capitolo `e doppio: da un lato si vogliono enucleare le motivazioni teoriche che ci costringono a sostituire l’equazione di Lorentz (divergente) – un dogma dell’Elettrodinamica classica – con l’equazione di Lorentz–Dirac. Dall’altro si vuole illustrare come l’Elettrodinamica che emerge da questa sostituzione `e affetta da un’inconsistenza interna incurabile, che muta solo di aspetto a seconda del punto di vista pragmatico che si assume. La seconda parte di questo capitolo `e dedicata all’altro “problema antico” dell’Elettrodinamica, rappresentato dall’energia infinita del campo elettromagnetico creato da una particella puntiforme, che mina la stessa legge di conservazione dell’energia. Sorprendentemente, questo problema ha trovato una sua soluzione solo una trentina di anni fa, e noi ne presenteremo una versione alternativa in una veste pi` u moderna, nell’ambito della teoria delle distribuzioni. Infine, il capitolo 13 `e dedicato ai monopoli magnetici e ha lo scopo di illustrare come l’Elettrodinamica – pur essendo basata su un sistema di postulati molto rigidi – `e perfettamente compatibile con l’esistenza in natura di questo nuovo tipo di particelle cariche. Prerequisiti. Si suppone che il lettore di questo testo possegga conoscenze di base di Elettromagnetismo classico e abbia familiarit`a con le equazioni di Maxwell e Lorentz scritte in forma covariante a vista, e in generale con l’uso dei tensori quadridimensionali. L’origine fisica e gli elementi fondamentali del calcolo tensoriale vengono comunque richia` anche richiesto un mati con un certo grado di completezza e rigore logico nel capitolo 1. E minimo di familiarit`a con la teoria delle distribuzioni, in particolare con la distribuzione δ di Dirac. Tuttavia, gli elementi essenziali riguardanti le distribuzioni e necessari per la comprensione del testo sono presentati in modo succinto nel capitolo 2. Infine `e utile, ma non indispensabile, conoscere il metodo variazionale relativo a un sistema lagrangiano con un numero finito di gradi di libert`a. Padova, dicembre 2008

Kurt Lechner

Indice 1 I fondamenti della Relativit` a Ristretta

1

1.1

I postulati della Relativit`a . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.2

Trasformazioni di Lorentz e di Poincar´e . . . . . . . . . . . . . . . . . . . .

3

1.2.1

Linearit`a delle trasformazioni . . . . . . . . . . . . . . . . . . . . .

3

1.2.2

Invarianza dell’intervallo . . . . . . . . . . . . . . . . . . . . . . . .

4

Leggi fisiche covarianti a vista . . . . . . . . . . . . . . . . . . . . . . . . .

6

1.3.1

8

1.3

1.4

Struttura del gruppo di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . 11 1.4.1

1.5

Calcolo tensoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Trasformazioni infinitesime e trasformazioni finite . . . . . . . . . . 12

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Le equazioni dell’Elettrodinamica

16

2.1

Cinematica di una particella relativistica . . . . . . . . . . . . . . . . . . . 16

2.2

L’Elettrodinamica di particelle puntiformi . . . . . . . . . . . . . . . . . . 19

2.3

2.4

2.2.1

Equazione di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2.2

Identit`a di Bianchi . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.2.3

Equazione di Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . 25

La natura distribuzionale del campo elettromagnetico . . . . . . . . . . . . 30 2.3.1

Lo spazio delle distribuzioni . . . . . . . . . . . . . . . . . . . . . . 31

2.3.2

Operazioni sulle distribuzioni . . . . . . . . . . . . . . . . . . . . . 33

2.3.3

Identit`a di Bianchi e forme differenziali . . . . . . . . . . . . . . . . 37

2.3.4

Il campo elettromagnetico della particella statica . . . . . . . . . . 40

Le costanti del moto dell’Elettrodinamica . . . . . . . . . . . . . . . . . . . 44 2.4.1

Conservazione e invarianza della carica elettrica . . . . . . . . . . . 44

2.4.2

Tensore energia–impulso e conservazione del quadrimomento . . . . 47

2.4.3

Il tensore energia–impulso dell’Elettrodinamica . . . . . . . . . . . 49

2.4.4

Conservazione del momento angolare . . . . . . . . . . . . . . . . . 55

2.5

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3 Metodi variazionali in teoria di campo

64

3.1

Principio di minima azione in meccanica classica . . . . . . . . . . . . . . . 67

3.2

Principio di minima azione in teoria di campo . . . . . . . . . . . . . . . . 69

3.3

3.4

3.2.1

Ipersuperfici nello spazio di Minkowski . . . . . . . . . . . . . . . . 72

3.2.2

Invarianza relativistica . . . . . . . . . . . . . . . . . . . . . . . . . 75

3.2.3

La lagrangiana per l’equazione di Maxwell . . . . . . . . . . . . . . 79

Il Teorema di Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 3.3.1

Trasformazioni di Poincar´e infinitesime . . . . . . . . . . . . . . . . 85

3.3.2

Teorema di Noether per il gruppo di Poincar´e . . . . . . . . . . . . 87

3.3.3

Tensore energia–impulso canonico per il campo di Maxwell . . . . . 92

Costruzione di un tensore energia–impulso simmetrico . . . . . . . . . . . . 93 3.4.1

Tensore energia–impulso simmetrico per il campo di Maxwell . . . . 96

3.5

Densit`a di momento angolare “standard” . . . . . . . . . . . . . . . . . . . 97

3.6

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

4 Il metodo variazionale per l’Elettrodinamica di particelle puntiformi

101

4.1

Principio variazionale per una particella libera . . . . . . . . . . . . . . . . 101

4.2

L’azione per l’Elettrodinamica . . . . . . . . . . . . . . . . . . . . . . . . . 103

4.3

Il teorema di Noether in Elettrodinamica . . . . . . . . . . . . . . . . . . . 107

4.4

Invarianza di gauge e conservazione della carica elettrica . . . . . . . . . . 112

4.5

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5 Onde elettromagnetiche 5.1

5.2

115

I gradi di libert`a del campo elettromagnetico . . . . . . . . . . . . . . . . . 116 5.1.1

I gradi di libert`a in meccanica newtoniana . . . . . . . . . . . . . . 116

5.1.2

I gradi di libert`a in teoria di campo . . . . . . . . . . . . . . . . . . 117

5.1.3

Il problema di Cauchy per l’equazione di Maxwell . . . . . . . . . . 118

L’equazione delle onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 5.2.1

Il problema alle condizioni iniziali . . . . . . . . . . . . . . . . . . . 129

5.3

Soluzioni dell’equazione di Maxwell nel vuoto . . . . . . . . . . . . . . . . 131 5.3.1

Propriet`a delle onde elettromagnetiche elementari . . . . . . . . . . 134

5.3.2

Onde piane ed elicit`a . . . . . . . . . . . . . . . . . . . . . . . . . . 139

5.3.3

Onde elettromagnetiche e invarianza di gauge manifesta . . . . . . . 145

5.4

Effetto Doppler relativistico . . . . . . . . . . . . . . . . . . . . . . . . . . 151

5.5

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

6 Generazione di campi elettromagnetici 6.1

6.2

6.3

6.4

6.5

Il metodo della funzione di Green: equazione di Poisson . . . . . . . . . . . 158 6.1.1

Una soluzione particolare . . . . . . . . . . . . . . . . . . . . . . . . 159

6.1.2

Validit`a della soluzione e soluzione generale . . . . . . . . . . . . . 163

Il campo generato da una corrente generica . . . . . . . . . . . . . . . . . . 166 6.2.1

La funzione di Green ritardata . . . . . . . . . . . . . . . . . . . . . 169

6.2.2

Il potenziale vettore ritardato . . . . . . . . . . . . . . . . . . . . . 174

6.2.3

Validit`a della soluzione e trasformata di Fourier . . . . . . . . . . . 176

Campo di una particella in moto rettilineo uniforme . . . . . . . . . . . . . 178 6.3.1

Campo di una particella massiva . . . . . . . . . . . . . . . . . . . 179

6.3.2

Campo di una particella di massa nulla . . . . . . . . . . . . . . . . 183

Campo di una particella in moto arbitrario . . . . . . . . . . . . . . . . . . 187 6.4.1

Condizioni asintotiche. . . . . . . . . . . . . . . . . . . . . . . . . . 188

6.4.2

I campi di Lienard–Wiechert . . . . . . . . . . . . . . . . . . . . . . 190

6.4.3

Emissione di radiazione da cariche accelerate . . . . . . . . . . . . . 198

6.4.4

Limite non relativistico e formula di Larmor . . . . . . . . . . . . . 201

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

7 Irraggiamento 7.1

157

206

Il campo elettromagnetico nella zona delle onde . . . . . . . . . . . . . . . 208 7.1.1

Emissione di quadrimomento . . . . . . . . . . . . . . . . . . . . . . 211

7.1.2

Sorgenti monocromatiche e onde piane . . . . . . . . . . . . . . . . 212

7.2

La radiazione dell’antenna lineare . . . . . . . . . . . . . . . . . . . . . . . 214

7.3

Sviluppi non relativistici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218

7.3.1

Sviluppo in multipoli . . . . . . . . . . . . . . . . . . . . . . . . . . 218

7.3.2

La radiazione di dipolo . . . . . . . . . . . . . . . . . . . . . . . . . 220

7.3.3

Potenza emessa da un’antenna lineare corta . . . . . . . . . . . . . 226

7.3.4

Diffusione Thomson della radiazione . . . . . . . . . . . . . . . . . 228

7.3.5

Bremsstrahlung dall’interazione coulombiana . . . . . . . . . . . . . 234

7.3.6

La radiazione dell’atomo d’idrogeno classico . . . . . . . . . . . . . 240

7.4

Radiazione di quadrupolo elettrico e di dipolo magnetico . . . . . . . . . . 242

7.5

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

8 La radiazione gravitazionale

252

8.1

Onde gravitazionali e onde elettromagnetiche . . . . . . . . . . . . . . . . . 252

8.2

Le equazioni per un campo gravitazionale debole. . . . . . . . . . . . . . . 253 8.2.1

8.3

La relazione con le equazioni di Einstein . . . . . . . . . . . . . . . 255

Irraggiamento gravitazionale . . . . . . . . . . . . . . . . . . . . . . . . . . 258 8.3.1

Un argomento euristico per la formula di quadrupolo . . . . . . . . 259

8.4

La potenza della radiazione di quadrupolo . . . . . . . . . . . . . . . . . . 261

8.5

La pulsar binaria PSR 1913+16 . . . . . . . . . . . . . . . . . . . . . . . . 264

8.6

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268

9 Irraggiamento ultrarelativistico 9.1

9.2

269

Generalizzazione relativistica della formula di Larmor . . . . . . . . . . . . 270 9.1.1

Un argomento di covarianza . . . . . . . . . . . . . . . . . . . . . . 271

9.1.2

Deduzione della formula di Larmor relativistica . . . . . . . . . . . 273

Perdita di energia negli acceleratori . . . . . . . . . . . . . . . . . . . . . . 276 9.2.1

Acceleratori lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 278

9.2.2

Acceleratori circolari . . . . . . . . . . . . . . . . . . . . . . . . . . 279

9.3

Distribuzione angolare nel limite ultrarelativistico . . . . . . . . . . . . . . 281

9.4

Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

10 Analisi spettrale

286

10.1 Analisi di Fourier e risultati generali . . . . . . . . . . . . . . . . . . . . . 286

10.2 Analisi spettrale nel limite non relativistico . . . . . . . . . . . . . . . . . . 289 10.2.1 Bremsstrahlung a spettro continuo e catastrofe infrarossa . . . . . . 291 10.2.2 Bremsstrahlung a spettro discreto . . . . . . . . . . . . . . . . . . . 294 10.3 Analisi spettrale relativistica . . . . . . . . . . . . . . . . . . . . . . . . . . 296 10.3.1 Spettro di emissione di una particella singola . . . . . . . . . . . . . 297 10.3.2 Frequenze caratteristiche nel limite ultrarelativistico . . . . . . . . . 300 10.4 La radiazione del ciclotrone . . . . . . . . . . . . . . . . . . . . . . . . . . 303 10.4.1 Analisi spettrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 10.4.2 Lo spettro nel limite ultrarelativistico . . . . . . . . . . . . . . . . . 305 10.4.3 Distribuzione angolare . . . . . . . . . . . . . . . . . . . . . . . . . 307 10.4.4 Luce di sincrotrone . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 10.5 Spettro di emissione di una corrente generica . . . . . . . . . . . . . . . . . 310 10.5.1 Corrente periodica . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 10.5.2 Corrente aperiodica . . . . . . . . . . . . . . . . . . . . . . . . . . . 313 11 L’effetto Cerenkov 11.1 Campo di una particella in moto rettilineo uniforme in un mezzo c 11.2 Il campo per v < . . . . . . . . . . . . . . . . . . . . . . . . . n 11.2.1 Analisi in frequenza . . . . . . . . . . . . . . . . . . . . . c 11.3 Il campo per v > . . . . . . . . . . . . . . . . . . . . . . . . . n 11.3.1 Il campo nella zona delle onde e l’angolo di Cerenkov . .

315 . . . . . . 316 . . . . . . 318 . . . . . . 319 . . . . . . 323 . . . . . . 325

11.4 Mezzi dispersivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 11.5 Perdita di energia ed emissione di fotoni . . . . . . . . . . . . . . . . . . . 331 11.5.1 Un argomento euristico . . . . . . . . . . . . . . . . . . . . . . . . . 331 11.5.2 La formula di Frank e Tamm . . . . . . . . . . . . . . . . . . . . . 333 11.6 Rivelatori Cerenkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 12 La reazione di radiazione

338

12.1 Forze di frenamento: analisi preliminare . . . . . . . . . . . . . . . . . . . 341 12.1.1 Un argomento euristico per l’equazione di Lorentz–Dirac . . . . . . 343 12.2 L’equazione di Lorentz–Dirac . . . . . . . . . . . . . . . . . . . . . . . . . 344

12.2.1 Derivazione dell’equazione . . . . . . . . . . . . . . . . . . . . . . . 346 12.2.2 Determinazione dell’autocampo regolarizzato . . . . . . . . . . . . . 350 12.2.3 Caratteristiche dell’equazione di Lorentz–Dirac . . . . . . . . . . . . 351 12.2.4 La particella carica libera: soluzione esatta . . . . . . . . . . . . . . 355 12.2.5 Moto in campo costante: preaccelerazione . . . . . . . . . . . . . . 358 12.3 L’equazione integro–differenziale di Rohrlich . . . . . . . . . . . . . . . . . 361 12.3.1 Preaccelerazione e violazione della causalit`a . . . . . . . . . . . . . 363 12.4 Il problema relativistico a due corpi . . . . . . . . . . . . . . . . . . . . . . 366 12.4.1 Espansione non relativistica . . . . . . . . . . . . . . . . . . . . . . 368 12.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 13 Un tensore energia–impulso privo di singolarit` a

375

13.1 Linee guida della costruzione . . . . . . . . . . . . . . . . . . . . . . . . . . 377 13.2 Costruzione di Θµν em per la particella libera . . . . . . . . . . . . . . . . . . 380 13.2.1 Esistenza di Θµν em . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381 13.2.2 Conservazione di Θµν em . . . . . . . . . . . . . . . . . . . . . . . . . . 384 13.2.3 Una definizione operativa dell’energia elettromagnetica . . . . . . . 386 13.3 Costruzione generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387 14 Monopoli magnetici

390

14.1 La dualit`a elettromagnetica . . . . . . . . . . . . . . . . . . . . . . . . . . 391 14.2 L’Elettrodinamica classica in presenza di dioni . . . . . . . . . . . . . . . . 393 14.2.1 Leggi di conservazione . . . . . . . . . . . . . . . . . . . . . . . . . 395 14.3 La condizione di quantizzazione di Dirac . . . . . . . . . . . . . . . . . . . 397 14.3.1 Una carica e un monopolo . . . . . . . . . . . . . . . . . . . . . . . 397 14.3.2 Il momento angolare del sistema . . . . . . . . . . . . . . . . . . . . 399 14.3.3 Consistenza quantistica e condizione di quantizzazione di Dirac . . 401

1

I fondamenti della Relativit` a Ristretta

L’Elettrodinamica classica costituisce il prototipo per eccellenza di una teoria relativistica, avendo contribuito in modo determinante alla nascita della Relativit`a stessa. Il principio guida della relativit` a einsteiniana, che afferma che tutte le leggi della Fisica devono avere la stessa forma in tutti i sistemi di riferimento inerziali, `e emerso con forza da questa teoria ed `e andato consolidandosi sempre di pi` u man mano che le nostre conscenze del mondo microscopico si sono ampliate e approfondite. L’implementazione pi` u naturale ed elegante di questo principio, di fatto l’unica di una vera utilit`a, avviene attraverso il paradigma della “covarianza a vista” realizzato nell’ambito del calcolo tensoriale. Questo paradigma ha mostrato possedere carattere universale essendo stato applicato con successo a qualsiasi teoria di tipo fondamentale, come le teorie che descrivono le quattro interazioni fondamentali o la pi` u speculativa Teoria delle superstringhe, e mantiene per di pi` u la sua piena validit`a anche a livello quantistico. La presentazione dell’Elettrodinamica fornita in questo testo si baser`a cos`ı con forza, e diremo a ragione, su questo paradigma. In questo capitolo introduttivo ripercorreremo innanzitutto i tratti essenziali del percorso logico che ha portato dai postulati della Relativit`a alla formulazione del paradigma ` infatti importante tenere presente quali sono le assunzioni della covarianza a vista. E apriorstiche fatte nella costruzione di una teoria, e distinguere le conseguenze inevitabili di tali assunzioni dalle conseguenze di eventuali ipotesi aggiuntive formulate strada facendo. Riassumeremo poi in particolare gli elementi fondamentali del calcolo tensoriale di cui faremo ampio uso in questo testo. Nella parte finale del capitolo anlizzeremo in dettaglio la struttura del gruppo di Poincar´e per via della sua connessione intima con le leggi di conservazione, connessione che verr`a sviscerata pi` u avanti.

1.1

I postulati della Relativit` a

La Meccanica Newtoniana e la teoria della Relativit`a Ristretta si basano su alcune assunzioni aprioristiche comuni sulle propriet`a dello spazio vuoto e del tempo, mentre si distinguono in modo fondamentale attraverso i “principi di relativit`a” su cui ciascuna delle due teorie `e basata.

1

Le assunzioni in comune sono costituite dalle propriet`a dello spazio vuoto di essere omogeneo e isotropo, e dall’omogeneit`a del tempo. Inoltre le leggi fisiche di entrambe le teorie sono formulate rispetto a una classe particolare di sistemi di riferimento, i riferimenti inerziali, ed entrambe implementano l’equivalenza fisica di tutti questi riferimenti attraverso un principio di relativit`a. Il principio di relativit` a galileiana della Meccanica Newtoniana prevede che le leggi della meccanica mantengano la stessa forma sotto trasformazioni di Galileo da un sistema di riferimento a un altro, mentre il principio di relativit` a einsteiniana richiede che tutte le leggi della fisica abbiano la stessa forma in tutti i sistemi riferimenti, non facendo – a priori – nessuna ipotesi sul modo in cui trasformano lo spazio e il tempo. D’altra parte rispetto alla Meccanica Newtoniana la teoria della Relativit`a Ristretta rinuncia al paradigma dell’assolutezza degli intervalli spaziali e temporali, sostituendolo con il postulato della costanza della velocit`a della luce. In definitiva i postulati della fisica relativistica risultano i seguenti: I) Lo spazio `e isotropo e omogeneo, e il tempo `e omogeneo. II) La velocit`a della luce `e la stessa in tutti i sistemi di riferimento inerziali. III) Le leggi della fisica hanno la stessa forma in tutti i sistemi di riferimento inerziali. Per rendere operativi questi postulati, in particolare il postulato III) che pone forti restrizioni sulla forme delle leggi fisiche ammesse, `e necessario determinare innanzitutto la forma delle trasformazioni delle coordinate spazio–temporali da un sistema di riferimento a un altro. Prima di derivare la forma di queste trasformazioni dai postulati stessi specifichiamo le notazioni che adottiamo in questo testo. Indichiamo le coordinate spazio–temporali “controvarianti” di un evento con indici greci, µ, ν, · · · = (0, 1, 2, 3), xµ = (x0 , x1 , x2 , x3 ),

x0 = ct,

dove d’ora in poi la velocit`a della luce c verr`a posta uguale all’unit`a. Indichiamo le componenti puramente spaziali dell’evento con indici latini, i = (1, 2, 3, ), xi = (x1 , x2 , x3 ), 2

e scriveremo anche xµ = (x0 , xi ). Denotiamo inoltre la metrica di Minkowski, e la sua inversa, con, η µν = diag(1, −1, −1, −1) = ηµν ,

η µν ηνρ = δρµ .

Adottiamo poi la convenzione di Einstein della “somma sugli indici muti”, che sottintende il simbolo di sommatoria su un indice che compare due volte nella stessa espressione. La metrica di Minkowski permette di introdurre coordinate spazio–temporali “covarianti” secondo, xµ ≡ ηµν xν = (x0 , −x1 , −x2 − x3 ),

xµ = η µν xν .

Scrivendo xµ = (x0 , xi ) avremo quindi x0 = x0 , xi = −xi . Si dice che la metrica di Minkowski permette di abbassare e alzare gli indici.

1.2

Trasformazioni di Lorentz e di Poincar´ e

Come notato sopra, al contrario dei postulati della Meccanica Newtoniana i postulati della Relativit`a non specificano a priori la forma delle trasformazioni delle coordinate spazio–temporali nel passaggio da un sistema di riferimento a un altro; sono piuttosto i postulati stessi che determinano in modo univoco la forma delle trasformazioni permesse, che risulteranno essere le trasformazioni di Poincar´e. In questa sezione ripercorriamo brevemente la deduzione della forma di queste trasformazioni dai postulati, illustrando cos`ı l’estrema economia dei postulati stessi e sottolineando la solidit`a delle propriet`a formali che attraverso essi la Relativit`a Ristretta impone a tutte le leggi della fisica. 1.2.1

Linearit` a delle trasformazioni

Consideriamo un sistema di riferimento inerziali K, e in esso due eventi infinitesimamente vicini, con coordinate xµ e xµ + dxµ . Le coordinate in un altro sistema di riferimento K 0 saranno legate alle coordinate in K da una generica trasformazione x0µ = f µ (x). Se le funzioni f µ sono sufficientemente regolari le coordinate degli stessi due eventi in K 0 differiranno allora di, dx0µ =

∂f µ (x) ν dx ≡ Λµ ν (x) dxν . ∂xν

3

Tuttavia, per l’omogeneit`a dello spazio e del tempo, postulato I), la matrice Λµ ν (x) deve essere indipendente da x, e integrando si perci`o una relazione lineare tra le coordinate in K e K 0, x0µ = Λµ ν xν + aµ .

(1.1)

Per le coordinate covarianti si ottiene allora, e µ ν xν + a µ , x0µ = Λ

e µ ν ≡ ηµα η νβ Λα β . Λ

(1.2)

I quattro parametri aµ corrispondono ad arbitrarie traslazioni dello spazio e del tempo, che rappresentano in effetti una classe di trasformazioni permesse tra due sistemi di riferimento inerziali. D’altra parte ci si convince facilmente che per una scelta arbitraria dei 16 parametri Λµ ν la (1.1) in generale non corrisponde a una trasformazione da un sistema di riferimento inerziale a un altro. Per vederlo `e sufficiente considerare la scelta Λµ ν = k δ µ ν , corrispondente a una trasformazione di scala, che per k 6= 1 in generale non lascia invarianti le leggi della fisica. 1.2.2

Invarianza dell’intervallo

Per determinare la classe delle matrici Λ che corrispondono a trasformazioni tra sistemi di riferimento fisicamente permesse `e necessario ricorrere anche al postulato II), dimostrando “l’invarianza dell’intervallo”. Si definisce intervallo tra due eventi xµ e xµ + dxµ , con dxµ differenze infinitesime o anche finite, la quantit`a, ds2 ≡ dxµ dxν ηµν = dt2 − |d~x|2 , che si dimostra essere indipendente dal sistema di riferimento. Consideriamo, infatti, l’intervallo tra gli stessi due eventi in un altro sistema di riferimento K 0 . Per (1.1) si ha, ds02 = dx0µ dx0ν ηµν = dt02 − |d~x 0 |2 = Gµν dxµ dxν ,

(1.3)

dove la matrice simmetrica Gµν `e definita da, Gµν ≡ Λα µ Λβ ν ηαβ , e risulta indipendente dagli eventi considerati. Se i due eventi corrispondono al passaggio di un raggio di luce si ha evidentemente ds2 = 0, e vale anche il viceversa. Dal postulato 4

II) segue allora che, ds02 = 0



ds2 = 0



dt = ±|d~x|.

Concludiamo che la quantit`a ds02 , vista come polinomio del secondo ordine in dt, ha gli zeri in dt = ±|d~x|. La (1.3) permette allora di scrivere, ds02 = G00 (dt − |d~x|) (dt + |d~x|) = G00 ds2 ,

(1.4)

dove la quantit`a G00 pu`o dipendere solo dal moto relativo dei due riferimenti. In particolare, per l’invarianza per rotazioni – postulato I) – G00 pu`o dipendere solo dal modulo della velocit`a relativa, G00 (|~v |). Ma invertendo nella (1.4) i ruoli di K e K 0 avremmo ~v → −~v e quindi otterremmo G00 (|~v |) = 1/G00 (|~v |), e dunque G00 = 1. L’intervallo tra due eventi qualsiasi `e quindi lo stesso in tutti i sistemi di riferimento, ds2 = ds02 , e la (1.3) pone dunque, Gµν = ηµν . Concludiamo che le matrici Λ che compaiono nelle trasformazioni (1.1) tra due sistemi di riferimento sono soggette ai vincoli, Λα µ Λβ ν ηαβ = ηµν



ΛT η Λ = η.

(1.5)

L’insieme di queste matrici forma un gruppo di Lie, chiamato gruppo di Lorentz, che viene anche indicato con, O(1, 3) ≡ {Λ, matrici reali 4 × 4 /ΛT η Λ = η}. Due generici sistemi di riferimento sono pertanto collegati da una trasformazione lineare non omogenea del tipo (1.1), dove Λ `e un elemento del gruppo di Lorentz. L’insieme di queste trasformazioni forma a sua volta un gruppo di Lie che viene chiamato gruppo di Poincar´e, P. Gli elementi di questo gruppo sono identificati univocamente dalle coppie (Λα β , aµ ), P ≡ {(Λ, a) /Λ ∈ O(1, 3), a ∈ R4 }. 5

Il gruppo O(1, 3) `e omeomorfo al sottogruppo di P corrispondente ad a = 0, mentre gli elementi di P corrispondenti a Λµ ν = δ µ ν formano il sottogruppo delle traslazioni. Le trasformazioni delle coordinate (1.1) indotte dagli elementi del gruppo di Poincar´e vengono chiamate trasformazioni di Poincar´e, mentre le trasformazioni corrispondenti ad aµ = 0 vengono chiamate trasformazioni di Lorentz. Strettamente parlando quello che abbiamo dimostrato finora `e che una trasformazione che collega due sistemi di riferimento inerziali `e necessariamente una trasformazione di Poincar´e. A rigore dovremmo ancora convincerci che ogni trasformazione di Poincar´e corrisponde realmente al passaggio da un riferimento inerziale a un altro; `e ovvio che questo problema riguarda solo le trasformazioni di Lorentz in quanto le traslazioni hanno un significato fisico immediato. Affronteremo questa questione nella sezione 1.4.

1.3

Leggi fisiche covarianti a vista

Una volta determinata la forma delle trasformazioni delle coordinate da un sistema di riferimento a un altro possiamo procedere all’implementazione del postulato III), ovverosia allo sviluppo di una strategia che permetta di derivare leggi fisiche che soddisfano il principio di relativit`a einsteiniana. Prima di poter fare questo dobbiamo determinare il modo in cui si trasformano in generale le grandezze fisiche quando si passa da un riferimento a un altro. Cominciamo notando che il gruppo di Lorentz possiede come sottogruppo il gruppo delle rotazioni spaziali, vedi sezione 1.4, rappresentato dalle matrici 3 × 3 ortogonali Ri j , O(3) ≡ {R matrici reali 3 × 3 /RT R = I}. Questo gruppo costituisce un gruppo di invarianza “a vista” per le equazioni della Meccanica Newtoniana, in quanto queste genericamente sono scritte in forma tri–vettoriale. Esempi ne sono l’equazione di Newton stessa, F~ = m~a, oppure la formula per il momento angolare di un corpo rigido, Li = I ij ω j , dove I ij `e il tensore d’inerzia, X I ij = mn (xin xjn − rn2 δ ij ), n j

e ω `e lo pseudo–vettore velocit`a angolare. Notiamo comunque che le grandezze fisiche coinvolte sono raggruppate in vettori o tensori tridimensionali, che trasformano 6

linearmente sotto O(3). Abbiamo per esempio, F 0i = Ri j F j ,

I 0ij = Ri m Rj n I mn .

Essendo O(3) sottogruppo di O(1, 3) possiamo allora assumere che le grandezze fisiche che compaiono nelle leggi della fisica relativistica siano raggruppate in multipletti che trasformano linearmente sotto il gruppo di Lorentz. Nel linguaggio della teoria dei gruppi si dice che ciascuno di questi multipletti deve essere sede di una rappresentazione, riducibile o irriducibile, del gruppo di Lorentz. Da un risultato fondamentale della teoria delle rappresentazioni dei gruppi segue allora che questi multipletti devono formare “tensori quadridimensionali di rango (m, n)” sotto l’azione del gruppo di Lorentz. Per definizione un tensore quadridimensionale di rango (m, n) porta m indici controvarianti e n indici covarianti, ···µm TNM ≡ Tνµ11···ν , n

ed `e caratterizzato dalla specifica legge di trasformazione sotto una generica trasformazione di Poincar´e (1.1), che specificheremo tra un momento. Tensori di rango (0,0) vengono chiamati scalari, e tensori di rango (1,0) e (0,1) vengono chiamati vettori, rispettivamente controvarianti e covarianti. Pi` u in generale considereremo campi tensoriali di rango (m, n), che rispetto ai ten···µm sori esibiscono anche una dipendenza dalla coordinata quadridimensionale x, Tνµ11···ν (x). n

Per definizione la sua legge di trasformazione sotto una trasformazione di Poincar´e delle coordinate, x0 = Λx + a, `e data da, 1 ···µm e ν1 β1 · · · Λ e νn βn T α1 ···αm (x). Tν0µ1 ···ν (x0 ) = Λµ1 α1 · · · Λµm αm Λ β1 ···νn n

(1.6)

In particolare un campo tensoriale `e invariante per traslazioni. La legge di trasformazione di un tensore di rango (m, n) si ottiene semplicemente dalla (1.6) omettendo la dipendenza dalle coordinate spazio–temporali. In seguito per semplicit`a useremo la dicitura generica “tensore” sia per un campo tensoriale che per un tensore, in quanto sar`a chiaro dal contesto di che tipo di oggetto si sta trattando. Una volta accettato che le osservabili fisiche in una teoria relativistica si devono raggruppare in tensori quadridimensionali, l’implementazione del postulato III) – la relativit`a einsteiniana – avviene in analogia con la Meccanica Newtoniana. Cos`ı come le leggi 7

di quest’ultima eguagliando vettori tridimensionali a vettori tridimensionali rispettano automaticamente la richiesta di invarianza sotto rotazioni spaziali, le leggi della fisica relativistica avranno automaticamente la stessa forma in tutti i sistemi di riferimento inerziali, se sono scritte nel linguaggio quadritensoriale, cio`e, eguagliano quadritensori a N quadritensori. Se SM e TNM sono due tensori dello stesso rango schematicamente avremo

infatti, M (x) = TNM (x) in K SN



0M (x0 ) = TN0M (x0 ) in K 0 , SN

(1.7)

come si vede moltiplicando la prima equazione con un’opportuna serie di matrici Λ. Un’equazione scritta in forma quadritensoriale come la (1.7) si dice essere “covariante a vista”, in quanto soddisfa automaticamente il principio di relativit`a einsteiniana. In conclusione, il paradigma della covarianza a vista costituisce il metodo pi` u diretto ed efficace per implementare il postulato III) in una qualsiasi teoria relativistica: in ultima analisi questo pardigma risulta equivalente al postulato stesso in quanto non sono note leggi fisiche che hanno la stessa forma in tutti i riferimenti inerziali, ma non possono essere poste in forma covariante a vista. Di seguito riassumiamo gli elementi fondamentali del calcolo tensoriale in quanto strumento essenziale per la costruzione di equazioni covarianti a vista. 1.3.1

Calcolo tensoriale

Di seguito elenchiamo le operazioni principali che si possono eseguire sui tensori, lasciando eventuali dimostrazioni per lo pi` u come esercizio. Indici covarianti e controvarianti. Un tensore di rango (m, n) pu`o essere trasformato in un tensore di rango (m − k, n + k), alzando o abbassando k indici con la metrica di Minkowski. In generale il tensore ottenuto viene indicato ancora con lo stesso simbolo. Per esempio, per m = 2, n = 1 e k = 2 si scrive, Tαβρ = ηαµ ηβν T µν ρ . Di conseguenza un tensore di rango (m, n) `e equivalente a tutti gli effetti a un tensore di rango (m − k, n + k), motivo per cui come rango di un tensore si definisce spesso l’intero m + n. 8

Prodotti tra tensori. Il “prodotto” tra due tensori di rango (m, n) e (k, l) `e un tensore di rango (m + k, n + l). Contrazione degli indici e prodotti scalari. A partire da un tensore di rango (m, n) si possono costruire tensori di rango (m − k, n − k), contraendo k indici covarianti con k indici controvarianti. Per esempio, a partire da un tensore T µν ρ di rango (2, 1) contraendo un indice si ottiene il vettore controvariante, T µν ν = T µν ρ δνρ .

(1.8)

In particolare la contrazione degli indici del prodotto di due vettori, T µ Uν , d`a lo scalare, T µ Uν δµν = T µ Uµ = T µ U ν ηµν . Indicheremo il “quadrato” di un vettore con V 2 ≡ V µ Vµ . Gradiente di un campo tensoriale. Il gradiente quadri–dimensionale, o pi` u semplicemente la “derivata”, di un campo tensoriale di rango (m, n) costituisce un campo tensoriale di rango (m, n + 1). Indicheremo il gradiente rispetto alle coordinate spazio–temporali controvarianti con il simbolo, ∂µ ≡

∂ . ∂xµ

Si noti che l’operatore ∂µ porta l’indice in basso in quanto corrisponde a un vettore covariante. Cos`ı la derivata di un campo scalare ϕ(x) `e il campo vettoriale covariante ∂µ ϕ(x). Simmetrie. Un tensore di rango (2, 0) si dice simmetrico se S µν = S νµ , e antisimmetrico se Aµν = −Aνµ , propriet`a che vengono preservate dalle trasformazioni di Poincar´e. La contrazione doppia del prodotto tra un tensore simmetrico e uno antisimmetrico `e zero, Aµν Sµν = 0. Si definiscono parte simmetrica e parte antisimmetrica di un generico tensore di rango (2, 0) T µν i tensori, T (µν) ≡

1 µν (T + T νµ ), 2

T [µν] ≡

1 µν (T − T νµ ), 2

il primo essendo un tensore simmetrico e il secondo un tensore antisimmetrico. Si ha la decomposizione, T µν = T (µν) + T [µν] . 9

Per la contrazione doppia del prodotto di un generico tensore T µν con un tensore simmetrico, rispettivamente antisimmetrico, valgono le identit`a, T µν Sµν = T νµ Sµν = T (µν) Sµν ,

T µν Aµν = −T νµ Aµν = T [µν] Aµν .

(1.9)

Un tensore di rango (n, 0) si dice completamente (anti)simmetrico se `e (anti)simmetrico nello scambio di qualsiasi coppia di indici, propriet`a preservata dall’azione del gruppo di Poincar´e. Si definisce parte completamente antisimmetrica di un tensore T µ1 ···µn di rango (n, 0), il tensore dello stesso rango, T [µ1 ···µn ] ≡

1 (T µ1 µ2 ···µn − T µ2 µ1 ···µn + · · ·), n!

dove nella somma compaiono tutte le n! permutazioni degli indici, ciascuna con il segno (−)p dove p `e l’ordine della permutazione. Il tensore T [µ1 ···µn ] `e completamente antisimmetrico, ed esso `e nullo se T µ1 ···µn `e simmetrico anche in una sola coppia di indici. Inoltre la contrazione doppia del prodotto di T [µ1 ···µn ] con un tensore di rango (0, 2) simmetrico `e nulla. Propriet`a speculari valgono per la parte completamente simmetrica di un tensore di rango (n, 0), T (µ1 ···µn ) ≡

1 (T µ1 µ2 ···µn + T µ2 µ1 ···µn + · · ·). n!

Tensori invarianti. Un tensore TNM si dice invariante sotto il gruppo di Lorentz O(1, 3) se per ogni Λ ∈ O(1, 3) si ha TN0M = TNM . Osserviamo che da (1.5) segue che le matrici Λ ∈ O(1, 3) soddisfano |detΛ| = 1. Se ci limitiamo alla richiesta di invarianza sotto trasformazioni di Lorentz corrispondenti a detΛ = +1, usando la teoria dei gruppi si pu`o dimostrare che un generico tensore invariante `e necessariamente un polinomio nei due tensori invarianti fondamentali, η αβ

e εαβγδ ,

dove εαβγδ `e il tensore (di Levi–Civita) completamente antisimmetrico, determinato in modo univoco dalla condizione ε0123 = 1. La restrizione alle sole matrici con detΛ = +1 deriva dal fatto che per una generica matrice Λ 4 × 4 si ha l’identit` a del determinante, Λα µ Λβ ν Λγ ρ Λδ σ εµνρσ = detΛ · εαβγδ , 10

propriet`a che identifica il tensore di Levi–Civita come uno “pseudotensore” invariante. Questo tensore gode delle propriet`a, µ ν ρ σ εµνρσ εαβγδ = −4! δ[α δβ δγ δδ] , µ ν εµνρσ εαβρσ = −2!2! δ[α δβ] ,

µ ν ρ εµνρσ εαβγσ = −3! δ[α δβ δγ] ,

εµνρσ εανρσ = −3! δαµ ,

εµνρσ εµνρσ = −4!

Il fatto che la metrica di Minkowski sia un tensore invariante segue invece direttamente dalla (1.5).

1.4

Struttura del gruppo di Lorentz

In questa sezione vogliamo analizzare brevemente la struttura del gruppo di Lorentz alla luce del fatto che le matrici Λ che rappresentano trasformazioni ammesse di coordinate da un sistema inerziale a un altro, sono vincolate dalla (1.5). In particolare vogliamo trovare una parametrizzazione esplicita per la generica matrice Λ che soddisfa questo vincolo per individuare le corrispondenti operazioni fisiche che connettono due sistemi di riferimento, questione lasciata aperta nella sezione 1.2.2. Come vedremo a questo scopo sar`a utile eseguire un’analisi dettagliata delle trasformazioni di Lorentz prossime all’identit`a. Cominciamo con il notare che i vincoli (1.5) comportano le condizioni |detΛ| = 1 e |Λ0 0 | ≥ 1. Il gruppo di Lorentz risulta quindi scisso in quattro sottoinsiemi disgiunti, a seconda del valore di detΛ e del segno di Λ0 0 . Si chiama gruppo di Lorentz proprio il sottogruppo di O(1, 3) definito da, SO(1, 3)c ≡ {Λ ∈ O(1, 3)/detΛ = 1, Λ0 0 ≥ 1}. Il simbolo “S” indica comunemente il fatto che il determinante delle matrici vale +1, e il pedice “c” si riferisce al fatto che il gruppo di Lorentz proprio risulta connesso all’unit`a, al contrario di O(1, 3). Siccome gli altri tre sottoinsiemi di O(1, 3) si possono ottenere da SO(1, 3)c attraverso trasformazioni discrete `e sufficiente occuparsi di questo ultimo gruppo. Conosciamo gi`a due classi importanti di elementi di SO(1, 3)c . La prima classe `e costituita dalle rotazioni spaziali definite da, Λi j = Ri j ,

Λ0 0 = 1, 11

Λ0 i = 0 = Λi 0 ,

dove R ∈ SO(3) ≡ {R ∈ O(3)/detR = 1}. Si verifica infatti immediatamente che la matrice Λ cos`ı definita soddisfa la (1.5). La seconda classe importante `e costituita dalle trasformazioni di Lorentz speciali. Per un sistema di riferimento che si muove con velocit`a v lungo l’asse x abbiamo per esempio,   γ −βγ 0 0  −βγ γ 0 0  , Λµ ν =  (1.10)  0 0 1 0  0 0 0 1 √ dove β = v e γ = 1/ 1 − v 2 . In generale possiamo eseguire trasformazioni di Lorentz speciali con velocit`a ~v arbitraria, purch´e in modulo minore di uno, e le matrici Λ corrispondenti dipenderanno quindi da tre parametri indipendenti, vale a dire dalle tre componenti della velocit`a. Le rotazioni spaziali dipendono a loro volta da tre parametri indipendenti, per esempio i tre angoli di Eulero, e ci aspettiamo quindi che i 16 elementi della generica matrice Λ ∈ SO(1, 3)c possano esprimersi in termini di 6 variabili indipendenti. In altre parole, il gruppo di Lie SO(1, 3)c dovrebbe avere dimensione 6. Per dimostrare la correttezza di questa conlusione riscriviamo la (1.5) come, H ≡ ΛT ηΛ − η = 0,

(1.11)

che corrisponde a un sistema di 16 equazioni nelle 16 incognite Λµ ν , vale a dire H µν = 0. Tuttavia, siccome per costruzione H `e una matrice 4 × 4 simmetrica, solo 10 di queste equazioni sono linearmente indipendenti, e la generica soluzione Λ potr`a quindi esprimersi effettivamente in termini di 16 − 10 = 6 parametri indipendenti. 1.4.1

Trasformazioni infinitesime e trasformazioni finite

Per individuare una possibile scelta di questi 6 parametri consideriamo una generica trasformazione di Lorentz prossima all’identit`a, Λ µ ν = δ µ ν + Ωµ ν ,

|Ωµ ν | ¿ 1.

Imponendo la (1.11) e tenendo solo i termini lineari in Ωµ ν otteniamo, (δ α µ + Ωα µ ) ηαβ (δ β ν + Ωβ ν ) − ηµν = 0

12



ηνα Ωα µ = −Ωβ ν ηβµ .

(1.12)

Definendo la matrice, ωµν ≡ ηµβ Ωβ ν , risulta anche, Ωµ ν = η µα ωαν ,

(1.13)

e la relazione in (1.12) diventa allora, ωµν = −ωνµ .

(1.14)

ω `e quindi una matrice antisimmetrica e come tale ha sei elementi indipendenti. Concludiamo che la generica trasformazione di Lorentz infinitesima dipende da sei parametri liberi, potendo essere scritta come, Λµ ν = δ µ ν + η µα ωαν .

(1.15)

A questo punto siamo anche in grado di dare un’espressione esplicita per il generico elemento finito di SO(1, 3)c . In forma matriciale risulta semplicemente, Λ = e Ω,

(1.16)

purch´e Ω soddisfi la relazione (1.12) oppure, equivalentemente, ω soddisfi la (1.14). Per dimostrare che le matrici Λ date in (1.16) soddisfano effettivamente la condizione (1.11) notiamo intanto che la (1.12) in forma matriciale si scrive, η Ω = −ΩT η



ΩT = −η Ω η.

Risulta allora, T

ΛT η Λ = e Ω η e Ω = e−η Ω η η e Ω = η e− Ω η η e Ω = η,

c.v.d.

Notiamo infine che le matrici Λ date da (1.16), pur dipendendo da sei parametri indipendenti, parametrizzano solo SO(1, 3)c e non l’intero gruppo di Lorentz. Infatti, siccome l’esponenziale di una matrice `e una funzione continua dei suoi elementi, l’insieme delle matrici e Ω `e connesso con continuit`a alla matrice identit`a. Per concludere chiariamo il significato fisico dei sei parametri ωµν analizzando di nuovo una generica trasformazione infinitesima. In notazione tridimensionale, data la (1.14), in 13

tutta generalit`a possiamo porre, ω00 = 0,

(1.17)

ωi0 = v i = −ω0i

(1.18)

ωij = ϕ εijk uk ,

(1.19)

dove il vettore ~v corrisponder`a alla velocit`a infinitesima di un sistema di riferimeno rispetto all’altro, mentre ϕ sar`a l’angolo di rotazione infinitesimo attorno alla direzione individuata dal versore ~u. Che queste interpretazioni sono in effetti corrette si vede scrivendo esplicitamente le trasformazioni infinitesime delle coordinate, usando la (1.15), x0µ = Λµ ν xν = xµ + η µα ωαν xν . Otteniamo, t0 = t + η 00 ω0i xi = t − ~v · ~x, x0i = xi + η ij (ωj 0 t + ωj k xk ) = xi − v i t + ϕ( ~u × ~x)i .

(1.20) (1.21)

Per ~v = 0 si ottiene in effetti una rotazione spaziale infinitesima di un angolo ϕ intorno ad ~u, mentre per ϕ = 0 si riconosce una trasformazione di Lorentz speciale infinitesima √ con velocit`a relativa ~v . Si noti che nelle (1.20), (1.21) sono assenti i fattori 1/ 1 − v 2 in quanto essi introdurrebbero correzioni quadratiche in ωµν , mentre nella presente analisi ci siamo limitati ai termini lineari in ωµν . Infine, a titolo di esempio facciamo vedere in che modo possiamo riottenere la trasformazione di Lorentz speciale finita data in (1.10), a partire dalla formula generale (1.16). A questo scopo nella parametrizzazione generale (1.17)–(1.19) poniamo ϕ = 0 e v i = (e v , 0, 0), con, ve = v + o(v 2 ). In questo caso le componenti non nulle di ωµν sono, ω10 = ve = −ω01 . Dalla (1.13) segue allora che gli elementi non nulli della matrice Ωµ ν sono dati da, Ω0 1 = −e v = Ω1 0 . 14

(1.22)

A questo punto il calcolo di e Ω pu`o essere eseguito agevolmente sviluppando l’esponenziale in serie di Taylor, ed `e facile vedere che il risultato coincide con la (1.10), per un’opportuna scelta di ve, vedi problema 1.7.

1.5

Problemi

1.1 Usando le tecniche della sezione 1.4 si trovi una parametrizzazione esplicita per la generica matrice R appartenente a O(3). 1.2 Si dimostri che il tensore dato in (1.8) corrisponde a un vettore controvariante. 1.3 Si dimostri che l’operatore ∂µ corrisponde a un vettore covariante. 1.4 Si dimostrino le relazioni (1.9). 1.5 Si dimostri che la matrice Λµ ν data in (1.10) soddisfa il vincolo (1.5). 1.6 Dato un generico tensore T µνρ di rango (3, 0) si dimostri che si ha, T [µνρ] = 0

εµνρσ T µνρ = 0.



1.7 Si consideri la matrice, 

Ωµ ν

 0 −e v 0 0  −e v 0 0 0  , =  0 0 0 0  0 0 0 0

corrispondente a una trasformazione di Lorentz speciale infinitesima lungo l’asse x, vedi (1.22). Si dimostri che l’esponenziale e Ω coincide con la trasformazione di Lorentz speciale finita data in (1.10), per un’opportuna scelta di ve. [Sugg.: si sviluppi l’esponenziale in serie di Taylor e si noti che la matrice, µ M≡

0 1 1 0

¶ ,

gode delle identit`a algebriche, µ M

2n

=

1 0 0 1

¶ ,

per ogni intero positivo n.] 15

M 2n+1 = M,

2

Le equazioni dell’Elettrodinamica

In questo capitolo presenteremo le equazioni che governano la dinamica di un sistema di particelle cariche puntiformi in interazione con il campo elettromagnetico, ne illustreremo ruolo e significato e analizzeremo le loro caratteristiche generali. Una parte sostanziale del corso sar`a poi dedicata ad un’analisi approfondita delle soluzioni e delle conseguenze fisiche di queste equazioni. Cominciamo con l’introdurre le grandezze fisiche che caratterizzano dal punto di vista cinematico il moto di una singola particella relativistica.

2.1

Cinematica di una particella relativistica

Linee di universo causali. In Meccanica Newtoniana le legge oraria di una particella corrisponde alla curva tridimensionale ~y (t) ≡ (x(t), y(t), z(t)) 1 . In ambito relativistico per motivi di covarianza si introduce la traiettoria quadridimensionale γ della particella – detta anche linea di universo – che `e descritta da quattro funzioni di un parametro reale λ, y µ (λ) = (y 0 (λ), ~y (λ)), che in generale supporremo essere di classe C 2 . Perch`e una linea di universo sia fisicamente accettabile `e necessario che essa sia causale e diretta nel futuro. Diremo che una linea di universo `e causale e diretta nel futuro quando, definito il vettore tangente, dy µ V = , dλ µ

risultano soddisfatte le condizioni, a) V 2 ≥ 0,

∀λ,

b) V 0 > 0,

∀λ.

Se la condizione b) `e sostituita con la richiesta V 0 < 0, ∀λ la linea di universo si dice invece causale e diretta nel passato. La condizione a) segue dal fatto che in una teoria relativistica una particella non pu`o superare la velocit`a della luce, mentre la condizione b) 1

Di solito la legge oraria di una particella viene indicata con ~x(t). Noi preferiamo la notazione ~y (t) al posto di ~x(t), per evitare la confusione con il generico evento (t, ~x) in cui si valuta il campo elettromagnetico.

16

assicura che il parametro λ `e una funzione monotona crescente del tempo, propriet`a il cui significato verr`a chiarito tra un momento. Da un punto di vista geometrico la condizione a) definisce l’interno del cono luce, mentre l’aggiunta della condizione b) ne delimita la met`a “in avanti”, ovvero, il “cono luce futuro”. D’ora in poi supporremo, dunque, che la linea di universo percorsa da una qualsiasi particella sia causale e diretta nel futuro, ovvero, che il suo vettore tangente V µ appartenga all’interno del cono luce futuro, per ogni λ. Per la condizione b), ovvero dy 0 /dλ > 0, la funzione y 0 (λ) pu`o essere invertita per determinare in modo univoco il parametro in funzione del tempo, y 0 (λ) = t



λ(t).

Le componenti spaziali ~y (λ) descrivono invece la traiettoria tridimensionale della particella. La legge oraria tridimensionale si ottiene, infine, eliminando dalla traiettoria spaziale il parametro λ in favore del tempo, e per semplicit`a la scriveremo come, ~y (λ(t)) ≡ ~y (t). In seguito indicheremo velocit`a e accelerazione tridimensionali con, ~v =

d~y , dt

~a =

d~v . dt

Invarianza per riparametrizzazione. Rispetto alla Meccanica Newtoniana sembrerebbe che la linea di universo relativistica introduce un quarto grado di libert`a nella dinamica della particella – la funzione y 0 (λ). Tuttavia, questo grado di libert`a risulta “spurio”, ovvero inosservabile, in quanto riflette l’arbitrariet`a della scelta del parametro. Due linee di universo y1µ (λ) e y2µ (λ) risultano, infatti, fisicamente equivalenti se sono collegabili da una ridefinizione del parametro, vale a dire se esiste una funzione f da R in R, invertibile e di classe C 2 insieme alla sua inversa, tale che, y1µ (f (λ)) = y2µ (λ). ` evidente Si dice che le due linee di universo sono collegate da una riparametrizzazione. E che le leggi orarie associate a due linee di universo collegate da una riparametrizzazione sono identiche, ~y1 (t) = ~y2 (t). 17

Saremo quindi autorizzati a usare le linee di universo per descrivere il moto di una particella, al posto delle leggi orarie, purch´e le equazioni del moto che postuleremo risultino invarianti per riparametrizzazione. Si noti che la stessa legge oraria ~y (t) `e una funzione invariante per riparametrizzazione e risulta una “grandezza osservabile”, mentre le funzioni ~y (λ) e y 0 (λ) non lo sono. Se tutte le equazioni che scriveremo risulteranno invarianti per riparametrizzazione `e lecito scegliere un parametro arbitrario. Una scelta che adotteremo di frequente `e la componente µ = 0 della traiettoria stessa, vale a dire il tempo, λ = y 0 ≡ t. In questo caso la linea di universo sar`a parametrizzata da, y µ (t) = (t, ~y (t)). Un’altra scelta di estrema utilit`a `e il cosiddetto tempo proprio s, che ha il pregio di essere invariante simultaneamente per trasformazioni di Lorentz e per riparametrizzazione. Formalmente esso `e definito da, ds =

p

dy µ dyµ ,

(2.1)

che costituisce una notazione abbreviata per l’espressione, Z λr µ dy dyµ s(λ) = dλ0 + s(0), 0 dλ0 dλ 0

(2.2)

dove s(0) `e una costante arbitraria. Mentre l’invarianza di Lorentz di s `e manifesta, la sua invarianza per riparametrizzazione `e conseguenza del fatto che nella formula appena scritta i fattori dλ0 formalmente si cancellano. Si noti inoltre che grazie alla causalit`a della linea di universo – condizione a) di cui sopra – il radicando in (2.2) `e mai negativo, µ ¶2 dt dy µ dyµ = (1 − v 2 ) ≥ 0. dλ dλ dλ Il concetto di tempo proprio permette poi di definire la derivata invariante, d 1 ≡q ds dy µ

dyµ dλ dλ

d . dλ

(2.3)

Grazie all’invarianza per riparametrizzazione di s, nelle (2.2) e (2.3) possiamo usare come parametro il tempo, ottenendo cos`ı, Z tp s(t) = 1 − v 2 (t0 ) dt0 + s(0), 0

18

d 1 d =p . ds 1 − v 2 (t) dt

(2.4)

Quadrivelocit`a, quadriaccelerazione e quadrimomento sono definiti da, µ ¶ dy µ 1 ~v duµ µ u = = √ ,√ , wµ = , pµ = muµ , 2 2 ds ds 1−v 1−v e soddisfano identicamente le relazioni, uµ uµ = 1,

uµ wµ = 0,

p2 ≡ pµ pµ = m2 ,

(2.5)

dove m `e la massa della particella. Per l’energia e la quantit`a di moto della particella si ottengono allora le note espressioni, ε ≡ p0 = √

m , 1 − v2

p~ = √

m~v . 1 − v2

Notiamo ancora che per ogni fissato istante t0 esiste sempre un sistema di riferimento inerziale K – chiamato “sistema a riposo istantaneo” – in cui la particella all’istante t0 `e a riposo. Si verifica facilmente che in K in questo istante si ha, uµ = (1, ~0),

2.2

wµ = (0, ~a).

L’Elettrodinamica di particelle puntiformi

Introduciamo ora il sistema fisico la cui dinamica `e l’oggetto di studio primario di questo testo: un sistema di N particelle cariche puntiformi interagenti con il campo elettromagnetico. Le variabili cinematiche indipendenti che lo descrivono sono le 4N funzioni yrµ (λr ) con r = 1, . . . , N , che parametrizzano le linee di universo γr percorse dalle particelle, e il campo tensoriale di Maxwell F µν (x) antisimmetrico, F µν = −F νµ . Per ciascuna delle particelle possiamo definire le quantit`a cinematiche introdotte nella sezione precedente: il tempo proprio sr , la quadrivelocit`a uµr , la quadriaccelerazione wrµ , e il quadrimomento pµr = mr uµr , dove mr `e la massa della particella r–esima. Per il momento parametrizziamo ogni linea di universo γr con un parametro λr arbitrario. Se indichiamo con er la carica della particella r–esima, al sistema di cariche resta associata la (densit`a di) quadricorrente elettrica, X Z dy µ X Z r 4 µ µ 4 er j (x) = er dyr δ (x − yr ) ≡ δ (x − yr (λr )) dλr . dλ r γr r r 19

(2.6)

Questa espressione risulta manifestamente Lorentz–covariante e – come conviene a qualsiasi grandezza osservabile – essa `e anche invariante per riparametrizzazione in quanto i fattori dλr formalmente si cancellano. Ricordiamo inoltre che questa corrente risulta conservata identicamente, ∂µ j µ = 0.

(2.7)

Le propriet`a di una generica quadricorrente elettrica conservata verranno analizzate in dettaglio nel paragrafo 2.4.1. Qu`ı ci limitiamo a osservare che la corrente di un sistema di particelle puntiformi strettamente parlando non pu`o essere considerata come un “campo vettoriale”, in quanto le sue quattro componenti, coinvolgendo la funzione–δ di Dirac, non sono “funzioni di x” ma elementi di S 0 (R4 ), vale a dire distribuzioni temperate. La corrente data in (2.6) va quindi considerata piuttosto come un “campo vettoriale a valori nelle distribuzioni”. Le conseguenze di questa circostanza verranno discusse in dettaglio nella prossima sezione, dove analizzeremo a fondo la natura distribuzionale delle equazioni di Maxwell. ~ B) ~ Ricordiamo che il tensore di Maxwell `e legato ai campi elettrico e magnetico (E, dalle note relazioni, F 00

=

0

(2.8)

F i0

=

Ei

(2.9)

F ij = − εijk B k

1 B i = − εijk F jk , 2



(2.10)

e che gli invarianti di Lorentz indipendenti che si possono formare con le componenti di F µν sono dati da, ~ · B, ~ εµνρσ Fµν Fρσ = −8 E

F µν Fµν = 2 (B 2 − E 2 ).

(2.11)

Presentiamo ora le tre equazioni fondamentali che governano la dinamica del nostro sistema, dpµr = er F µν (yr ) urν , dsr εµνρσ ∂ν Fρσ = 0, ∂µ F µν = j ν , 20

(2.12) (2.13) (2.14)

che chiamiamo rispettivamente Equazioni di Lorentz, Identit`a di Bianchi ed Equazione di Maxwell. Scopo di queste equazioni `e di determinare univocamente i campi F µν (x) e le linee di universo yrµ (λr ) – modulo riparametrizzazioni – date certe condizioni iniziali, vale a dire, di dare luogo a un ben definito problema di Cauchy in accordo con il determinismo newtoniano. Per le coordinate yrµ il problema di Cauchy verr`a specificato nel prossimo paragrafo mentre per il tensore di Maxwell lo affronteremo pi` u avanti. Di seguito analizzeremo brevemente la struttura e il significato delle singole equazioni. 2.2.1

Equazione di Lorentz

Per non appesantire la notazione consideriamo una singola particella di carica e e linea di unverso y µ (λ), che deve dunque soddisfare l’equazione di Lorentz, dpµ = eF µν (y) uν . ds

(2.15)

Prima di tutto facciamo notare che in questa equazione il campo elettromagnetico risulta valutato sulla traiettoria della particella in quanto con F µν (y) si intendono le sei funzioni di una variabile F µν (y(λ)). Assunto noto il campo elettromagnetico F µν (x) le (2.15) cositituiscono allora formalmente quattro equazioni differenziali del secondo ordine nelle quattro funzioni incognite y µ (λ). D’altra parte queste equazioni risultano invarianti per riparametrizzazione perch´e l’unica variabile che vi compare esplicitamente `e il tempo proprio s, e ci`o comporta che esse determinano le y µ (λ) solo modulo una riparametrizzazione in accordo con quanto richiesto nella sezione 2.1. In particolare queste equazioni dovrebbero allora determinare univocamente la legge oraria ~y (t) note le condizioni iniziali, ~y (0) e ~v (0).

(2.16)

Vediamo allora due approcci diversi – ma matematicamente e fisicamente equivalenti – di formulare il problema alle condizioni iniziali. Approccio covariante. In questo approccio si considera s come una variabile indipendente, vale a dire non legata alla traiettoria dalla (2.2), e si parametrizza la linea di universo con s. Corrispondentemente le (2.15) sono considerate come quattro equazioni differenziali del secondo ordine nelle quattro funzioni incognite y µ (s), che ora per`o sono

21

legate dal vincolo supplementare, vedi (2.1), u2 =

dy µ dyµ = 1. ds ds

(2.17)

Tuttavia, il contenuto di questo vincolo risulta meno restrittivo di quanto non potrebbe sembrare a prima vista. Le (2.15) assicurano infatti che esso `e automaticamente soddisfatto per ogni valore s, una volta che `e soddisfatto all’istante iniziale, diciamo per s = 0. Per vederlo `e sufficiente moltiplicare le (2.15) con uµ . Il membro di destra si annulla allora identicamente, perch´e F µν uµ uν = 0 grazie all’antisimmetria del tensore di Maxwell. Quindi deve annullarsi anche il membro di sinistra, 0 = uµ

m d 2 dpµ = u. ds 2 ds

u2 `e quindi indipendente da s, e se vale 1 per s = 0 vale 1 per ogni s. Analizziamo ora le condizioni iniziali. Essendo le (2.15) del secondo ordine esse hanno soluzione unica note le condizioni iniziali, y µ (0),

dy µ (0) ≡ uµ (0). ds

Per quanto riguarda y µ (0) osserviamo che, traslando il tempo iniziale, senza perdita di generalit`a possiamo porre y 0 (0) = 0, mentre ~y (0) fa parte dei dati iniziali “fisici”, vedi (2.16). Per quanto riguarda invece uµ (0), una volta assegnata la velocit`a iniziale ~v (0) poniamo prima, ~v (0)

~u(0) = p

1 − v 2 (0)

,

e imponiamo poi il vincolo (2.17) all’istante s = 0, u0 (0) =

p

1 + |~u(0)|2 = p

1 1 − v 2 (0)

.

A questo punto le (2.15) determinano le y µ (s) in modo univoco, e il vincolo (2.17) `e automaticamente soddisfatto per ogni s. La legge oraria ~y (t) si ottiene infine usando l’equazione y 0 (s) = t per determinare s come funzione di t, e sostituendo la funzione risultante s(t) in ~y (s). L’approccio covariante `e molto conveniente quando il campo elettromagnetico ha una forma analitica semplice, vedi per esempio il problema 2.7. 22

Approccio non covariante. In questo approccio si affronta la soluzione delle (2.15) parametrizzando la linea di universo con il tempo, y µ (t) = (t, ~y (t)), con il vantaggio palese che non sono presenti gradi di libert`a spuri. In questo caso abbiamo ancora quattro equazioni differenziali del secondo ordine, ma le incognite sono solo le tre funzioni ~y (t). Tuttavia, possiamo fare vedere che solo tre delle quattro equazioni (2.15) sono funzionalmente indipendenti. Per fare questo definiamo il quadrivettore, Hµ ≡

dpµ − eF µν uν , ds

e scriviamo l’equazione di Lorentz nella forma, H µ = 0. Dalle (2.8)–(2.10) si ricavano facilmente le componenti spaziali e temporale di H µ , µ ³ ´¶ d~p 1 ~ ~ ~ H = √ − e E + ~v × B , 1 − v 2 dt H

0

1 = √ 1 − v2

µ

¶ dε ~ − e ~v · E . dt

A questo punto osserviamo che vale identicamente – anche senza usare la (2.15) – ~ = 0. uµ H µ = u0 H 0 − ~u · H

(2.18)

Infatti, in contrasto con l’approccio precedente, in questo caso la relazione uµ wµ = 0 `e un’identit`a, e vale ancora uµ uν F µν = 0. Ne discende che H 0 dipende funzionalmente da ~ essendo, H H0 =

~ ~u · H ~ = ~v · H. u0

La componente temporale dell’equazione di Lorentz, H 0 = 0, `e allora automaticamente ~ = 0. E ` allora sufficiente soddisfatta se sono soddisfatte le sue componenti spaziali, H risolvere queste ultime che, essendo del secondo ordine nelle derivate temporali, assumono a tutti gli effetti il ruolo di “equazione di Newton” per la particella, ³ ´ d~p ~ ~ = e E + ~v × B . dt 23

(2.19)

Dato F µν (x) e note le condizioni iniziali ~y (0), ~v (0), essa ammette soluzione unica per la legge oraria ~y (t). La componente temporale dell’equazione di Lorentz corrisponde invece alla legge della potenza, dε ~ = e ~v · E, dt

(2.20)

ed `e quindi conseguenza dell’equazione di Newton, esattamente come in fisica non relativistica. Infine, nota ~y (t) la (2.4) fornisce s(t) e permette quindi di ricostruire y µ (s). Concludiamo questo paragrafo insistendo sul significato preciso della (2.19), come spiegato all’inizio di questo paragrafo, Ã ! h i d m ~v (t) ~ ~y (t)) + ~v (t) × B(t, ~ ~y (t)) . p = e E(t, dt 1 − v(t)2 2.2.2

(2.21)

Identit` a di Bianchi

L’“identit`a” (2.13) nella nomenclatura comune costituisce “met`a” delle equazioni di Maxwell, pi` u precisamente quella met`a che non lega il campo elettromagnetico alla corrente ma ne vincola la forma. In effetti `e facile trovare soluzioni semplici di questa equazione in termini di un potenziale vettore Aµ , detto anche campo di Maxwell o campo di gauge, ponendo, Fµν = ∂µ Aν − ∂ν Aµ .

(2.22)

Sostituendo in (2.13) si trova infatti, εµνρσ ∂ν Fρσ = εµνρσ (∂ν ∂ρ Aσ − ∂ν ∂σ Aρ ) = 0,

(2.23)

in quanto in entrambi i termini si contrae una coppia di indici simmetrici – quelli delle derivate – con una coppia di indici antisimmetrici – quelli del tensore di Levi–Civita. Ma usando i metodi della Geometria Differenziale si pu`o dimostrare un risultato pi` u forte: per ogni campo tensoriale antisimmetrico Fµν soddisfacente l’equazione (2.13) esiste un campo vettoriale Aµ , tale che Fµν possa essere scritto come in (2.22) 2 . La conclusione, forse sorprendente, `e che la (2.22) rappresenta la soluzione generale dell’identit`a di Bianchi. 2

Questo risultato `e valido purch´e lo spazio–tempo considerato sia topologicamente banale, come per esempio R4 .

24

Tuttavia, potenziali vettori diversi possono dare luogo allo stesso F µν . Infatti, dato un campo scalare Λ qualsiasi si pu`o definire un nuovo potenziale vettore, A0µ = Aµ + ∂µ Λ,

(2.24)

e si verifica immediatamente che vale, 0 Fµν = ∂µ A0ν − ∂ν A0µ = Fµν + ∂µ ∂ν Λ − ∂ν ∂µ Λ = Fµν ,

grazie alla commutativit`a delle derivate parziali. Le trasformazioni (2.24), che vengono chiamate trasformazioni di gauge, lasciano quindi il tensore di Maxwell invariante. In definitiva possiamo affermare che “l’identit`a” di Bianchi pu`o essere risolta identicamente in termini di un potenziale vettore, ma che il potenziale vettore stesso `e determinato solo modulo una trasformazione di gauge. Schematicamente abbiamo, εµνρσ ∂ν Fρσ = 0

⇐⇒

Fµν = ∂µ Aν − ∂ν Aµ ,

con Aµ ≈ Aµ + ∂µ Λ.

(2.25)

La nostra strategia per affrontare il sistema (2.12)–(2.14) sar`a – nella maggior parte dei casi – di considerare risolta l’identit`a di Bianchi in termini di Aµ , rimanendo quindi con le equazioni (2.12) e (2.14) nelle incognite yrµ e Aµ . ~ in notazione tridimensionale le (2.22) corriRicordiamo che, ponendo Aµ = (A0 , A), spondono alle relazioni note, ~ ~ = −∇A ~ 0 − ∂A , E ∂t 2.2.3

~ =∇ ~ × A. ~ B

(2.26)

Equazione di Maxwell

L’equazione (2.14) `e da considerarsi come la vera e propria equazione del moto per il campo elettromagnetico, in quanto lega F µν alla quadricorrente elettrica. Questa equazione quantifica quindi il modo in cui la corrente genera il campo. Ricordiamo che l’equazione `e consistente con l’equazione di continuit`a della corrente, ∂ν j ν = 0, grazie all’antisimmetria del tensore di Maxwell, che implica l’identit`a, ∂ν ∂µ F µν = 0. Come abbiamo appena osservato, una volta risolta l’identit`a di Bianchi secondo la (2.22), l’equazione di Maxwell diventa in realt`a un’equazione per il potenziale vettore. 25

Avremmo quindi quattro equazioni differenziali alle derivate parziali del secondo ordine, nelle quattro incognite Aµ . Tuttavia, questo conteggio `e solo parzialmente significativo, per due motivi: primo, le componenti del potenziale vettore non sono tutte “fisiche” in quanto soggette alle trasformazioni di gauge; infatti, potenziali vettori diversi possono corrispondere agli stessi campi elettrici e magnetici, ma sono solo questi ultimi a poter essere osservati sperimentalmente. Secondo, le quattro componenti dell’equazione di Maxwell non sono funzionalmente indipendenti. Per vederlo definiamo, Gν ≡ ∂µ F µν − j ν , e scriviamo le equazione di Maxwell nella forma Gν = 0. Grazie alle identit`a ricordate poc’anzi `e poi immediato vedere che le Gν soddisfano identicamente il vincolo, ∂ν Gν = 0

~ · G. ~ ∂0 G0 = −∇



(2.27)

La derivata della componente temporale dell’equazione di Maxwell `e quindi legata alle sue componenti spaziali. Tuttavia, questo vincolo non `e di tipo algebrico – non coinvolge direttamente le equazioni del moto ma le loro derivate – e quindi non `e immediato individuare le equazioni indipendenti. Risolveremo questo problema pi` u avanti, nell’ambito della formulazione del problema di Cauchy per il campo elettromagnetico, quando avremo a disposizione i mezzi per affrontarlo. Concludiamo questa sezione con qualche ulteriore commento sul sistema (2.12)–(2.14). Sui gradi di libert` a del campo elettromagnetico. Daremo una definizione precisa di ci`o che intendiamo con i “gradi di libert`a” associati a un generico campo ϕ(x) in sezione 5.1, dove analizzeremo anche a fondo i gradi di libert`a del campo elettromagnetico. Qualitativamente possiamo dire che con i gradi di libert`a di un sistema fisico si intendono le variabili indipendenti necessarie per descriverne la dinamica. In particolare si richiede che le equazioni del moto siano in grado di determinare il loro valore a un istante generico, assegnati certi dati iniziali. Possiamo svolgere un’analisi preliminare dei gradi di libert`a contenuti nel campo elettromagnetico, se partiamo dalle (2.13), (2.14) riscritte nel consueto formalismo tridimensionale, −

~ ∂E ~ ×B ~ = ~j, +∇ ∂t 26

(2.28)

~ ∂B ~ ×E ~ = 0, +∇ ∂t ~ ·E ~ = j 0, ∇ ~ ·B ~ = 0. ∇

(2.29) (2.30) (2.31)

~ ~x) e B(t, ~ ~x), Le (2.28), (2.29) costituiscono sei equazioni nelle sei funzioni incognite E(t, ~ eB ~ rispetto al tempo: esse vanno quindi considerate che coinvolgono le derivate prime di E come equazioni dinamiche. Queste equazioni ammettono infatti soluzione unica, note le ~ ~x), B(0, ~ ~x). Al contrario, le due equazioni scalari (2.30) e (2.31) sei condizioni iniziali E(0, non contengono derivate temporali e vanno quindi considerate come vincoli, piuttosto che come equazioni dinamiche. In particolare, le sei condizioni iniziali non possono essere assegnate arbitrarimente, perch´e esse sono soggette ai vincoli (2.30), (2.31), ~ · E(0, ~ ~x) = j 0 (0, ~x), ∇ ~ · B(0, ~ ~x) = 0. ∇ All’istante t = 0 `e quindi sufficiente assegnare 6 − 2 = 4 componenti del campo elettromagnetico, in quanto a quello stesso istante le rimanenti due componenti risultano determinate in termini delle altre quattro. A questo punto non `e difficile dimostrare che, se le equazioni (2.28), (2.29) sono soddisfatte per qualsiasi t, e le (2.30), (2.31) sono soddisfatte all’istante t = 0, allora queste ultime sono automaticamente soddisfatte per qualsiasi t, vedi problema 2.11. Ci aspettiamo quindi che il campo elettromagnetico corrisponda non a sei, ma solo a quattro “gradi di libert`a fisici del primo ordine”. Sulle soluzioni del sistema (2.12)–(2.14) . L’insieme di queste equazioni costituisce un sistema di equazioni differenziali non lineari fortemente accoppiate che, eccetti casi rarissimi, non `e risolubile esattamente: la forma dei campi determina il moto delle particelle secondo le (2.12), e i campi a loro volta sono determinati dal moto delle particelle secondo le (2.14), e dalle (2.13). Tuttavia, in molte situazioni fisiche il problema pu`o essere ridotto difatti a considerare una delle due seguenti situazioni, in cui le equazioni si disaccoppiano: ´ dato un campo elettromagnetico “esterno” nel vuoto, soddisfacente, cio`e, le (2.13) I) E e (2.14) con j µ = 0. Esempi sono un campo elettromagnetico costante e uniforme in una certa regione dello spazio, come quello tra le due paratie di un condensatore, oppure 27

un’onda elettromagnetica piana di frequenza e ampiezza data. In molti casi si chiede di determinare il moto di una particella carica sottoposta a un tale campo. Questo problema si riconduce allora alla soluzione delle sole equazioni (2.12) nelle incognite yrµ . ` assegnato il moto di una particella carica, oppure di pi` II) E u particelle cariche, e si chiede di determinare il campo elettromagnetico creato da questo sistema di cariche in moto. Questo problema riguarda solamente le equazioni (2.13) e (2.14) che, come vedremo, possono essere risolte esattamente, in termini dei celebri potenziali di Lienard–Wiechert. In entrambi i casi, per`o, bisogna tenere presente che la dinamica vera del sistema `e governata dall’intero set di equazioni (2.12)–(2.14), e che si sta considerando soltanto una schematizzazione della situazione fisica reale, la cui validit`a deve essere valutata caso per caso. In astratto la strategia da seguire per risolvere il sistema delle equazioni fondamentali dell’Elettrodinamica, e che in linea di principio seguiremo anche noi in questo testo, `e la seguente. Risolta l’identit`a di Bianchi in termini di un potenziale vettore Aµ , si trova la soluzione esatta dell’equazione di Maxwell per Aµ – e quindi per F µν – in termini delle traiettorie generiche yrµ . Dopodich`e si sostituisce il campo F µν cos`ı trovato nelle equazioni di Lorentz, che diventano quindi delle equazioni non locali, ma chiuse, nelle sole incognite yrµ . Risolte queste equazioni si possono sostituire le yrµ risultanti in F µν , per ottenere infine il campo elettromagnetico come funzione delle sole x. Come menzionato sopra questo programma raramente pu`o essere portato a termine in modo esplicito, per via delle difficolt`a tecniche coinvolte. Ma vedremo, per di pi` u, che nel corso della sua attuazione emergeranno anche difficolt`a concettuali – causati dalla natura puntiforme delle particelle cariche – che minano irrimediabilmente la consistenza interna dell’Elettrodinamica classica. In altre parole, vedremo l’Elettrodinamica classica entrare in contraddizione con se stessa. D’altra parte da un punto di vista sperimentale questa teoria descrive tutti i fenomeni elettromagnetici classici con estrema precisione: teoria ed esperimento sono in perfetto accordo. Rester`a quindi da spiegare come mai le inconsistenze interne della teoria non si manifestano anche a livello sperimentale. Vedremo, per l’appunto, che `e facile predisporre esperimenti in cui queste inconsistenze si tradurrebbero in fenomeni fisicamente osservabili. Tuttavia, vedremo anche che questi fenomeni 28

occorrerebbero su scale spazio–temporali alle quali gli effetti quantistici non possono pi` u essere trascurati. A queste scale l’Elettrodinamica classica perde quindi la sua validit`a fenomenologica, ed essa deve essere sostituita dalla Teoria Quantistica di Campo. In altri termini:

sono proprio gli effetti quantistici a mascherare le inconsistenze interne

dell’Elettrodinamica classica – rendendole inosservabili. Sulle cariche elettriche. Per il momento abbiamo tacitamente assunto che le cariche elettriche delle particelle costituiscano un arbitrario insieme di costanti {er }. Siamo confortati in questa ipotesi dal fatto che – per quanto riguarda le analisi svolte finora sul sistema (2.12)–(2.14) – non abbiamo incontrato nessuna inconsistenza: questo sistema di equazioni sembra consistente qualsiasi siano i valori delle er . A questo proposito possiamo, per`o, anche notare che le cariche elettriche entrano nelle equazioni fondamentali in due modi diversi: nelle equazioni di Lorentz, e nell’equazione di Maxwell attraverso la ` evidente che a priori non c’`e nessun motivo per cui i due insiemi di cariche corrente. E siano identici. Potremmo, cio`e, usare nelle equazioni di Lorentz le cariche {er }, e nella definizione della corrente (2.6) un insieme diverso {e∗r }, e le equazioni fondamentali manterrebbero tutte le buone propriet`a discusse finora. Rimane allora da capire cosa ci ha spinto a identificare questi due insiemi di cariche fin dall’inizio. Un’indicazione cruciale che ci aiuta a rispondere a questa domanda viene dal limite non relativistico. Consideriamo in questo limite due particelle con cariche (e1 , e∗1 ) e (e2 , e∗2 ), e chiamiamo ~r il raggio vettore che congiunge la particella 1 alla particella 2. Allora dall’equazione di Maxwell (2.30) ci possiamo calcolare il campo elettrico quasi–statico creato dalla particella 1 nel punto in cui si trova la particella 2, e viceversa, ∗ ~ 1 = − e2 ~r , E 4π r3

∗ ~ 2 = e1 ~r , E 4π r3

mentre nel limite non relativistico i campi magnetici possono essere trascurati. In questo limite le equazioni di Lorentz (2.19) ci danno allora per la forza F~12 esercitata dalla particella 1 sulla particella 2, e viceversa, ∗ ~ 2 = e2 e1 ~r , F~12 = e2 E 4π r3

∗ ~ 1 = − e1 e2 ~r . F~21 = e1 E 4π r3

Si vede quindi che la terza legge di Newton, ovverosia il principio di azione e reazione 29

F~12 = −F~21 , che `e un postulato fondamentale della Meccanica Newtoniana, vale solo se, e1 e2 = ∗. ∗ e1 e2 Ripetendo questo ragionamento per un’arbitraria coppia di particelle si conclude che la validit`a della terza legge di Newton richiede che il rapporto er /e∗r sia una costante universale, che pu`o essere posta uguale all’unit`a riscalando il campo elettromagnetico e le cariche. Si ottiene cos`ı, er = e∗r . A livello non relativistico l’origine di questa identificazione risiede dunque nel principio di azione e reazione. D’altra parte, sempre a livello non relativistico questo principio `e equivalente alla conservazione della quantit`a di moto totale di un sistema isolato, d (~p1 + p~2 ) = F~21 + F~12 = 0. dt A livello relativistico dobbiamo allora aspettarci che l’identificazione dei due tipi di carica venga imposta dalla richiesta di conservazione del quadrimomento totale, in particolare dell’energia. Nella sezione 2.4 vedremo in effetti che questo `e ci`o che succede.

2.3

La natura distribuzionale del campo elettromagnetico

Abbiamo gi`a fatto notare che le componenti della quadricorrente j µ non sono funzioni, bens`ı distribuzioni, supportate sulle linee di universo delle particelle. Dall’equazione di Maxwell (2.14) si deduce allora che le componenti di F µν non possono essere “funzioni derivabili” lungo le linee di universo, perch´e altrimenti anche le componenti del quadrivettore ∂µ F µν sarebbero funzioni. Traiamo allora le seguente conclusioni: I) il tensore F µν `e necessariamente singolare lungo le linee di universo, e vedremo che la singolarit`a in questione `e del tipo 1/r2 , se r indica la distanza spaziale dalla linea di universo; II) l’equazione di Maxwell (2.14) non ha senso come equazione differenziale nello spazio delle funzioni, mentre essa sar`a perfettamente ben definita se la consideriamo come equazione differenziale nello spazio delle distribuzioni temperate S 0 (R4 ) 3 . 3

In ultima analisi il ruolo della (2.14) `e unicamente quello di qualificare le singolarit`a di F µν lungo le linee di universo, visto che nel loro complemento la corrente si annulla, e quindi ivi vale banalmente ∂µ F µν = 0.

30

In questa nuova ottica le componenti di F µν andranno dunque considerate come elementi di S 0 (R4 ), e le derivate che compaiono nella (2.14) andranno considerate come derivate nel senso delle distribuzioni. Per consistenza allora anche l’identit`a di Bianchi (2.13) deve essere riguardata come equazione differenziale in S 0 (R4 ). Si noti che questa reinterpretazione delle due equazioni di Maxwell come equazioni differenziali nello spazio delle distribuzioni `e consistente, perch´e esse sono lineari in F µν . Una volta che abbiamo dato un significato matematico preciso alle equazioni di Maxwell e Bianchi possiamo chiederci se ora anche l’equazione di Lorentz risulta ben definita. ` immediato vedere che la risposta a questa domanda `e negativa. Infatti, nelle (2.12) E compare F µν (yr ), cio`e il campo elettromagnetico valutato proprio sulla traiettoria della particella, luogo dove esso `e singolare: le quantit`a F µν (yr ) sono quindi divergenti e l’equazione di Lorentz `e mal definita. L’interpretazione fisica di questa patologia `e che l’interazione della particella con il campo elettromagnetico da essa stessa creata – l’autointerazione – `e di intensit`a infinita. Si intuisce facilmente che la causa prima di questa divergenza “ultravioletta”, dovuta cio`e alle leggi che determinano la fisica a piccole distanze, `e proprio la natura puntiforme delle particelle cariche, come anticipato nel paragrafo precedente. Nel capitolo 12 discuteremo possibili soluzioni pragmatiche al problema dell’autointerazione infinita, ma nessuna di queste risulter`a soddisfacente dal punto di vista teorico, se ci si confina all’ambito dell’Elettrodinamica classica. 2.3.1

Lo spazio delle distribuzioni

Prima di illustrare con qualche esempio il significato – e la necessit`a – di questa nuova interpretazione delle leggi dell’Elettrodinamica, ricordiamo qualche elemento operativo della teoria delle distribuzioni (temperate) in uno spazio di dimensione arbitraria. Distribuzioni e funzioni di test. In D dimensioni lo spazio delle funzioni di test S ≡ S(RD ) `e lo spazio vettoriale delle funzioni complesse ϕ(x) di classe C ∞ , che all’infinito decrescono insieme a tutte le loro derivate pi` u rapidamente dell’inverso di qualsiasi potenza. Devono, cio`e, essere finite tutte le “seminorme”, ||ϕ||P,Q ≡ sup x∈RD |P(x)Q(∂)ϕ(x)| , 31

(2.32)

dove con P intendiamo un generico monomio nelle xµ e con Q un generico monomio nelle derivate parziali ∂µ . Per quanto riguarda la topologia di cui si dota S si rimanda a un testo di Metodi Matematici. Lo spazio delle distribuzioni S 0 ≡ S 0 (RD ) `e allora definito come l’insieme dei funzionali F che sono lineari e continui su S, F : S → C, ϕ → F (ϕ).

(2.33)

Una generica distribuzione F ∈ S 0 `e completamente determinata dai valori F (ϕ) che essa assume quando viene applicata a una generica funzione di test ϕ ∈ S. Ricordiamo ora un teorema che `e di grande utilit`a pratica quando si tratta di stabilire se un dato funzionale lineare su S risulta continuo. Teorema: un funzionale lineare F su S `e continuo, cio`e, appartiene ad S 0 , se e solo se esso pu`o essere maggiorato da una somma finita di seminorme di ϕ, vale a dire, |F (ϕ)| ≤

X

CP,Q ||ϕ||P,Q ,

∀ ϕ ∈ S,

(2.34)

per opportune costanti positive CP,Q indipendenti da ϕ. Un’importante classe di distribuzioni `e quella costituita dalle distribuzioni regolari, ovvero dalle distribuzioni che sono rappresentate da funzioni. Si dice che una distribuzione F `e rappresentata dalla funzione f (x) da RD in C quando si ha, Z F (ϕ) = f (x) ϕ(x) dD x. Sfruttando il teorema di cui sopra `e allora facile dimostrare che rappresentano distribuzioni regolari in particolare tutte le funzioni limitate, e tutte le funzioni con singolarit`a integrabili, che divergono all’infinito al massimo come qualche potenza, vedi problema 2.4. Ricordiamo inoltre che in generale le distribuzioni non si possono moltiplicare o dividere tra di loro, e che il valore di una distribuzione F in un punto x in generale non `e una quantit`a ben definita. Tuttavia, certe propriet`a delle distribuzioni risultano di “accesso immediato” se si ricorre alla notazione “simbolica”, vale a dire se si introduce formalmente la quantit`a F (x). In notazione simbolica scriveremo per esempio, Z F (ϕ) = F (x) ϕ(x) dD x. 32

2.3.2

Operazioni sulle distribuzioni

Le operazioni che presentiamo di seguito si riferiscono a distribuzioni F che operano su funzioni di test ϕ appartenenti ad S, ma in molti casi queste operazioni mantengono la loro validit`a anche quando le distribuzioni vengono applicate a funzioni molto meno regolari di quelle appartenenti a S. Derivate di distribuzioni. Ogni elemento F ∈ S 0 ammette derivate parziali ∂µ F ∈ S 0 , definite da, (∂µ F )(ϕ) = −F (∂µ ϕ).

(2.35)

Dalla definizione segue immediatamente che le derivate parziali nel senso delle distribuzioni commutano sempre, ∂µ ∂ν F = ∂ν ∂µ F. La valutazione esplicita della derivata di una distribuzione F `e facilitata se in un sottoinsieme B di RD essa pu`o essere rappresentata da una funzione di classe C ∞ . In questa regione la derivata pu`o essere calcolata semplicemente nel senso delle funzioni, e il calcolo della derivata di F `e ridotto essenzialmente alla determinazione di ∂µ F nel complemento di B, che `e il luogo dove F `e singolare. Siccome le singolarit`a delle distribuzioni con cui avremo a che fare costituiscono sempre insiemi di misura nulla, questa strategia si riveler`a molto efficace. Convoluzione. La convoluzione F ∗ ϕ tra una distribuzione F e una funzione di test ϕ `e una distribuzione che in notazione simbolica `e data da, Z (F ∗ ϕ)(x) =

F (x − y) ϕ(y) dD y.

Per le sue derivata si ha, ∂µ (F ∗ ϕ) = ∂µ F ∗ ϕ = F ∗ ∂µ ϕ. Se anche F ∈ S si ha inoltre F ∗ ϕ = ϕ ∗ F . Funzione–δ di Dirac unidimensionale. La distribuzione di Dirac unidimensionale δa supportata in x = a, con a ∈ R, `e l’elemento di S 0 (R) definito da δa (ϕ) = ϕ(a), per ogni ϕ ∈ S(R). Essa al solito viene rappresentata dalla funzione simbolica δ(x − a) che 33

soddisfa,

Z δ(x − a) ϕ(x) dx = ϕ(a).

La δ di Dirac gode di alcune importanti propriet`a che ora elencheremo usando la notazione simbolica. Per la sua derivata n–esima si ha, Z n n d nd ϕ δ(x − a) ϕ(x) dx = (−) (a). dxn dxn Per ogni f ∈ OM (R) – l’insieme delle funzioni C ∞ su R polinomialmente limitate insieme a tutte le loro derivate – si ha poi, f (x) δ(x − a) = f (a) δ(x − a).

(2.36)

Questa relazione comporta alcune semplici identit`a, come per esempio, x δ(x) = 0,

x2

d δ(x) = 0, dx

x

d δ(x) = −δ(x), dx

etc.

Queste identit`a si dimostrano facilmente usando la regola di Leibnitz, valida per prodotti del tipo f F , con f ∈ OM (R) e F ∈ S 0 (R). Se c `e un numero reale diverso da zero vale anche, δ(c (x − a)) =

δ(x − a) . | c|

Data una funzione reale f (x), in certe condizioni resta definita anche l’espressione δ(f (x)). Pu`ı precisamente, se f `e derivabile e ha un numero finito di zeri {xn } tali che le derivate prime f 0 (xn ) sono tutte diverse da zero, si definisce, δ(f (x)) =

X δ(x − xn ) n

|f 0 (xn )|

.

(2.37)

L’origine di questa definizione diventa evidente se si applicano entrambi i membri a una funzione di test, e se nell’integrale risultante a primo membro si esegue formalmente il cambiamento di variabile x → y = f (x). Un caso che incontreremo di frequente corrisponde alla funzione f (x) = x2 − a2 , a 6= 0, per cui la (2.37) d`a, δ(x2 − a2 ) =

1 (δ(x − a) + δ(x + a)) . 2|a|

Dalla definizione della convoluzione data sopra segue inoltre che si ha, δ ∗ ϕ = ϕ, 34

(2.38)

per ogni ϕ ∈ S. Funzione–δ di Dirac quadridimensionale. La distribuzione di Dirac si generalizza immediatamente a uno spazio di dimensione arbitraria. Per definitezza, e in vista dell’uso che ne faremo in seguito, qu`ı presentiamo il caso quadridimensionale. Dato un quadrivettore aµ la distribuzione di Dirac δa , supportata in xµ = aµ , `e l’elemento di S 0 (R4 ) definito da δa (ϕ) = ϕ(a), per ogni ϕ ∈ S(R4 ). Essa viene rappresentata dall’espressione simbolica, δ 4 (x − a) = δ(x0 − a0 ) δ 3 (~x − ~a) = δ(x0 − a0 )δ(x1 − a1 )δ(x2 − a2 )δ(x3 − a3 ), e si scrive,

(2.39)

Z δa (ϕ) =

δ 4 (x − a) ϕ(x) d4 x = ϕ(a).

Per le sue derivate si ottiene, (∂µ δa )(ϕ) = −δa (∂µ ϕ) = −∂µ ϕ(a), che in notazione simbolica si scrive come, Z ∂µ δ 4 (x − a) ϕ(x) d4 x = −∂µ ϕ(a). Per ogni f ∈ OM (R4 ) si ha poi, f (x) δ 4 (x − a) = f (a) δ 4 (x − a). In questo caso da questa relazione seguono le identit`a, xµ δ 4 (x) = 0,

xµ xν ∂ρ δ 4 (x) = 0,

xµ ∂ν δ 4 (x) = −δνµ δ 4 (x),

etc.

Se Cµ ν `e una qualsiasi matrice 4 × 4 invertibile si ha inoltre, δ 4 (C(x − a)) =

δ 4 (x − a) . | det C|

La quadricorrente in notazione tridimensionale. Per illustrare l’uso della δ di Dirac come funzione simbolica deriviamo la forma tridimensionale della quadricorrente j µ di un sistema di particelle, vedi (2.6). A questo scopo esplicitiamo l’integrale r–esimo in (2.6),

35

scegliendo come variabile di integrazione la coordinata temporale della particella r–esima, cio`e, λr = yr0 . Usando la (2.39) si ottiene, µ

j (x) =

X

Z er

r

γr

X dyrµ (yr0 ) 4 0 0 )) dy = δ (x−y (y er r r r dyr0 r

Z γr

dyrµ (yr0 ) δ(t−yr0 ) δ 3 (~x−~yr (yr0 )) dyr0 . dyr0

A questo punto si pu`o eseguire l’integrale della δ(t − yr0 ) in dyr0 , considerando il resto dell’integrando come una “funzione di test”, la quale va quindi valutata in yr0 = t. Si ottiene, j µ (t, ~x) =

X

er

r

dyrµ (t) 3 δ (~x − ~yr (t)), dt

dove `e sottinteso che yr0 (t) = t. Scrivendo separatamente parte temporale e parte spaziale si ottengono rispettivamente la densit`a di carica e la densit`a di corrente spaziale, j 0 (t, ~x) =

X

er δ 3 (~x − ~yr (t)),

(2.40)

er ~vr (t) δ 3 (~x − ~yr (t)).

(2.41)

r

~j(t, ~x) =

X r

Distribuzioni con supporto in un punto. Completiamo l’elenco delle propriet`a della δ di Dirac enunciando un teorema che vincola fortemente la forma di una distribuzione che `e “diversa da zero” solo in un insieme finito di punti, vale a dire il cui supporto `e costituito da un insieme finito di punti. Teorema: Una distribuzione F ∈ S 0 (RD ) il cui supporto `e costituito dal punto xµ = aµ , `e necessariamente una combinazione lineare finita della δ D (x − a) e delle sue derivate. Avremo, cio`e, F = c δ D (x − a) + cµ ∂µ δ D (x − a) + · · · + cµ1 ···µn ∂µ1 · · · ∂µn δ D (x − a),

(2.42)

dove i cµ1 ···µk sono coefficienti costanti. Se il supporto di una distribuzione `e invece costituito da un insieme finito di punti, essa `e data da una somma di espressioni del tipo (2.42). Come vedremo questo teorema risulter`a molto utile nella soluzione di equazioni algebriche per distribuzioni. Trasformata di Fourier di una distribuzione. La trasformata di Fourier costituisce una biiezione di S in se stesso ed, opportunamente estesa, di S 0 in se stesso. Indicheremo la trasformata di Fourier di un generico elemento ϕ ∈ S con ϕ, b e analogamente quella di un 36

generico elemento F ∈ S 0 con Fb. Nello spazio–tempo di Minkowski quadridimensionale per una generica funzione di test si ha, 1 ϕ(k) b = (2π)2

Z 4

d xe

−ik·x

1 ϕ(x) = (2π)2

ϕ(x),

Z d4 k eik·x ϕ(k), b

dove abbiamo introdotto le quattro variabili duali k ≡ k µ e definito k · x ≡ k µ xν ηµν . Si noti che, strettamente parlando, per quanto riguarda la variabile ~x la nostra definizione corrisponde in realt`a all’antitrasformata di Fourier. La trasformata di Fourier di una distribuzione `e allora definita da, Fb(ϕ) = F (ϕ), b

∀ ϕ ∈ S.

Da questa definizione segue facilmente che in notazione simbolica si ha, Fb(k) =

1 (2π)2

Z 4

d xe

−ik·x

1 F (x) = (2π)2

F (x),

Z d4 k eik·x Fb(k),

ma insistiamo sul fatto che questi integrali sono da intendersi come tali solo se la distribuzione F `e sufficientemente regolare. Per le derivate e la moltiplicazione per una coordinata si ha, ∂ b µ F (k) = i xd F (k), ∂kµ

b ∂d µ F (k) = i kµ F (k),

con ovvie estensioni alla trasformata di Fourier di un generico polinomio in xµ e ∂ν , applicato a F . Ricordiamo in particolare le trasformate della δ 4 e delle sue derivate, 4 (x)(k) = δ[

1 , (2π)2

ikµ 4 ∂\ . µ δ (x)(k) = (2π)2

Per concludere riportiamo la formula per la trasformata di Fourier della convoluzione tra un elemento F di S 0 e un elemento ϕ di S. In uno spazio a dimensione D in notazione simbolica si ha, \ F ∗ ϕ (k) = (2π)D/2 Fb(k) ϕ(k). b 2.3.3

Identit` a di Bianchi e forme differenziali

Una volta assodato che le equazioni per il campo elettromagnetico devono essere formulate nello spazio delle distribuzioni `e opportuno riesaminarle in questo nuovo ambito. In questo 37

paragrafo rianalizzeremo l’identit`a di Bianchi (2.13) e la sua soluzione generale (2.22), mentre nel prossimo paragrafo ci dedicheremo all’equazione di Maxwell. Come ora sappiamo le componenti di F µν non sono derivabili ovunque – come funzioni – e le derivate ∂ν Fρσ che compaiono nella (2.13) vanno eseguite nel senso delle distribuzioni. Si ripresenta allora la domanda se l’espressione Fµν = ∂µ Aν − ∂ν Aµ `e ancora soluzione dell’identit`a di Bianchi, ovverosia, se il calcolo formale eseguito in (2.23) `e ancora valido. Se vogliamo dare senso a questa domanda, come prima cosa dobbiamo considerare anche le componenti di Aµ come distribuzioni. A questo punto la correttezza del risultato (2.23) – indipendentemente dalla presenza o meno di singolarit`a in Aµ , purch´e di carattere distribuzionale – segue semplicemente dal fatto che le derivate nel senso delle distribuzioni commutano. Per dimostrare il viceversa, cio`e, che in S 0 (R4 ) ogni soluzione di (2.13) pu`o essere scritta nella forma (2.22), conviene fare uso di un formalismo che viene introdotto in Geometria Differenziale 4 , pi` u precisamente il formalismo delle “p–forme differenziali a valori nello spazio delle distribuzioni”. Questi oggetti geometrici – che vengono chiamati anche pi` u semplicemente “p–forme” – sono essenzialmente tensori di rango (0, p) completamente antisimmetrici a valori in S 0 (R4 ). L’analisi che segue, non essendo indispensabile per la comprensione del resto del testo, `e rivolta a coloro che sono familiari con questo formalismo. Nel linguaggio delle forme al tensore antisimmetrico F µν resta associata la due–forma, F =

1 ν dx ∧ dxµ Fµν . 2

(2.43)

Ricordiamo poi che sull’algebra delle forme `e definito l’operatore “differenziale esterno” d, che associa a una p–forma una (p + 1)–forma, e risulta nihilpotente, cio`e soddisfa, d2 = 0. Nell’ambito delle forme a valori nelle distribuzioni questa propriet`a `e conseguenza diretta del fatto che le derivate parziali nel senso delle distribuzioni commutano sempre. Per 4

Un testo che presenta la Geometria Differenziale con particolare riferimento alle sue applicazioni in fisica, compreso il linguaggio delle forme differenziali, `e “Analysis, Manifolds and Physics”, di Yvonne Choquet–Bruhat, Cecile DeWitt–Morette e Margaret Dillard–Bleick, ed. North–Holland, Amsterdam, 1982.

38

definizione il differenziale esterno di F `e la tre–forma, dF =

1 ν dx ∧ dxµ ∧ dxρ ∂[ρ Fµν] . 2

L’identit`a di Bianchi `e allora equivalente alla richiesta che F sia una forma chiusa, cio`e, che valga dF = 0. Infatti, vedi problema 2.2, dF = 0



∂[ρ Fµν] = 0.

Siccome F `e una forma chiusa, secondo il Lemma di Poincar´e nello spazio delle forme a valori nelle distribuzioni, essa `e anche esatta 5 . Esiste, cio`e, una uno–forma A = dxν Aν a valori nelle distribuzioni tale che, F = dA.

(2.44)

Esplicitando il differenziale si ottiene, F =

1 ν dx ∧ dxµ Fµν = d(dxν Aν ) = dxν ∧ dxµ ∂[µ Aν] , 2

e quindi, Fµν = 2∂[µ Aν] = ∂µ Aν − ∂ν Aµ , che corrisponde alla (2.22). D’altra parte, dato che l’operatore d `e nihilpotente la uno– forma A data in (2.44) `e a sua volta definita modulo uno–forme esatte, A ≈ A + dΛ,

(2.45)

dove Λ `e una zero–forma, ovverosia un campo scalare. Siccome dΛ = dxµ ∂µ Λ la (2.45) si traduce in, Aµ ≈ Aµ + ∂µ Λ, cosicch`e ritroviamo che il potenziale vettore `e definito modulo una trasformazione di gauge. In conclusione, nel linguaggio delle forme differenziali le relazioni (2.25) si scrivono semplicemente, dF = 0

⇐⇒

F = dA,

5

con A ≈ A + dΛ.

Nello spazio delle forme differenziali a valori in S 0 (RD ) il lemma di Poincar´e asserisce che ogni forma chiusa `e anche esatta. Questo `e essenzialmente dovuto al fatto che lo spazio RD `e topologicamente banale.

39

Si vede che da un lato il formalismo delle forme differenziali `e utile perch´e fornisce una notazione compatta che evita di indicare esplicitamente gli indici; dall’altro lato nell’ambito della teoria delle distribuzioni esso permette di definire le componenti delle p– forme “globalmente” – vale a dire in tutto R4 – anche in presenza di singolarit`a. Notiamo, tuttavia, che questo formalismo non si applica a tensori che non sono completamente antisimmetrici. 2.3.4

Il campo elettromagnetico della particella statica

La necessit`a di considerare le equazioni che governano la dinamica del campo elettromagnetico nello spazio delle distribuzioni, emerge molto chiaramente dal semplice esempio di una particella statica. Per questo motivo analizzeremo ora in dettaglio questo caso. Ad una particella statica nell’origine corrisponde la linea di universo, y 0 (t) = t, ~y (t) = 0, e quindi ~v (t) = 0. Secondo le (2.40) e (2.41) ad essa corrisponde la quadricorrente, ~j(t, ~x) = 0.

j 0 (t, ~x) = e δ 3 (~x),

In questo caso sappiamo che il campo magnetico `e nullo, ~ = 0, B e che il campo elettrico `e statico. L’equazione di Maxwell e l’identit`a di Bianchi si riducono allora rispettivamente a, ~ ·E ~ = e δ 3 (~x), ∇

~ ×E ~ = 0, ∇

(2.46)

vedi (2.28)–(2.31). Come `e noto la soluzione di questo sistema di equazioni dovrebbe essere data dal campo coulombiano, ~ ~x) = e ~x , E(t, 4π r3

r = |~x|,

(2.47)

affermazione che ora rianalizzeremo criticamente. ~ nel senso delle funzioni. Dato Come analisi preliminare ci calcoliamo le derivate di E che ∂i r = xi /r, per ~x 6= 0 si ottiene facilmente, µ ¶ e xi xj j ij ∂i E = δ −3 2 . 4πr3 r 40

(2.48)

L’identit`a di Bianchi sarebbe quindi soddisfatta in quanto ∂i E j − ∂j E i = 0, mentre l’equazione di Maxwell sarebbe violata, perch´e si otterrebbe ∂i E i = 0 ! L’errore sta ~ che l’operator ∂i nello spazio delle funzioni. evidentemente nell’avere considerato sia E Rianalizziamo dunque il problema nello spazio di distribuzioni S 0 ≡ S 0 (R3 ), appropriato per il caso statico. Come prima cosa dobbiamo domandarci se le componenti E i del campo elettrico (2.47) appartengono effettivamente ad S 0 . La risposta `e affermativa ~ ha solo una singolarit`a integrabile in ~x = 0, e all’infinito `e limitato da una in quanto E costante, vedi problema 2.4. Le derivate ∂i E j sono allora ben definite in S 0 , ma esse vanno – per l’appunto – calcolate nel senso delle distribuzioni, vale a dire applicando la (2.35). Presentiamo prima i calcoli spiegando i passaggi intermedi di seguito, e (∂i E )(ϕ) = −E (∂i ϕ) = − 4π j

Z

xj e d x 3 ∂i ϕ = − lim r 4π ε→0

j

e = − lim 4π ε→0 e = lim 4π ε→0

Z

·Z

Z

3

d3 x r> ε

xj ∂i ϕ r3

· µ j ¶ µ j¶ ¸ x x d x ∂i ϕ − ∂i ϕ 3 r r3 r> ε 3

Z

1 dΩ n n ϕ + dx 3 r r=ε r>ε

e ij e = δ ϕ(0) + 3 4π

i j

Z

1 dx 3 r 3

3

µ

µ ¶ ¸ xi xj ij δ −3 2 ϕ r

xi xj δ −3 2 r ij

¶ ϕ.

(2.49)

Spieghiamo ora i passaggi. L’integrando della prima riga appartiene a L1 (R3 ), e cos`ı possiamo eseguire l’integrale introducendo una successione invadente qualsiasi. Abbiamo usato la successione invadente Vε = R3 \Sε , dove Sε `e la palla di raggio ε centrata nell’origine. Siccome in Vε l’integrando `e di classe C ∞ abbiamo poi potuto usare il calcolo differenziale standard. Nella seconda riga abbiamo cos`ı usato la regola di Leibnitz e nella terza il teorema di Gauss. Il bordo di Vε `e costituito dalla sfera all’infinito, che non d`a contributo al flusso perch´e ϕ svanisce all’infinito pi` u rapidamente dell’inverso di qualsiasi potenza, e dalla sfera di raggio ε centrata nell’origine. Per valutare l’integrale su questa sfera abbiamo usato coordinate polari ~x ↔ (r, Ω), con Ω = (φ, ϑ) e dΩ ≡ senϑ dϑ dφ, e introdotto il versore radiale uscente ni = xi /ε. L’elemento di superficie diventa allora

41

dΣi = ni ε2 dΩ. Infine abbiamo ultilizzato l’integrale sugli angoli, vedi problema 2.6, Z dΩ ni nj =

4π ij δ . 3

~ Riscrivendo la (2.49) in notazione simbolica otteniamo in definitiva per le derivate di E nel senso delle distribuzioni, e e ∂i E = δ ij δ 3 (~x) + 3 4πr3 j

µ ¶ xi xj ij δ −3 2 . r

(2.50)

Confrontando con la (2.48) si vede che il calcolo “naiv” `e valido per ~x 6= 0, ma non `e capace di rivelare la presenza del termine supportato in ~x = 0, dove il campo elettrico `e infatti singolare 6 . Come si vede l’espressione (2.50) soddisfa ora entrambe le equazioni di (2.46), la prima in particolare essendo equivalente all’identit`a in S 0 , ~ · ~x = 4π δ 3 (~x). ∇ r3

(2.51)

Infine possiamo rileggere i nostri risultati in termini del potenziale coulombiano A0 . La ~ ×E ~ = 0 `e infatti data da, soluzione generale dell’identit`a di Bianchi ∇ ~ = −∇A ~ 0. E Data la (2.47) si verifica facilmente (esercizio) che questa relazione `e soddisfatta – anche nel senso delle distribuzioni – se si sceglie il potenziale, A0 =

e , 4πr

(2.52)

appartenente anch’esso S 0 . L’analisi svolta sopra implica allora la validit`a dell’equazione di Poisson −∇2 A0 = e δ 3 (~x), dalla quale segue la nota identit`a, ∇2

1 = −4π δ 3 (~x). r

(2.53)

L’equazione di Lorentz. Una volta risolte l’equazione di Maxwell e l’identit`a di Bianchi possiamo considerare l’equazione di Lorentz, le cui componenti indipendenti sono date 6 Si noti che il secondo e il terzo termine in (2.50), che per r → 0 si comportano entrambi come 1/r3 , ` solo la particolare combinazione lineare presi separatamente non costituiscono affatto distribuzioni. E che compare in (2.50), con coefficiente relativo −3, ad essere un elemento di S 0 .

42

in (2.21). Siccome abbiamo ~v = p~ = 0, il membro di sinistra di questa equazione `e identicamente nullo. D’altra parte, dato che ~y (t) = 0 il membro di destra della (2.21) si ~ ~0), espressione che – data la (2.47) – diverge! Ritroviamo cos`ı che la ridurrebbe a e E(t, forza esercitata dal campo elettromagnetico generato da una particella puntiforme sulla particella stessa `e divergente, e che l’equazione di Lorentz `e inconsistente. A dire il vero nel caso statico qu`ı considerato conosciamo una soluzione pragmatica del problema: in ~ ~0) uguale a zero, accordo con l’esperienza dobbiamo porre la quantit`a mal definita E(t, perch´e sperimentalmente si osserva che una particella statica non subisce nessuna forza. Vedremo, tuttavia, che nel caso generale di una particella in moto vario questa semplice ricetta non risulta implementabile, perch´e entrerebbe in conflitto con la conservazione del quadrimomento totale. L’energia infinita del campo elettromagnetico. Concludiamo l’analisi della particella statica con un ulteriore commento, anticipando l’espressione per la densit`a di energia del campo elettromagnetico, vedi paragrafo 2.4.3, ρem =

1 2 (E + B 2 ). 2

~ = 0, l’energia totale del campo elettromagnetico di una Vista la (2.47) e dato che B particella statica risulterebbe quindi, Z ³ e ´2 Z d3 x 3 εem = ρem d x = , 4π r4 che corrisponde a una “costante” divergente, per via del comportamento singolare dell’integrando in r → 0. D’altra parte, nel caso sotto esame l’energia della particella `e m conservata banalmente, essendo ε = √ = m, e allora – se si deve conservare l’ener1 − v2 gia totale – anche l’energia εem del campo elettromagnetico dovrebbe essere una costante (finita). Nel capitolo 13 vedremo che nel caso statico l’unico valore di εem compatibile con l’invarianza relativistica, in realt`a `e εem = 0. Ma vedremo anche che nel caso di una particella in moto arbitrario, questa semplice scelta “fatta a mano” violerebbe sia la conservazione del quadrimomento totale, sia l’invarianza relativistica. ` abbastanza evidente che il problema dell’energia infinita del campo elettromagnetico E – cos`ı come quello dell’autointerazione infinita di una particella carica – `e conseguenza della natura puntiforme delle particelle elementari: mentre il secondo in ultima analisi `e 43

tuttora irrisolto, vedi capitolo 12, il primo ha trovato una soluzione – anche se solo di recente – nell’ambito della teoria delle distribuzioni 7 . Noi la presenteremo in una forma alternativa nel capitolo 13.

2.4

Le costanti del moto dell’Elettrodinamica

In Fisica un ruolo fondamentale viene giocato dalle costanti del moto associate alla dinamica di un sistema, ovverosia dalle grandezze fisiche che si conservano durante la sua evoluzione temporale. D’altra parte, come `e noto esiste un legame molto stretto tra leggi di conservazione e simmetrie continue di una teoria, legame che viene concretizzato dal teorema di Noether. L’importanza concettuale di questo teorema che, oltre a stabilire l’esistenza di costanti del moto ne fornisce anche la forma esplicita, risiede nella sua generalit`a: `e valido in qualsiasi teoria le cui equazioni del moto possano essere dedotte da un principio variazionale. Per l’Elettrodinamica di particelle puntiformi, le cui equazioni del moto sono relativamente semplici, deriveremo ora la forma delle principali costanti del moto in modo euristico – senza ricorrere a questo teorema – utilizzando invece nozioni di elettromagnetismo di base. La verifica che le costanti del moto cos`ı ottenute combaciano perfettamente con quelle previste dal teorema di Noether verr`a poi fatta nel capitolo 4. 2.4.1

Conservazione e invarianza della carica elettrica

Come prototipo di una legge di conservazione locale, che sia cio`e basata su un’equazione di continuit`a per un’opportuna quadricorrente j µ , consideriamo la conservazione della carica elettrica. Se la materia carica `e costituita da particelle puntiformi la corrente `e data dalla (2.6); se la carica `e invece distribuita con continuit`a la corrente ha una forma generica. Per quello che segue la forma particolare della corrente sar`a irrilevante, in quanto assumeremo soltanto che essa goda delle seguenti propriet`a: I) j µ `e un campo vettoriale, II) j µ soddisfa l’equazione di continuit`a, ∂µ j µ = 0, III) lim|~x|→∞ |~x|3 j µ (t, ~x) = 0, richiediamo cio`e che per ogni t fissato la corrente decada 7

E.G.P. Rowe, Phys. Rev. D 18 3639 (1978).

44

all’infinito spaziale pi` u rapidamente di 1/|~x|3 , propriet`a certamente posseduta da (2.40) e (2.41). Sotto queste ipotesi vogliamo ora dimostrare che esiste una carica totale Q conservata, e che essa `e uno scalare sotto trasformazioni di Lorentz. La costruzione della carica segue una procedura standard, che consiste nell’integrare l’equazione di continuit`a su un volume V , Z

Z 0

∂0

~ · ~j d3 x. ∇

3

j d x=− V

V

Applicando il teorema di Gauss e definendo la carica contenuta in un volume V come R QV = V j 0 d3 x, si ottiene poi l’equazione di conservazione locale, dQV =− dt

Z ~ ~j · dΣ.

(2.54)

∂V

La derivata della carica contenuta nel volume V eguaglia dunque l’opposto del flusso della corrente spaziale attraverso il bordo di V . Se estendiamo ora il volume a tutto R3 , per la propriet`a III) converge l’integrale della densit`a j 0 su tutto lo spazio, mentre va a zero il flusso della corrente spaziale all’infinito 8 . Si ottiene quindi la carica conservata, Z Q=

dQ = 0. dt

j 0 d3 x,

(2.55)

Che la carica totale sia un invariante di Lorentz – propriet`a certamente non posseduta dalla carica in un volume finito QV – `e un po’ meno ovvio. Per dimostrarlo valutiamo la carica, che `e indipendente dal tempo, all’istante t = 0 e la riscriviamo come segue, Z Q=

Z 0

3

j (0, ~x) d x =

Z 0

4

j (x) δ(t) d x =

Z 0

4

j (x)∂0 H(t) d x =

j µ (x) ∂µ H(t) d4 x.

Abbiamo introdotto la funzione di Heaviside H(t), nulla per t < 0 e uguale a 1 per t ≥ 0, legata alla δ di Dirac dalla nota relazione, dH(t) = δ(t). dt 8

Se V si estende a tutto lo spazio possiamo scegliere per ∂V una sfera di raggio R e mandare R ~ = ~n R2 dΩ, dove ~n ´e il versore normale all’infinito. Conviene passare a coordinate dΣ R polari. Ponendo R ~ ~ alla sfera e Ω l’angolo solido, otteniamo ∂V j · dΣ = dΩ ~n · (limR→∞ R2 ~j). Ma per la propriet`a III) il limite tra parentesi `e zero.

45

Consideriamo ora la carica totale Q0 in un altro sistema di riferimento, legato al primo da una trasformazione di Lorentz propria x0µ = Λµ ν xν , Λ0 0 ≥ 1. Con lo stesso procedimento di cui sopra troviamo,

Z 0

j 0µ (x0 ) ∂µ0 H(t0 ) d4 x0 .

Q =

Sfruttando le trasformazioni di Lorentz, j 0µ (x0 ) = Λµ ν j ν (x), e µ ρ ∂ρ , ∂µ0 = Λ d4 x0 = |detΛ| d4 x = d4 x, si ottiene poi,

Z 0

Q =

j µ (x)∂µ H(t0 ) d4 x,

dove, t 0 = Λ 0 0 t + Λ 0 i xi . Possiamo infine valutare la differenza, Z Z 0 µ 0 4 Q − Q = j (x) ∂µ (H(t ) − H(t)) d x = ∂µ [j µ (x) (H(t0 ) − H(t))] d4 x,

(2.56)

(2.57)

dove nell’ultimo passaggio abbiamo sfruttato l’equazione di continuit`a. Dividiamo ora la quadridivergenza in parte spaziale e parte temporale, applicando alla prima il teorema di Gauss in d = 3, e alla seconda il teorema fondamentale del calcolo in t. Supponendo di poter scambiare gli ordini di integrazione si ottiene, Z Z Z 0 0 ~ + d3 x j 0 (x)(H(t0 ) − H(t))|t=+∞ . Q − Q = dt (H(t ) − H(t))~j(x) · dΣ t=−∞ Γ∞

Nel primo termine Γ∞ `e una superficie sferica posta all’infinito spaziale, dove ~j si annulla pi` u rapidamente di 1/|~x|3 ; l’integrale del flusso `e quindi zero. Nel secondo termine dobbiamo valutare la differenza H(t0 ) − H(t) nei limiti t → ±∞, per ~x fissato. Grazie al fatto che Λ0 0 ≥ 1, dalla (2.56) si vede che per t → +∞ anche t0 → +∞, ed entrambe le funzioni di Heaviside vanno a 1, mentre per t → −∞ anche t0 → −∞ ed entrambe le funzioni di Heaviside vanno a zero. Anche il secondo integrale `e quindi zero e abbiamo, Q0 = Q. 46

2.4.2

Tensore energia–impulso e conservazione del quadrimomento

In questo paragrafo – e nel successivo – illustreremo come il principio di conservazione dell’energia e della quantit`a di moto – cardine di qualsiasi teoria fisica fondamentale – viene realizzato nell’ambito dell’Elettrodinamica, come conseguenza delle equazioni (2.12)– (2.14). Ma prima di considerare il caso particolare dell’Elettrodinamica, imposteremo ora il problema in una generica teoria relativistica. In una teoria relativistica l’energia costituisce la quarta componente di un quadrivettore, appunto del quadrimomento. Siccome una trasformazione di Lorentz mescola energia e quantit`a di moto ci aspettiamo quindi che la conservazione della prima non possa avvenire senza la contemporanea conservazione della seconda. In realt`a stiamo quindi cercando quattro costanti del moto raggruppate nel quadrimomento P ν , la cui componente temporale P 0 = ε rappresenta l’energia totale del sistema. In analogia con la carica elettrica ci aspettiamo anche per il quadrimomento leggi di conservazione locali, ovverosia ci aspettiamo che ad ogni componente del quadrimomento P ν sia associata una corrente conservata. Indichiamo le quattro correnti risultanti con, j µ(ν) (x) ≡ T µν (x),

(2.58)

grandezza che viene chiamata “tensore energia–impulso”. In base a quanto abbiamo appena detto postuliamo che in una teoria relativistica la conservazione del quadrimomento sia conseguenza dell’esistenza di un tensore energia– impulso, che gode delle seguenti propriet`a: I) T µν `e un campo tensoriale, II) T µν soddisfa l’equazione di continuit`a, ∂µ T µν = 0, III) lim|~x|→∞ |~x|3 T µν (t, ~x) = 0. La propriet`a I) assicura in particolare la covarianza dell’equazione di continuit`a II), cio`e, se essa vale in un sistema di riferimento vale in tutti i sistemi di riferimento. Procediamo ora come nel caso della corrente elettrica per dedurre l’esistenza di quantit`a conservate. Integrando l’equazione di continuit`a su un volume finito otteniamo, Z

Z

∂0

T



3

∂i T iν d3 x.

d x=−

V

V

47

(2.59)

In base all’identificazione (2.58) le componenti T 0ν corrispondono alla densit` a di quadrimomento, e il quadrimomento contenuto in un volume V `e dunque dato da, Z ν PV = T 0ν d3 x.

(2.60)

V

La (2.59) ci dice allora che le quantit`a T iν sono da interpretarsi come “densit`a di corrente di quadrimomento”. Infatti, applicando il teorema di Gauss si ottiene l’equazione del flusso, dPVν =− dt

Z T iν dΣi .

(2.61)

∂V

Scriviamo in particolare le componenti ν = 0 delle (2.60), (2.61), che riguardano l’energia εV ≡ PV0 contenuta nel volume V , Z εV = T 00 d3 x, V

dεV =− dt

Z T i0 dΣi . ∂V

Si vede che mentre T 00 rappresenta la densit`a di energia, il vettore tridimensionale T i0 rappresenta il flusso di energia, entrambe quantit`a che in seguito giocheranno un ruolo importante. Interpretazioni analoghe valgono per le componenti T µi , che riguardano la quantit`a di moto. Se infine nella (2.61) estendiamo il volume a tutto lo spazio, grazie alla propriet`a III) deduciamo che il quadrimomento totale `e conservato, Z dP ν ν P = T 0ν d3 x, = 0. dt

(2.62)

A questo punto facciamo notare che il quadrimomento PVν contenuto in un volume finito – che in generale dipende dal tempo – non ha propriet`a ben definite sotto trasformazioni di Lorentz, mentre, se vogliamo che la conservazione del quadrimomento totale sia una propriet`a preservata nel passaggio da un sistema di riferimento a un altro, dobbiamo dimostrare che P ν costituisce effettivamente un quadrivettore. La dimostrazione di questo fatto si basa sulle propriet`a I)–III), e segue da vicino quella dell’invarianza della carica elettrica del paragrafo precedente. Eseguendo gli stessi passaggi si ottiene facilmente, Z Z ν µν 4 0ν P = T (x) ∂µ H(t) d x, P = T 0µν (x0 ) ∂µ0 H(t0 ) d4 x0 . Considerando che i tensori energia–impulso nei due riferimenti sono legati dalla relazione, T 0µν (x0 ) = Λµ α Λν β T αβ (x), 48

si ottiene,

Z P





ν

β

T µβ (x) ∂µ H(t0 ) d4 x.

Calcoliamo allora la differenza, Z Z £ ¤ 0ν ν β ν µβ 0 4 ν P −Λ β P = Λ β T (x)∂µ (H(t )−H(t)) d x = Λ β ∂µ T µβ (x)(H(t0 ) − H(t)) d4 x, dove nell’ultimo passaggio abbiamo sfruttato l’equazione di continuit`a. L’integrale ottenuto `e della stessa forma dell’integrale (nullo) in (2.57), e quindi anch’esso `e zero. Vale dunque, P 0ν = Λν β P β , come volevamo dimostrare. 2.4.3

Il tensore energia–impulso dell’Elettrodinamica

In questo paragrafo diamo una dimostrazione costruttiva dell’esistenza di un tensore energia–impulso per l’Elettrodinamica classica, che goda delle propriet`a postulate nel paragrafo precedente. Deriveremo prima, in modo euristico, la forma della densit`a di energia T 00 , dopodich`e useremo l’invarianza di Lorentz per ricostruire l’intero tensore. Per cominciare ricordiamo la nota formula per la densit`a di energia del campo elettromagnetico, 00 Tem =

1 2 (E + B 2 ). 2

(2.63)

00 Chiaramente l’energia totale conservata non potr`a essere data solo dall’integrale di Tem ,

perch´e sappiamo che il campo elettromagnetico scambia energia con le particelle cariche. 00 Per quantificare questo scambio ci calcoliamo la derivata temporale di Tem , usando le

equazioni di Maxwell nella forma (2.28)–(2.31), 00 ~ ~ ∂Tem ~ · ∂E + B ~ · ∂B = E ∂t ∂t´ ³∂t ~· ∇ ~ ×B ~ − ~j − B ~ ·∇ ~ ×E ~ = E ³ ´ ~ −∇ ~ · E ~ ×B ~ . = −~j · E

Integriamo ora questa relazione su tutto lo spazio. Applicando all’ultimo termine il teo~ eB ~ decrescano all’infinito spaziale abbastanza rapidarema di Gauss e assumendo che E mente, vediamo che esso non d`a contributo. Ricordando la forma della corrente spaziale 49

(2.41) possiamo allora scrivere, Z Z Z X d 00 3 3 ~ ~ ~x) δ 3 (~x − ~yr (t)) d3 x (2.64) ~ Tem d x = − E · j d x = − er ~vr · E(t, dt r à ! X X d ~ ~yr (t)) = − = − er ~vr · E(t, εr , (2.65) dt r r p dove abbiamo usato la legge della potenza (2.20), con εr = mr / 1 − vr2 . La relazione che abbiamo ottenuto ci dice che si conserva l’energia totale del sistema, nella forma, ! Z à Z X X 1 00 3 d x+ εr = ε = Tem (E 2 + B 2 ) + εr δ 3 (~x − ~yr (t)) d3 x. 2 r r Da questa formula possiamo dedurre l’espressione della densit`a di energia, T 00 =

X 1 2 εr δ 3 (~x − ~yr (t)). (E + B 2 ) + 2 r

Viene allora naturale assumere che il tensore energia–impulso totale possa essere scritto come somma di due contributi, uno che rappresenta solo i campi e l’altro che rappresenta solo le particelle, µν T µν = Tem + Tpµν ,

(2.66)

con le condizioni, 00 Tem =

1 2 (E + B 2 ), 2

Tp00 =

X

εr δ 3 (~x − ~yr (t)).

(2.67)

r

Con queste posizioni cerchiamo ora di determinare i due tensori separatamente, sfruttando il fatto che sotto trasformazioni di Lorentz entrambi si devono trasformare in modo covariante. 00 Cominciamo con il contributo del campo elettromagnetico. Siccome Tem `e bilineare in

~ eB ~ – che sono le componenti del tensore F µν – e siccome le trasformazioni di Lorentz E µν devono essere bilineari sono lineari, possiamo concludere che tutte le componenti di Tem

in F µν . La covarianza di Lorentz impone allora la seguente struttura generale, dove a, b e c sono per il momento costanti arbitrarie 9 , µν Tem = a F µ α F αν + b η µν F αβ Fαβ + c F µν F α α . 9

(2.68)

A priori potrebbero essere presenti anche contributi che coinvolgono il tensore di Levi–Civita εµνρσ , µν ~ → −E, ~ B ~ → B, ~ ma questi renderebbero Tem uno pseudotensore. Per parit`a, ovverosia per ~x → −~x, E 00 la componente Tem dovrebbe allora cambiare di segno, in contraddizione con la (2.63) che resta invece invariante.

50

L’ultimo termine `e identicamente nullo grazie all’antisimmetria di F αβ . Per determinare 00 le costanti a e b calcoliamo Tem dalla (2.68) e confrontiamo il risultato con la (2.67), 00 Tem = aF 0 α F α0 + b η 00 · 2(B 2 − E 2 )

= aF 0 i F i0 + 2b (B 2 − E 2 ) = (a − 2b)E 2 + 2bB 2 . Il confronto d`a a = 1, b = 1/4, e quindi, µν = F µ α F αν + Tem

1 µν αβ η F Fαβ . 4

(2.69)

Per determinare Tpµν riscriviamo la componente Tp00 in (2.67) nel modo seguente, Z XZ XZ X 00 4 0 0 4 mr u0r u0r δ 4 (x − yr ) dsr . Tp = εr δ (x − yr ) dyr = εr ur δ (x − yr ) dsr = r

r

r

Questa forma suggerisce di porre, Tpµν

=

X

Z uµr uνr δ 4 (x − yr ) dsr ,

mr

(2.70)

r

` che `e un tensore per trasformazioni di Lorentz e riproduce la componente 00 corretta. E sottinteso che l’integrale curvilineo `e esteso all’intera linea di universo di ciascuna particella, come nella definizione della quadricorrente. Integrando nuovamente la δ temporale possiamo riscrivere questo tensore in modo non manifestamente covariante, in una forma che sar`a utile nel prossimo paragrafo, Tpµν =

X pµ pν r

r

εr

r

δ 3 (~x − ~yr (t)).

(2.71)

Facciamo notare che i tensori dati in (2.69) e (2.70) sono simmetrici in µ e ν, e quindi lo `e anche il tensore energia–impulso totale, T µν = T νµ . Per il momento questa propriet`a sembra accidentale, ma essa giocher`a un ruolo rilevante in seguito. µν appena trovate sono state L’equazione di continuit` a per T µν . Le formula per Tpµν e Tem

dedotto in modo euristico, ma la loro giustificazione definitiva discende dal fatto che si pu`o dimostrare che il tensore energia–impulso totale T µν `e conservato se, 51

a) F µν soddisfa l’identit`a di Bianchi e l’equazione di Maxwell, b) le coordinate delle particelle soddisfano l’equazione di Lorentz. Per dimostrarlo calcoliamo la quadridivergenza dei due tensori separatamente, cominciando dal tensore elettromagnetico, 1 Fαβ ∂ ν F αβ 2 ¢ 1 − ∂ β F αν + Fαβ ∂ ν F αβ 2 ¢ + ∂ β F να + ∂ ν F αβ

µν ∂µ Tem = ∂µ F µα Fα ν + F µα ∂µ Fα ν +

¡ 1 Fαβ ∂ α F βν 2 ¡ 1 = −F να jα + Fαβ ∂ α F βν 2 X Z = − er F να (yr )urα δ 4 (x − yr ) dsr . = −F να jα +

(2.72)

r

Abbiamo usato l’equazione di Maxwell, l’identit`a di Bianchi nella forma (2.89), e la definizione della quadricorrente. Per calcolare la quadridivergenza del tensore energia–impulso delle particelle si eseguono gli stessi passaggi del calcolo della quadridivergenza della corrente elettrica ∂µ Tpµν

XZ

XZ

d 4 δ (x − yr ) dsr dsr r r X Z dpν X ¯sr =+∞ r 4 = δ (x − yr ) dsr − pνr δ 4 (x − yr )¯sr =−∞ dsr r r Z X dpν r 4 = δ (x − yr ) dsr . ds r r

=

pνr

uµr

4

∂µ δ (x − yr ) dsr = −

10

,

pνr

Sommando questo risultato alla (2.72) si ottiene, ¶ X Z µ dpν r µν να ∂µ T = − er F (yr )urα δ 4 (x − yr ) dsr = 0, ds r r

(2.73)

(2.74)

in virt` u dell’equazione di Lorentz. Concludiamo che le formule (2.66), (2.69) e (2.70) individuano un tensore energia– impulso che soddisfa le propriet`a I) e II) del paragrafo precedente. Sotto ipotesi molto generali si pu`o inoltre fare vedere che esso soddisfa anche la propriet`a III) sul suo andamento asintotico. Il contributo Tpµν soddisfa questa propriet`a in modo ovvio. Per quanto µν vedremo che esso la soddisfa, per esempio, se l’accelerazione riguarda invece il tensore Tem 10

Per non appesantire la notazione in questo calcolo usiamo per le distribuzioni la notazione simbolica. Per rendersi conto che i passaggi eseguiti sono corretti `e sufficiente applicare i risultati intermedi a una funzione di test ϕ.

52

delle particelle cariche svanisce per t → −∞ con sufficiente rapidit`a (in particolare se le particelle sono accelerate solo per un intervallo temporale finito). Nel capitolo 6 faremo, infatti, vedere che in questo caso il campo elettromagnetico ha l’andamento asintotico tipico di un campo coulombiano, F µν ∼

1 , r2

per r = |~x| → ∞.

µν Siccome Tem `e quadratico in F µν ne segue che asintoticamente, µν Tem ∼

1 , r4

µν e quindi r3 Tem → 0.

Prima di procedere osserviamo che nella dimostrazione dell’equazione di continuit`a appena svolta abbiamo evidentemente sottointeso l’identificazione dei due tipi di carica discussi alla fine del paragrafo 2.2.3, vale a dire abbiamo posto er = e∗r . Ricordiamo che le {e∗r } sono le cariche che compaiono – a priori – nella corrente, e che le {er } sono quelle che compaiono nelle equazioni di Lorentz. Ma `e facile ripetere gli stessi passaggi di cui sopra senza usare questa identificazione, e si vede immediatamente che al posto di ∂µ T µν = 0 si otterrebbe, vedi (2.74), ∂µ T

µν

=

X

Z (er −

e∗r )

F να (yr ) δ 4 (x − yr ) dyrα .

(2.75)

r

L’equazione di continuit`a `e quindi violata, a meno che non si abbia er = e∗r . L’identificazione dei due tipi di carica `e quindi effettivamente necessaria per assicurare la conservazione del quadrimomento totale del sistema, come anticipato nel paragrafo 2.2.3. Il significato delle componenti di T µν . Analizziamo ora brevemente il significato delle singole componenti di T µν , cominciando di nuovo con il contributo elettromagnetico. Calcoli elementari danno, 1 2 (E + B 2 ), 2 ~ × B) ~ i, = (E 1 2 = (E + B 2 ) δ ij − E i E j − B i B j . 2

00 Tem = i0 0i Tem = Tem ij Tem

(2.76) (2.77) (2.78)

00 dalla quale eravamo partiti. Nelle comRiotteniamo ovviamente la densit`a di energia Tem

ponenti miste riconosciamo poi il vettore di Poynting S i che, come sappiamo, rappresenta 53

effettivamente il flusso di energia del campo elettromagnetico, ~=E ~ × B. ~ S

i0 Tem = S i,

(2.79)

Vediamo inoltre che il vettore di Poynting eguaglia anche la densit`a di quantit`a di moto 0i Tem . Le componenti spazio–spazio invece formano un tensore simmetrico che viene chia-

mato “tensore degli sforzi di Maxwell”; esso rappresenta il flusso della quantit`a di moto. Infine osserviamo che il tensore energia–impulso elettromagnetico `e a traccia nulla, µν µ Tem µ = Tem ηµν = 0.

Per quanto riguarda il tensore energia–impulso delle particelle, dalla (2.71) si vede che la densit`a di quadrimomento ha la forma aspettata, Tp0µ =

X

pµr δ 3 (~x − ~yr (t)).

(2.80)

r

Infatti, il quadrimomento totale delle particelle che a un istante considerato si trovano all’interno di un volume V `e dato da, Z X Z X 0µ 3 Tp d x = pµr δ 3 (~x − ~yr (t)) d3 x = pµr , V

r

V

r∈V

dove la somma si estende a tutte le particelle contenute in V . Concludiamo questo paragrafo riprendendo il bilancio del quadrimomento riferito a un volume V . Secondo la (2.61) il quadrimomento che abbandona nell’unit`a di tempo il volume V ´e dato da,

dPVµ =− dt

Z T iµ dΣi . ∂V

L’intgrale a secondo membro `e un integrale di superficie e riceve – a priori – contributi iµ che da Tpiµ . Ma siccome le particelle all’istante considerato stanno o all’interno sia da Tem

o all’esterno della superficie, il termine Tpiµ non contribuisce e si ottiene, Z dPVµ iµ =− Tem dΣi . dt ∂V

(2.81)

In altre parole, la variazione del quadrimomento totale contenuto in V , che risulta dalla somma del quadrimomento delle particelle e di quello del campo elettromagnetico, `e causata dal solo flusso elettromagnetico. In particolare per “l’energia irradiata” nell’unit`a di 54

tempo dal volume V otteniamo, dεV =− dt

Z

Z ∂V

i0 Tem

~ · dΣ. ~ S

i

dΣ = −

(2.82)

∂V

Questa importante relazione sar`a la formula cardine per l’analisi energetica di tutti i fenomeni di irraggiamento. 2.4.4

Conservazione del momento angolare

In questo paragrafo stabiliremo la legge di conservazione locale del momento angolare quadridimensionale, in una generica teoria relativistica. Applicheremo poi la ricetta ottenuta all’Elettrodinamica. Sappiamo che in un sistema isolato di particelle non relativistiche, oltre all’energia e alla quantit`a di moto si conserva anche il momento angolare tridimensionale, nella forma, Li =

X

(~yr × p~r )i = εijk

r

X

yrj pkr ,

r

dove p~r = mr~vr `e la quantit`a di moto non relativistica della particella r–esima. In una teoria relativistica questa legge di conservazione vettoriale, opportunamente generalizzata dovrebbe acquisire carattere covariante quadridimensionale. Ma il tentativo pi` u naturale di estendere il momento angolare a un quadrivettore fallisce, in quanto il prodotto esterno tridimensionale non ammette nessuna estensione quadrivettoriale. Tuttavia, possiamo sfruttare il fatto che in tre dimensioni ogni vettore `e equivalente a un tensore doppio antisimmetrico, Lij ≡ εijk Lk =

X (yri pjr − yrj pir ).

(2.83)

r

In quanto tensore antisimmetrico questa espressione ammette ora un’estensione naturale a un quadritensore antisimmetrico di rango due, Lαβ p =

X (yrα pβr − yrβ pαr ),

βα Lαβ p = −Lp ,

(2.84)

r

purch´e identifichiamo

pαr

con il quadrimomento relativistico della particella. Un tensore

di questo tipo corrisponderebbe quindi a sei quantit`a conservate. In realt`a dovevamo aspettarci che il momento angolare relativistico fosse costituito da pi` u di tre componenti. Sappiamo, infatti, che in fisica Newtoniana la conservazione del momento angolare discende dall’invarianza per rotazioni spaziali, le quali costituiscono un gruppo a tre parametri. 55

A livello relativistico questo gruppo si allarga al gruppo di Lorentz che costituisce invece un gruppo a sei parametri, e quindi risulta naturale la comparsa di altrettante quantit`a conservate. Come per la carica elettrica e il quadrimomento assumiamo anche in questo caso leggi di conservazione locali. Ipotizziamo quindi l’esistenza di un tensore “densit`a di corrente di momento angolare” di rango tre M µαβ , con le propriet`a, I) M µαβ = −M µβα , II) ∂µ M µαβ = 0. Alla luce della (2.84), vedi sotto, postuliamo la seguente definizione, M µαβ = xα T µβ − xβ T µα .

(2.85)

La propriet`a I) `e allora valida per costruzione. Per quanto riguarda la II) calcoliamo, ∂µ M µαβ = δµα T µβ + xα ∂µ T µβ − δµβ T µα − xβ ∂µ T µα = T αβ − T βα , dove abbiamo sfruttato la conservazione del tensore energia–impulso. Vediamo ora che se quest’ultimo `e anche simmetrico – come nel caso dell’Elettrodinamica – allora risulta in effetti l’equazione di continuit`a, ∂µ M µαβ = 0. Seguendo il procedimento standard e assumendo opportuni andamenti asintotici dei campi all’infinito, segue allora che esistono sei quantit`a conservate date da, Z Z αβ 0αβ 3 L = M d x = (xα T 0β − xβ T 0α ) d3 x, Lαβ = −Lβα .

(2.86)

Con il consueto procedimento si dimostra poi anche che le quantit`a Lαβ costituiscono un tensore di rango due sotto trasformazioni di Lorentz. Inoltre, in assenza di campo elettromagnetico, cio`e per un sistema di particelle neutre, usando la (2.80) si vede immediatamente che la (2.86) si riduce alla (2.84). Giustifichiamo cos`ı – a posteriori – la definizione del momento angolare relativistico data in (2.85). In realt`a i campi M µαβ si comportano come campi “tensoriali” solo sotto trasformazioni di Lorentz, mentre sotto traslazioni, xµ → x0µ = xµ + aµ , essi trasformano in modo “anomalo”, M 0µαβ (x0 ) = M µαβ (x) + aα T µβ (x) − aβ T µα (x). 56

Ricordiamo, appunto, che sotto traslazioni un tensore non dovrebbe cambiare. In modo simile le quantit`a conservate (2.86) trasformano secondo, vedi (2.62), L0αβ = Lαβ + aα P β − aβ P α .

(2.87)

Questa anomalia si spiega facilmente osservando che la densit`a di momento angolare (2.85) `e stata calcolata considerando implicitamente come polo l’origine O, con coordinate xµO = 0. Per un polo generico la (2.85) si generalizza invece come, MOµαβ = (xα − xαO )T µβ − (xβ − xβO )T µα , espressione che risulta ora invariante per traslazioni e preserva, per di pi` u, le propriet`a I) e II) di cui sopra. La (2.87) pu`o allora essere interpretata come la versione relativistica della nota regola di cambiamento del momento angolare non relativistico per un cambiamento µ µ del polo, xµO → x0µ O = xO − a .

Esplicitiamo ora la forma delle costanti del moto Lαβ nel caso dell’Elettrodinamica. Analizziamo separatamente le componenti Lij , ovverosia il vettore Li =

1 2

εijk Ljk che

corrisponde al momento angolare spaziale, e le tre nuove costanti del moto K i ≡ L0i , che vengono chiamate boost. Per il momento angolare spaziale la (2.79) e la (2.80) danno, Ã ! Z Z X 1 Li = εijk Ljk = εijk xj T 0k d3 x = εijk xj S k + pkr δ 3 (~x − ~yr ) d3 x, 2 r e quindi,

Z ~ = L

~ d3 x + (~x × S)

X

~ p, ~yr × p~r ≡ Lem + L

(2.88)

r

risultato non sorprendente, dato che il vettore di Poynting rappresenta la densit`a di quantit`a di moto del campo elettromagnetico. Il significato dei boost. Analizziamo ora le componenti (0 i) di Lαβ , in una teoria relativistica generica. Dalla (2.86) otteniamo le costanti del moto, Z Z i 0i 0i 3 K = L = t T d x − xi T 00 d3 x, dove nelle quantit`a P i =

R

T 0i d3 x riconosciamo la quantit`a di moto totale conservata del

sistema. Per dare un’interpretazione al secondo termine di K i definiamo la posizione del “centro di massa” di un sistema relativistico come, R ~x T 00 d3 x ~xcm (t) ≡ R 00 3 , T dx 57

dove ε =

R

T 00 d3 x `e l’energia totale conservata del sistema. Si noti che questa formula si

ottiene dalla corrispondente espressione non relativistica sostituendo la densit`a di massa con la densit`a di energia. La costanza del vettore di boost, ~ = t P~ − ε ~xcm (t), K `e allora equivalente all’affermazione che il centro di massa del sistema si muove di moto rettilineo uniforme, con velocit`a data da, ~vcm =

P~ . ε

Resta, tuttavia, da notare che il concetto di centro di massa di un sistema, per come l’abbiamo introdotto non `e un concetto relativisticamente invariante, nel senso che le sue coordinate (t, ~xcm ) non costituiscono un quadrivettore: il centro di massa di un sistema `e rappresentato da punti diversi in sistemi di riferimento diversi. In definitiva, dalle equazioni del moto dell’Elettrodinamica siamo riusciti a dedurre l’esistenza delle dieci quantit`a conservate P ν e Lαβ – tante quanti sono i parametri continui che parametrizzano il gruppo di Poincar´e. Abbiamo gi`a anticipato che alla base di questa “coincidenza” numerica c’`e un legame profondo esistente in natura tra principi di simmetria e leggi di conservazione, legame che a livello matematico viene decodificato dal teorema di Noether.

2.5

Problemi

2.1 Si dimostri che il quadrato della quadriaccelerazione w2 ≡ wµ wµ soddisfa, w2 ≤ 0. [Sugg.: si sfrutti l’identit`a wµ uµ = 0.] Si dimostri che in termini di velocit`a e accelerazione tridimensionali si ha, w2 = −

a2 − (~a × ~v )2 . (1 − v 2 )3

2.2 Si dimostri che le seguenti tre versioni dell’identit`a di Bianchi sono equivalenti tra di loro: ∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν = 0, 58

(2.89)

∂[µ Fνρ] = 0, εµνρσ ∂ν Fρσ = 0. 2.3 Si trovino tutte le soluzioni per F ∈ S 0 (R) dell’equazione in una dimensione, (x2 − a2 )F (x) = 0,

a > 0.

Si dimostri che ogni soluzione pu`o essere posta nella forma F (x) = f (x)δ(x2 − a2 ), per un’opportuna funzione continua f . 2.4 Si dimostri che una funzione f (x) : RD → C definisce un elemento F ∈ S 0 (RD ), dato da,

Z F (ϕ) =

f (x) ϕ(x) dD x,

(2.90)

se 1) f `e integrabile in modulo su una qualsiasi palla di RD – in particolare se possiede un numero finito di singolarit`a integrabili – e 2) se essa `e asintoticamente polinomialmente limitata. Una funzione f si dice asintoticamente polinomialmente limitata se esistono una distanza d, un intero positivo N e una costante positiva C, tali che per ogni x per cui r ≥ d si abbia, |f (x)| ≤ C r2N , dove r ≡

p

` necessario e sufficiente dimostrare che vale la (x1 )2 + · · · + (xD )2 . [Sugg.: E

(2.34) per opportuni monomi P e Q. A questo scopo `e utile suddividere il dominio di integrazione nella (2.90) in una palla sufficientemente grande e nel suo complemento in RD , e sfruttare le propriet`a asintotiche (2.32) della ϕ.] 2.5 Si dimostri il “Teorema di Birkhoff”, enunciato come segue. quadricorrente a simmetria sferica, ma in generale non statica, j 0 (~x, t) = ρ(r, t), xi j i (~x, t) = j(r, t), r a supporto spaziale compatto, cio`e, j µ (~x, t) = 0 per r > r0 , 59

∀ t.

Sia data una

Allora il campo elettromagnetico generato dalla quadricorrente nel vuoto, vale a dire nella regione r > r0 , `e statico, essendo dato da, Z

~ = Q ~x , E 4π r3

~ = 0, B

ρ(r, t) d3 x.

Q= r
~ = ~x f (r, t), B ~ = ~x g(r, t), implicato dalla simmetria sferica.] Se [Sugg.: si usi l’Ansatz E ne conclude in particolare che una distribuzione di corrente a simmetria sferica – seppure costituita da cariche accelerate – non pu`o irradiare onde elettromagnetiche, perch´e il campo da essa generato `e statico. 2.6 Integrali invarianti in 3 dimensioni. Si definisca il tensore doppio tridimensionale,

Z ij

dΩ ni nj ,

H =

dove dΩ = senϑ dϑ dϕ `e la misura dell’angolo solido in 3 dimensioni, con

(2.91) R

dΩ = 4π, e

ni = xi /r, r = |~x|. L’integrando nella (2.91) dipende quindi solo dagli angoli. R a) Si dimostri che si pu`o scrivere H ij = d3 x δ(r − 1) xi xj . b) Si dimostri che H ij `e un tensore invariante per SO(3), cio`e, Ri m Rj n H mn = H ij ,

∀ R ∈ SO(3).

[Sugg.: si esegua il cambiamento di variabili xi = Ri k y k nell’integrando del punto a)]. c) Sapendo che gli unici tensori invarianti indipendenti per SO(3) sono δ ij e εijk , si concluda che H ij = C δ ij per qualche costante C. Si determini C contraendo la (2.91) con δ ij . d) Secondo questa linea di argomenti si stabilisca la seguente tabella di integrali invarianti: Z dΩ = 4π, Z dΩ ni = 0, Z dΩ ni nj = Z

4π ij δ , 3

dΩ ni nj nk = 0, Z dΩ ni nj nk nl =

4π ij kl (δ δ + δ ik δ jl + δ il δ jk ). 15 60

2.7 Una particella di carica e e massa m si trova in presenza di un campo elettromagnetico costante e uniforme F µν . La quadrivelocit`a iniziale della particella per s = 0 sia uµ (0), con u2 (0) = 1. Seguendo l’approccio covariante del paragrafo 2.2.1, a) si dimostri che in questo caso l’equazione di Lorentz `e equivalente all’equazione del primo ordine, £ ¤µ dy µ = uµ (s) = esA ν uν (0), ds per un’opportuna matrice costante Aµ ν , determinandola esplicitamente. b) Si verifichi esplicitamente che u2 (s) = 1 ∀ s. [Sugg.: si noti che esA ∈ SO(1, 3)c ∀ s.] c) Si dimostri che la quantit`a w2 = wµ (s)wµ (s) `e indipendente da s, esprimendola in termini di F µν e uµ (0). ~ = |B| ~ e simultaneamente E ~ ⊥B ~ = 0, esiste sempre un sistema d) Escluso il caso in cui |E| ~ e B ~ sono paralleli e diretti lungo l’asse delle x: E ~ = (E, 0, 0), di riferimento in cui E ~ = (B, 0, 0). Si dimostri che in questo riferimento la matrice A `e diagonale a blocchi B 2 × 2. e) Sfruttando questa struttura di A si determini esA sviluppando l’esponenziale in serie, e risommandolo in termini delle funzioni sen, cos, cosh e senh. f) Ponendo come velocit`a iniziale ~v0 = (0, v0 , 0), cio`e, 1

uµ (0) = p

1 − v02

(1, 0, v0 , 0),

si determinino uµ (s) e y µ (s), e quindi la legge oraria ~y (t). In questo quesito per semplicit`a si ponga B = 0. 2.8 Si consideri un sistema di N particelle cariche nel limite non relativistico, vr ¿ 1, che creano quindi un campo elettromagnetico dato da, ~ = −∇A ~ 0, E

0

A (t, ~x) =

N X r=1

er , 4π|~x − ~yr (t)|

~ = 0. B

a) Utilizzando l’equazione di Coulomb −∇2 A0 = j 0 , si dimostri che l’energia del campo R elettromagnetico εem = 21 d3 x (E 2 + B 2 ) pu`o essere riscritta “formalmente” come somma delle energie potenziali relative di tutte le cariche, Z N 1 1 X er es 3 0 0 εem = d xA j = . 2 2 r,s=1 4π|~yr (t) − ~ys (t)| 61

(2.92)

b) Si sottragga da questa espressione la parte divergente dovuta all’autointerazione, e si scriva l’energia totale del sistema campo elettromagnetico + particelle cariche, aggiungendo l’energia cinetica non relativistica di queste ultime. Si dimostri che l’energia totale cos`ı ottenuta risulta conservata nel limite non relativistico. Si noti che mentre l’espressione originale per εem `e sempre positiva – qualsiasi siano i segni delle cariche – ci`o non `e pi` u vero per l’espressione (2.92), dopo la sottrazione della parte divergente (esempio: N = 2, e1 = −e2 ). 2.9 Si trovi la soluzione generale y µ (λ) dell’equazione del moto per la particella libera, d2 y µ = 0, ds2 parametrizzando la linea di universo con un parametro λ generico, vedi (2.3). Si verifichi che la soluzione generale `e determinata solo modulo una riparametrizzazione. 2.10 Si dimostri che “l’equazione di Newton” (2.21) pu`o essere posta nella forma, m ~a = F~ (~y , ~v ), per un’opportuna forza F~ . 2.11 Si dimostri che se un campo elettromagnetico F µν (x) soddisfa le equazioni di Maxwell (2.28), (2.29) per ogni t, e le equazioni (2.30), (2.31) a t = 0, allora esso soddisfa automaticamente le (2.30), (2.31) per ogni t. [Sugg.: si valuti la divergenza spaziale delle (2.28), (2.29).] 2.12 Si verifichi esplicitamente che il tensore tridimensionale, µ ¶ 1 xi xj ij δ −3 2 , r3 r che compare al membro di destra della (2.50), appartiene a S 0 (R3 ).

Soluzione Problema 2.3 L’equazione, (x2 − a2 )F (x) = 0, 62

a > 0,

(2.93)

implica che F pu`o essere “diversa da zero” solo per x = ±a, ovverosia che il supporto di F `e {−a, a}, che `e un insieme di punti. Il teorema enunciato nel paragrafo 2.3.2, vedi (2.42), implica allora che F `e una combinazione lineare finita di δ(x ± a) e delle loro derivate. Evidentemente, F0 ≡ c1 δ(x − a) + c2 δ(x + a), `e soluzione dell’equazione (2.93), con c1 e c2 costanti aribitrarie, come si verifica subito usando la (2.36). Per quanto riguarda invece le derivate prime notiamo che, derivando l’identit`a (x2 − a2 ) δ(x ± a) = 0, si ottiene, (x2 − a2 )δ 0 (x ± a) = −2xδ(x ± a) = ±2a δ(x ± a) 6= 0. Quindi le derivate prime non sono soluzioni di (2.93), e allo stesso modo si dimostra che nemmeno le derivate successive lo sono. F0 `e quindi la soluzione generale della (2.93). Per porre F0 nella forma richiesta nel problema `e sufficiente ricordare la (2.38), e moltiplicarla per una generica funzione continua f , F1 ≡ f (x)δ(x2 − a2 ) =

1 (f (a)δ(x − a) + f (−a)δ(x + a)). 2a

Siccome f (a) e f (−a) possono assumere qualsiasi valore F0 pu`o quindi sempre essere posta nella forma F1 . ~ eB ~ nelle equazioni di MaxSoluzione Problema 2.5 Inserendo gli Ansatz dati per E ~ ·E ~ = 0, ∇ ~ ·B ~ = 0, si trovano equazioni differenziali che determinano well nel vuoto, ∇ completamente la dipendenza di f e g da r, f (r, t) =

F (t) , r3

g(r, t) =

G(t) . r3

~ e B, ~ si trova che vale identicamente Inserendo queste formule di nuovo negli Ansatz per E ~ ×E ~ =0=∇ ~ × B. ~ Usando questi risultati nelle rimanenti due equazioni di Maxwell ∇ nel vuoto, si trova che F (t) e G(t) sono funzioni costanti. Queste costanti si determinano, ~ ·E ~ = ρ, infine, applicando il teorema di Gauss alle equazioni di Maxwell complete, ∇ ~ ·B ~ = 0. ∇

63

3

Metodi variazionali in teoria di campo

Nel capitolo precedente abbiamo illustrato le equazioni fondamentali dell’Elettrodinamica evidenziando le loro propriet`a pi` u salienti, tra cui l’invarianza sotto trasformazioni del gruppo di Poincar´e. Abbiamo poi scoperto che queste equazioni godono di un’altra importante propriet`a, cio`e, quella di garantire la conservazione del quadrimomento e del momento angolare quadridimensionale. A prima vista questi due aspetti – l’invarianza relativistica e la presenza di leggi di conservazione – non sembrano avere niente a che fare l’uno con l’altro. Ma in realt`a le equazioni dell’Elettrodinamica posseggono un’altra caratteristica fondamentale, che a questo punto appare ancora completamente velata: esse discendono da un principio variazionale. Come vedremo `e proprio questa propriet`a aggiuntiva ad assicurare la validit`a delle leggi di conservazione – stabilite “a mano” nel capitolo precedente – e a qualificare definitivamente l’Elettrodinamica come un’interazione fondamentale. In questo capitolo rideriveremo dunque le equazioni del moto e le leggi di conservazione dell’Elettrodinamica usando il metodo variazionale – metodo che in generale fornisce una descrizione alternativa, compatta e elegante, della dinamica di un generico sistema fisico. L’importanza che questo metodo riveste in Fisica si desume dal fatto che tutte le teorie fondamentali, dal Modello Standard delle particelle elementari fino alla Relativit`a Generale e alla pi` u speculativa Teoria delle Stringhe, sono deducibili da un principio variazionale: senza un tale principio la consistenza interna di queste teorie sarebbe difficilmente controllabile, e non sarebbero garantite le principali leggi di conservazione. Infatti, come anticipato nella sezione 2.4, la validit`a del teorema di Noether, che rivela la profonda connessione esistente in natura tra principi di simmetria e leggi di conservazione, necessita di un principio variazionale. Lo strumento fondamentale del metodo variazionale `e il principio di minima azione. Questo principio si basa sulla conoscenza di un’unica funzione delle variabili dinamiche del sistema – la lagrangiana L – dalla quale per integrazione discende un funzionale, l’azione I. Il pregio tecnico del metodo consiste nell’estrema economia impiegata nella derivazione di una teoria fisica: assegnata la sola funzione L il principio di minima determina univo-

64

camente la dinamica del sistema, e il teorema di Noether fornisce poi la forma esplicita delle leggi di conservazione. Quantizzazione e invarianza relativistica. C’`e un’ulteriore circostanza che conferisce al metodo variazionale un ruolo fondamentale: `e il fatto che esso costituisce il punto di partenza indispensabile per la quantizzazione canonica di una qualsiasi teoria. Ricordiamo, infatti, che `e la lagrangiana a determinare la forma dei momenti coniugati e, attraverso la trasformata di Legendre, l’hamiltoniana – oggetto su cui si fonda la quantizzazione canonica di una qualsiasi teoria. Notiamo, tuttavia, che in una teoria relativistica la quantizzazione canonica non costituisce una procedura covariante a vista, semplicemente perch´e l’hamiltoniana, essendo la quarta componente di un quadrivettore, non `e un invariante relativistico. D’altra parte per le teorie relativistiche esiste una procedura di quantizzazione alternativa, quella dell’integrale funzionale di Feynman, che si basa direttamente sull’azione – e quindi non sull’hamiltoniana, ma sulla lagrangiana – e che ha il pregio di mantenere la teoria quantistica covariante a vista. Nelle teorie relativistiche il metodo variazionale `e soggetto, infatti, a un ulteriore vincolo: l’azione deve essere un’invariante per trasformazioni di Poincar´e, cio`e, un quadriscalare, I = I 0. Sotta questa ipotesi le equazioni del moto che ne derivano soddisfano automaticamente il principio di relativit`a einsteiniana. Infatti, secondo il principio di minima azione le configurazioni che soddisfano le equazioni del moto sono quelle che rendono stazionaria l’azione – δI = 0 – sotto opportune variazioni delle variabili dinamiche. Schematicamente abbiamo allora, Equazioni del moto in K



δI = 0



δI 0 = 0



Equazioni del moto in K0 .

Le equazioni del moto hanno quindi automaticamente la stessa forma in tutti i sistemi di riferimento. Localit` a. Concludiamo questa nota introduttiva soffermandoci su un aspetto peculiare della dinamica delle particelle relativistiche, la localit` a dell’interazione. Ricordiamo prima di tutto che in fisica newtoniana le particelle interagiscono attraverso forze che esercitano 65

un’azione a distanza. Per esempio, una particella di carica e2 esercita su una particella di carica e1 la forza, e1 e2 ~y1 − ~y2 , F~ = 4π |~y1 − ~y2 |3 la quale viene trasmessa istantaneamente: se a un dato istante la seconda particella si sposta, la prima ne subisce l’effetto allo stesso istante. Un’interazione – non locale – di questo tipo corrisponde a un segnale che si propaga con velocit`a infinita, ed `e quindi in conflitto con i principi della Relativit`a Ristretta. In una teoria relativistica, invece, le particelle non interagiscono tra di loro direttamente ma attraverso i campi, e l’interazione tra campi e particelle `e un’azione a contatto, ovverosia, locale. Cos`ı la forza di Lorentz subita da una particella carica relativistica, e F µν (y)uν , dipende solo dal valore del campo nel punto y µ dello spazio–tempo dove essa si trova, e non dalle posizioni delle altre particelle o dai valori del campo in altri punti. L’interazione elettromagnetica tra particelle cariche si propaga quindi con la velocit`a di propagazione del campo elettromagnetico, cio`e, con la velocit`a della luce. Per confronto osserviamo che a livello quantistico la richiesta di localit`a si traduce nel fatto che l’interazione tra particelle cariche `e mediata dai quanti del campo elettromagnetico, ovverosia dai fotoni, che viaggiano a loro volta con la velocit`a della luce. L’interazione tra questi ultimi e le particelle cariche, nella schematizzazione dei grafici di Feynman avviene di nuovo in un punto, e risulta quindi a sua volta “locale”. In una teoria relativistica sono quindi i campi a implementare la localit`a dell’interazione, e cos`ı essi vanno considerati a tutti gli effetti come gradi di libert` a dinamici indipendenti, alla stessa stregua delle coordinate delle particelle: mentre in fisica non relativistica il concetto di campo `e utile, in una teoria relativistica esso `e indispensabile. In conlusione, la formulazione di una teoria fisica attraverso il metodo variazionale avviene secondo il seguente schema: I) Individuare l’espressione dell’azione. II) Derivare le equazioni del moto attraverso il principio di minima azione. 66

III) Usare il teorema di Noether per derivare le leggi di conservazione. Per quanto detto sopra, in fisica relativistica genericamente avremo a che fare con un sistema di particelle puntiformi in interazione con un sistema di campi. Un sistema fisico i cui gradi di libert`a consistono di soli campi viene chiamato “teoria di campo”. In generale dovremo quindi implementare il metodo variazionale per un sistema di particelle in interazione con una teoria di campo. In questo capitolo svilupperemo dunque prima il metodo variazionale per una generica teoria di campo che, come vedremo, pu`o essere considerata come un sistema lagrangiano con un numero infinito di gradi di libert`a. Per questo motivo nel paragrafo che segue ricorderemo brevemente in che cosa consiste il metodo per un sistema lagrangiano con un numero finito di gradi di libert`a, ovverosia, in meccanica classica. Nel prossimo capitolo estenderemo infine il principio variazionale a un sistema di particelle cariche interagenti con il campo elettromagnetico.

3.1

Principio di minima azione in meccanica classica

Consideriamo un sistema meccanico non relativistico, conservativo e olonomo, a N gradi di libert`a, descritto dalle coordinate lagrangiane qn (t), n = 1, · · · , N. Indicheremo le coordinate collettivamente con q = (q1 , · · · , qN ), e le loro derivate prime con q˙ = (q˙1 , · · · , q˙N ), dove, q˙n =

dqn . dt

Sappiamo allora che esiste una funzione di 2N variabili, la lagrangiana L(q, q), ˙ tale che le equazioni del moto del sistema meccanico sottostante siano equivalenti alle equazioni di Lagrange, ∂L d ∂L − = 0, dt ∂ q˙n ∂qn

n = (1, · · · , N ).

(3.1)

Ricordiamo l’esempio prototipico di un sistema di M particelle non vincolate, con coordinate cartesiane ~yi (t), i = 1, · · · , M , nel qual caso le coordinate lagrangiane sono date da q = (~y1 , · · · , ~yM ), e N = 3M . Se indichiamo il potenziale di interazione reciproca con P V (q), e l’energia cinetica totale delle particelle con T (q) ˙ = 21 i mi vi2 , allora la lagrangiana

67

di questo sistema `e data da, L(q, q) ˙ = T − V. Fissiamo ora due estremi temporali t1 < t2 , e associamo alla generica lagrangiana L il seguente funzionale I delle leggi orarie q(t), chiamato azione, Z

t2

I[q] =

L(q(t), q(t)) ˙ dt.

(3.2)

t1

Possiamo allora dimostrare il principio di minima azione, detto anche principio di Hamilton. Principio di minima azione: le leggi orarie q(t) soddisfano le equazioni di Lagrange (3.1) nell’intervallo [t1 , t2 ], se e solo se esse rendono l’azione I[q] stazionaria per variazioni δq = (δq1 , · · · , δqN ) arbitrarie purch´e nulle agli estremi, vale a dire, δqn (t1 ) = 0 = δqn (t2 ). Prima di dimostrare il principio spieghiamo la terminologia usata nell’enunciato. Innanzitutto specifichiamo che le δqn (t) indicano N funzioni reali del tempo con le stesse propriet`a di regolarit`a delle qn (t). Introduciamo poi il concetto di “variazione dell’azione” δI attorno a una configurazione q, per delle variazioni δq assegnate. Poniamo ¯ ¯ d I[q + α δq]¯¯ δI ≡ , dα α=0

11

, (3.3)

dove α `e un parametro reale. Siccome l’azione (3.2) `e data dall’integrale di una funzione delle q e q˙ che supponiamo essere sufficientemente regolare, la (3.3) equivale a, ´ I[q + α δq] − I[q] ³ δI = lim = I[q + δq] − I[q] . α→0 α lin

(3.4)

Con l’ultima espressione intendiamo la quantit`a I[q + δq] − I[q] sviluppata in serie di Taylor attorno a q, e arrestata al termine lineare in δq. Per calcolare δI userermo in pratica sempre la (3.4), tralasciando il pedice “lin”. Si dice, infine, che la configurazione q rende l’azione I stazionaria per delle variazioni δq date, se risulta δI = 0. 11 Si tenga presente che δI `e in realt`a un funzionale delle 2N funzioni q e δq, e andrebbe quindi propriamente indicato con δI[q, δq].

68

Passiamo ora a dimostrare il principio di minima azione calcolando la variazione δI usando la (3.4), Z

´ t2 ³ δI = I[q + δq] − I[q] = L(q + δq, q˙ + δ q) ˙ − L(q, q) ˙ dt t ¶ Z t2 Z t2 X1µ ∂L d δqn ∂L δqn + dt = δL dt = ∂qn ∂ q˙n dt t1 t1 n µ ¶ ¶ Z t2 X µ ∂L d ∂L d ∂L = δqn + δqn − δqn dt ∂q dt ∂ q ˙ dt ∂ q ˙ n n n t1 n ¯t2 ¶ Z t2 X µ X ∂L ¯ d ∂L ∂L = − δqn dt + δqn ¯¯ . ∂qn dt ∂ q˙n ∂ q˙n t1 t1 n n Se vale δqn (t1 ) = 0 = δqn (t2 ) l’ultima sommatoria `e nulla. Si conclude allora che δI = 0 per variazioni δqn arbitrarie nell’intervallo aperto (t1 , t2 ), se e solo se le qn (t) soddisfano le equazioni di Lagrange (3.1) nell’intervallo [t1 , t2 ].

3.2

Principio di minima azione in teoria di campo

Una teoria classica di campo `e descritta da un certo numero di funzioni dello spazio–tempo, ϕr (t, ~x) ≡ ϕr (x), r = 1, · · · , N , i – campi lagrangiani – che indicheremo collettivamente con ϕ = (ϕ1 , · · · , ϕN ). Questi campi descrivono completamente il sistema nel senso che ogni grandezza fisica osservabile potr`a esprimersi in funzione di essi, ma in generale essi stessi non sono necessariamente osservabili. Nel caso dell’Elettrodinamica, per esempio, i campi lagrangiani non saranno i campi elettrico e magnetico bens`ı le componenti del quadripotenziale, ϕ = (A0 , A1 , A2 , A3 ), legate ai primi dalla relazione (2.22). In questo caso i campi lagrangiani non sono osservabili perch´e sono definiti modulo trasformazioni di gauge, mentre le componenti del tensore F µν sono gauge invarianti e costituiscono grandezze osservabili. Scrivendo ϕr (t, ~x) ≡ qr,~x (t) e identificando la coppia (r, ~x) con “l’indice” n del caso finito dimensionale, possiamo pensare l’insieme dei campi come un sistema lagrangiano con un numero infinito di gradi di libert`a. Anche in una teoria di campo cercheremo quindi di derivare la dinamica del sistema da un principio di minima azione, a partire da un’azione I[ϕ] che sar`a ora un funzionale dei campi. In questo caso partiremo da una densit` a lagrangiana L, in seguito chiamata ancora semplicemente lagrangiana, che in 69

analogia con il caso finito dimensionale sar`a funzione dei campi ϕ e delle loro derivate ϕ˙ = ∂0 ϕ. Tuttavia, se vogliamo che l’azione sia un’invariante relativistico, allora la lagrangiana dovr`a dipendere necessariamente da tutte le derivate parziali ∂µ ϕ, L(ϕ(x), ∂ϕ(x)). La lagrangiana L, propriamente detta, sar`a allora ottenuta sommando su tutti i gradi di libert`a, ovverosia integrando la densit`a lagrangiana sulla coordinata spaziale ~x, Z L(t) =

L(ϕ(x), ∂ϕ(x)) d3 x.

Definiamo, infine, l’azione della teoria di campo come, Z

Z

t2

I[ϕ] =

t2

L(t) dt = t1

L(ϕ(x), ∂ϕ(x)) d4 x.

(3.5)

t1

Per questa azione vogliamo ora formulare un principio variazionale, analogo al principio di minima azione per un sistema a finiti gradi di libert`a. Come in quel caso supponiamo che le funzioni ϕ(x) e L(ϕ, ∂ϕ) siano sufficientemente regolari in modo tale che la (3.4), opportunamente generalizzata, sia ancora valida, ma oltre a questo imponiamo opportune condizioni asintotiche su queste funzioni. Pi` u precisamente richiediamo che all’infinito spaziale i campi e le loro derivate si annullino con sufficiente rapidit`a. In particolare avremo, lim ϕr (t, ~x) = 0.

|~ x|→∞

(3.6)

Supponiamo inoltre che la lagrangiana si annulli con sufficiente rapidit`a per ϕ → 0, di modo tale che nella (3.5) l’integrale nella variabile ~x su tutto R3 esista finito. Le equazioni analoghe alle (3.1) per la lagrangiana L sono allora le equazioni di Eulero– Lagrange, ∂µ

∂L ∂L − = 0, ∂(∂µ ϕr ) ∂ϕr

(3.7)

equazioni che vanno riguardate come le equazioni del moto dei campi. Possiamo allora enunciare il principio variazionale per una teoria classica di campo. Principio di minima azione in teoria di campo: le leggi orarie ϕr (t, ~x) soddisfano le equazioni di Eulero–Lagrange nell’intervallo [t1 , t2 ], se e solo se esse rendono l’azione I[ϕ]

70

stazionaria per variazioni δϕr arbitrarie purch´e nulle agli estremi, vala a dire δϕr (t1 , ~x) = 0 = δϕr (t2 , ~x), per ogni ~x. La stazionariet`a del funzionale I[ϕ] rispetto a variazioni δϕr `e definita in modo completamente analogo alla stazionariet`a del funzionale I[q] rispetto a variazioni δqn , vedi (3.3) ` inoltre sottinteso che le variazioni δϕr che prendiamo in e la discussione susseguente. E considerazione hanno le stesse propriet`a di regolarit`a e le stesse propriet`a asintotiche dei campi ϕr . Per dimostrare il principio calcoliamo dapprima la variazione di (3.5) per variazioni δϕr arbitrarie dei campi, ¯ ¯ d = I[ϕ + δϕ] − I[ϕ] δI = I[ϕ + α δϕ]¯¯ dα α=0 Z t2 ³ ´ = L(ϕ + δϕ, ∂ϕ + δ∂ϕ) − L(ϕ, ∂ϕ) d4 x t ¶ Z 1t2 Z t2 X µ ∂L ∂L 4 δϕr + δ ∂µ ϕr d4 x. = δL d x = ∂ϕ ∂(∂ ϕ ) r µ r t1 t1 r Siccome per definizione abbiamo, δ ∂µ ϕr = ∂µ (ϕr + δϕr ) − ∂µ ϕr = ∂µ δϕr , usando la regola di Leibnitz si ottiene, ¶ ¶ Z t2 X µ Z t2 X µ ∂L ∂L ∂L 4 δI = − ∂µ δϕr d x + δϕr d4 x. ∂µ ∂ϕ ∂(∂ ϕ ) ∂(∂ ϕ ) r µ r µ r t1 t1 r r

(3.8)

Il secondo integrale, il cui integrando `e una quadridivergenza, `e nullo. Per dimostrarlo usiamo il teorema fondamentale del calcolo nella variabile temporale, e il teorema di Gauss tridimensionale con una superficie chiusa Γ∞ posta all’infinito spaziale, ¯t2 ¶ ¶ Z µZ Z t2 X µ XZ ¯ X t2 ∂L ∂L ∂L 4 3 i ¯ ∂µ δϕr d x = dx δϕr ¯ + δϕr dΣ dt. ∂(∂ ϕ ) ∂ ϕ ˙ ∂(∂ ϕ ) µ r r i r t Γ t1 ∞ t 1 1 r r r Il primo termine a secondo membro `e nullo se le variazioni δϕr si annullano sugli iperpiani t = t1 e t = t2 , mentre il secondo termine `e nullo perch´e all’infinito spaziale i campi svaniscono. La (3.8) si riduce allora al primo integrale, e vediamo che δI si annulla per qualsiasi scelta delle δϕr se e solo se i campi soddisfano le equazioni di Eulero–Lagrange.

71

3.2.1

Ipersuperfici nello spazio di Minkowski

In questo paragrafo introduciamo alcune nozioni riguardanti le ipersuperfici in quattro dimensioni, di cui ci serviremo in seguito. Per definizione un’ipersuperficie Γ nello spazio quadridimensionale di Minkowski `e un sottoinsieme – per essere pi` u precisi, una sottovariet` a – di R4 di dimensione tre. In forma parametrica un’ipersuperficie `e descritta da quattro funzioni di tre parametri, xµ (λ),

(3.9)

dove con λ indichiamo la terna {λa }, con a = 1, 2, 3. Alternativamente essa pu`o essere rappresentata in forma implicita in termini di un’unica funzione scalare f (x) attraverso, xµ ∈ Γ



f (x) = 0.

Si passa da una rappresentazione all’altra, per esempio, invertendo le funzioni spaziali ~x(λ) nella (3.9) per determinare i parametri λ(~x) come funzioni di ~x, e definendo poi, f (x) ≡ x0 − x0 (λ(~x)). Useremo una rappresentazione o l’altra a seconda della convenienza. Si noti comunque che vale identicamente, f (x(λ)) = 0.

(3.10)

Una classe importante di ipersuperfici `e costituita dagli iperpiani, che in forma implicita sono descritti da una funzione del tipo, f (x) = Mµ (xµ − xµ0 ) = 0,

(3.11)

dove Mµ e xµ0 sono vettori costanti. L’iperpiano corrispondente a (3.11) passa per il punto xµ0 ed `e ortogonale al vettore Mµ . Vettori tangenti e normali. In un generico punto P ≡ xµ (λ) ∈ Γ i tre vettori, Vaµ ≡

∂xµ (λ) , ∂λa

(3.12)

costituiscono una base per lo “spazio tangente”, sicch´e un generico vettore tangente a Γ in P pu`o essere scritto come combinazione lineare di questi, µ

V =

3 X a=1

72

ca Vaµ ,

per certi coefficienti ca . Sempre in P possiamo anche definire il “vettore normale” a Γ, come il vettore Nµ (λ) ortogonale a tutti i vettori tangenti, Nµ Vaµ = 0,

∀ a.

(3.13)

Per come l’abbiamo definito Nµ `e determinato a meno di un fattore di normalizzazione. Differenziando l’identit`a (3.10) rispetto a λa si ottiene, 0=

∂f ∂xµ ∂f µ = V , µ a ∂x ∂λ ∂xµ a

sicch`e otteniamo per Nµ la semplice espressione, Nµ =

∂f . ∂xµ

A questo punto siamo in grado di definire i tre tipi di ipersuperficie che ci interesseranno in seguito. Definizione. Un’ipersuperficie Γ si dice di tipo spazio, tempo o nullo, se in ogni punto di Γ vale rispettivamente, N 2 > 0,

N 2 < 0,

N 2 = 0,

caratteristiche che sono evidentemente invarianti sotto trasformazioni di Lorentz. Ipersuperfici di tipo spazio. Per un’ipersuperficie di tipo spazio abbiamo N 2 > 0, e di conseguenza i vettori tangenti sono tutti di tipo spazio. Per vederlo `e sufficiente sfruttare il fatto che se N 2 > 0, allora per ogni punto P ∈ Γ esiste un sistema di riferimento in cui il vettore normale ha la forma Nµ = (N0 , 0, 0, 0). La condizione Nµ V µ = 0 comporta allora che in questo sistema di riferimento si ha V 0 = 0, e quindi, V 2 < 0. Si pu`o inoltre far vedere che un’ipersuperficie Γ `e di tipo spazio, se e solo se per ogni coppia di punti (x, y) appartenenti a Γ vale, (x − y)2 < 0. Questa caratterizzazione alternativa `e immediata nel caso degli iperpiani (3.11), per cui si ha, Nµ =

∂f = Mµ . ∂xµ 73

Infatti, se x e y appartengono a Γ e M 2 > 0, allora la (3.11) implica che, (xµ − y µ )Mµ = 0

(x − y)2 < 0,



ed `e facile convincersi che vale anche il viceversa. Nel caso particolare in cui M µ = (1, 0, 0, 0) otteniamo gli iperpiani a tempo costante, f (x) = Mµ (xµ − xµ0 ) = t − t0 = 0, che sono le particolari ipersuperfici di tipo spazio che abbiamo usato per definire l’azione (3.5). In forma parametrica, vedi (3.9), questi iperpiani si scrivono, x0 (λ) = t0 ,

xi (λ) = λi .

(3.14)

Ipersuperfici di tipo tempo. Per un’ipersuperficie di tipo tempo abbiamo N 2 < 0, ma in questo caso i vettori tangenti possono essere di tipo spazio, tempo o nullo. Se consideriamo, per esempio, l’iperpiano con M µ = (0, 0, 0, 1) la condizione V µ Mµ = 0 d`a V µ = (V 0 , V x , V y , 0), e V 2 pu`o quindi essere positivo, negativo o nullo. Un’altra ipersuperficie di tipo tempo `e rappresentata dalla funzione, f (x) =

1 2 (~x − R2 ) = 0, 2

Nµ = (0, ~x),

N 2 = −|~x|2 < 0,

che corrisponde alla sfera di raggio R al variare del tempo. Per R → ∞ questa ipersuperficie corrisponde a una “ipersuperficie di tipo tempo all’infinito spaziale”, un tipo di ipersuperficie che incontreremo tra poco. L’elemento di ipersuperficie. In seguito faremo uso del teorema di Gauss in quattro dimensioni, e quindi ci servir`a l’elemento di ipersuperficie tridimensionale. Consideriamo dunque l’integrale della quadridivergenza di un vettore W µ su un volume quadridimensionale V , con bordo l’ipersuperficie Γ ≡ ∂V . Se parametrizziamo Γ come in (3.9) allora il teorema di Gauss – che riportiamo senza dimostrazione – asserisce che, Z Z µ 4 ∂µ W d x = W µ dΣµ , V

Γ

dove l’elemento di ipersuperficie tridimensionale `e dato da, vedi (3.12), dΣµ = εµαβγ V1γ V2β V3α d3 λ. 74

(3.15)

Siccome vale identicamente, Vaµ

³

εµαβγ V1γ V2β V3α

´ = 0,

∀ a,

concludiamo che, εµαβγ V1γ V2β V3α = Nµ , dove un’eventuale costante di normalizzazione `e stata assorbita nel vettore normale Nµ . Abbiamo quindi, dΣµ = Nµ d3 λ. ~ = ~n dΣ. Si noti l’analogia con la forma dell’elemento di superficie bidimensionale, dΣ Se una falda di Γ `e costituita da un’iperpiano a tempo costante, vedi (3.14), allora `e immediato vedere che su questa falda dΣµ si riduce a, dΣ0 = d3 λ ≡ d3 x,

dΣi = 0,

come c’era da aspettarsi. Il corrispondente contributo all’integrale (3.15) diventa allora, ¯ Z ¯ 0 3 ¯ W d x¯ . t=t0

3.2.2

Invarianza relativistica

Fino a questo punto non abbiamo fatto nessuna ipotesi sulle propriet`a di invarianza della teoria di campo in considerazione. In questo paragrafo analizzeremo alcune caratteristiche importanti del principio di minima azione, nel caso particolare di una teoria di campo relativistica. Principio di minima azione covariante a vista. Nel caso di una teoria di campo relativistica ci aspettiamo che le equazioni del moto siano covarianti a vista. A questo proposito notiamo che se i campi sono suddivisi in multipletti tensoriali e se L `e un invariante relativistico, cio`e, un campo scalare, allora le equazioni di Eulero–Lagrange (3.7) sono effettivamente covarianti a vista. In una teoria relativistica richiederemo dunque che la lagrangiana sia uno scalare sotto trasformazioni di Poincar´e, vale a dire, L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 )) = L(ϕ(x), ∂ϕ(x)),

75

x0 = Λx + a.

(3.16)

Possiamo allora domandarci se anche l’azione sia uno scalare – come richiesto nell’introduzione a questo capitolo. In realt`a dalla scrittura (3.5) emerge un’ostruzione immediata all’invarianza di I: mentre la misura dell’integrale `e invariante, d4 x0 = |detΛ| d4 x = d4 x, la regione d’integrazione non lo `e affatto, in quanto la variabile temporale `e integrata ` sufficiente su un intervallo finito. Tuttavia, non `e difficile ovviare a questo problema. E sostituire nella (3.5) gli iperpiani t = t1 e t = t2 , che delimitano la regione d’integrazione quadridimensionale, con due generiche ipersuperfici di tipo spazio Γ1 e Γ2 che non si intersecano. Un iperpiano a tempo costante `e in effetti una particolare ipersuperficie di tipo spazio, che in seguito a una trasformazione di Poincar´e non sar`a pi` u un iperpiano a tempo costante, ma rester`a pur sempre un’ipersuperficie di tipo spazio. Consideriamo allora l’azione generalizzata, Z

Γ2

I[ϕ] =

L(ϕ(x), ∂ϕ(x)) d4 x,

(3.17)

Γ1

che grazie a (3.16) `e ora un invariante relativistico, Z 0

I =

Γ02

Z 0

0

0

0

0

4 0

Γ2

L(ϕ (x ), ∂ ϕ (x )) d x =

Γ01

L(ϕ(x), ∂ϕ(x)) d4 x = I.

Γ1

Possiamo allora formulare un principio di minima azione covariante a vista, richiedendo che l’azione (3.17) sia stazionaria per variazioni δϕr arbitrarie, purch´e nulle su Γ1 e Γ2 . La versione relativisticamente invariante della condizione asintotica (3.6) `e invece, lim ϕr (x) = 0.

x2 →− ∞

(3.18)

` poi evidente che il principio di minima azione basato sulla (3.17) fornisce come equazioni E del moto ancora le equazioni di Eulero–Lagrange (3.7). Quadridivergenze. Aggiungiamo ora un commento riguardo all’esistenza e all’unicit`a della lagrangiana. Data L, le equazioni del moto (3.7) sono ovviamente univocamente determinate, ma spesso si deve affrontare il problema inverso: dato un insieme di equazioni ` chiaro che per del moto per i campi, si cerca una lagrangiana da cui esse discendano. E un insieme arbitrario di equazioni del moto – seppure relativistiche – questo problema 76

in generale non ammette nessuna soluzione, nel senso che non esiste nessuna lagrangiana per cui queste equazioni possano essere poste nella forma (3.7). D’altra parte, se una tale lagrangiana esiste – come per tutte le teorie fisiche fondamentali – `e facile vedere che in generale essa non `e unica. In particolare, se a e b sono costanti reali `e immediato verificare che le lagrangiane L e, Lb = a L + b, danno luogo alle stesse equazioni di Eulero–Lagrange. Un’ambiguit`a un po’ meno ovvia `e costituita, invece, dall’aggiunta di una quadridivergenza, Lb = L + ∂µ C µ (ϕ), dove le C µ (ϕ) sono quattro funzioni arbitrarie dei campi, con le stesse propriet`a di regolarit`a di L. Possiamo, infatti, fare vedere che Lb e L danno luogo alle stesse equazioni di Eulero–Lagrange. A questo scopo calcoliamo la differenza tra le azioni associate alle due lagrangiane, e applichiamo il teorema di Gauss quadridimensionale, Z Ib − I =

Γ2

Z Lb d4 x −

Z

Γ2

4

Ld x =

Γ1

Z

Γ2

µ

4

C µ dΣµ .

∂µ C d x =

Γ1

Γ1

∂V4

V4 indica il volume di integrazione quadridimensionale il cui bordo `e composto da Γ1 e Γ2 , e da un’ipersuperficie di tipo tempo posta all’infinito spaziale, Γ∞ , si veda il paragrafo precedente. Si ha allora, Z

Z

Ib − I =

Z

µ

µ

C dΣµ − Γ2

C µ dΣµ .

C dΣµ + Γ1

Γ∞

L’integrale su Γ∞ `e nullo per via della condizione asintotica (3.18). Viceversa, i primi due integrali sono diversi da zero, ma coinvolgono solo i valori dei campi sulle ipersuperfici Γ1 e Γ2 , che nel principio di minima azione sono tenuti fissi. Abbiamo quindi δ(Ib − I) = 0, cio`e, δ Ib = δI, e le due azioni danno quindi luogo alle medesime equazioni di Eulero–Lagrange. In conclusione possiamo affermare che tutte le lagrangiane che differiscono per una quadridivergenza sono fisicamente equivalenti. 77

Localit` a. Concludiamo questo paragrafo con un’ulteriore restrizione sul tipo di lagrangiane che ammetteremo in una teoria relativistica di campo. Alla richesta di invarianza relativistica aggiungeremo, infatti, quella di localit` a, analoga alla richiesta di “azione a contatto” tra particelle e campi, discussa nell’introduzione a questo capitolo. Nel caso di una teoria di campo la localit`a richiede che la lagrangiana sia data da una somma di prodotti dei campi e delle loro derivate prime, valutati nello stesso punto dello spazio–tempo. Illustriamo questa richiesta nel caso di una teoria di campo con due campi scalari, ϕ1 (x) ≡ A(x), e ϕ2 (x) ≡ B(x). In questo caso ammetteremo, per esempio, una lagrangiana del tipo, L1 =

1 1 ∂µ A(x) ∂ µ A(x) + ∂µ B(x) ∂ µ B(x) − g A2 (x) B 2 (x), 2 2

(3.19)

mentre non accetteremo la lagrangiana, L2

1 1 = ∂µ A(x) ∂ µ A(x) + ∂µ B(x) ∂ µ B(x) − gN 2 2

Z A2 (x) [(x − y)2 ]N B 2 (y) d4 y, (3.20)

dove gN `e una “costante di accoppiamento” reale, e N `e un intero positivo. Infatti, mentre in L1 il campo A(x) `e “in contatto” con il campo B valutato nello stesso punto x, in L2 il campo A(x) `e in contatto con B(y) per un qualsiasi valore di y. Dal punto di vista delle equazioni di Eulero–Lagrange questo vorrebbe dire che la dinamica di A nel punto x `e influenzata dai valori di B in tutti i punti dello spazio, in contrasto con la “localit`a” dell’interazione. Ribadiamo, comunque, che la lagrangiana L2 `e uno scalare sotto trasformazioni di Poincar´e, e che darebbe dunque luogo a equazioni del moto relativistiche ben definite. Sussiste, tuttavia, un ulteriore motivo che ci porta a rigettare lagrangiane come queste. Il fatto `e che lagrangiane come (3.20) non hanno carattere “fondamentale”: l’intero N che ivi compare `e completamente arbitrario, anzi, potremmo sostituire il fattore gN [(x − y)2 ]N con una qualsiasi funzione f (x, y) invariante sotto il gruppo di Poincar´e. Sviluppata in serie di Taylor una tale funzione ha la forma generale, f (x, y) =

∞ X

gN [(x − y)2 ]N ,

N =0

78

ed essa introdurrebbe quindi un numero infinito di costanti di accoppiamento gN indeterminate. Per mantenere il carattere predittivo della teoria la forma della f , ovvero il valore delle costanti gN , dovrebbe allora essere dedotta da una teoria “pi` u fondamentale”. Lagrangiane del tipo L2 rappresentano infatti tipicamente teorie effettive, vale a dire teorie approssimate che riproducono correttamente i risultati sperimentali solo in particolari regimi fisici, per esempio a basse o ad alte energie. Consistenza quantistica. Le restrizioni pi` u forti sulla scelta delle lagrangiane relativistiche permesse provengono, tuttavia, dall’approccio della teoria quantistica relativistica di campo. Nell’ambito di questo approccio si dimostra, infatti, che le lagrangiane classiche che a livello quantistico danno luogo a teorie consistenti devono essere: a) invarianti sotto trasformazioni di Poincar´e, b) locali, c) polinomi nei campi e nelle loro derivate, di ordine massimo quattro. Queste restrizioni limitano di molto la forma delle lagrangiane permesse, e insieme ad altre richeste di invarianza spesso permettono di determinarle univocamente. Esempi ne sono le lagrangiane “fondamentali” che descrivono le interazioni elettrodeboli e quelle forti. Al contrario, la lagrangiana che nell’ambito della Relativit`a Generale descrive l’interazione gravitazionale soddisfa le richiesta a) e b) ma non la c) – la causa essendo la complicata ` questo il motivo per cui, con le conoscenze autointerazione del campo gravitazionale. E che abbiamo acquisito fino ad oggi, questa interazione appare tuttora in conflitto con le leggi della Meccanica Quantistica. 3.2.3

La lagrangiana per l’equazione di Maxwell

In questo paragrafo illustriamo il metodo variazionale derivando le equazioni che governano la dinamica del campo elettromagnetico da un principio di minima azione. In linea di principio si tratta quindi di ottenere le equazioni (2.13) e (2.14) come equazioni di Eulero–Lagrange relative ad un’opportuna lagrangiana. La prima questione da affrontare riguarda allora la scelta dei campi lagrangiani ϕr . Siccome le (2.13), (2.14) corrispondono a otto equazioni dovremmo avere altrettanti campi lagrangiani. La scelta naturale ϕr ≡ F µν – che tra l’altro avrebbe il pregio di introdurre solo campi osservabili – `e dunque

79

esclusa, perch´e il tensore di Maxwell corrisponde non a otto ma solo a sei campi indipen~ e B. ~ Questa strada risulta quindi impraticabile, si veda in particolare denti, vale a dire E il problema 3.9, e dobbiamo cercarne un’altra. Una strategia alternativa consiste nel procedere come anticipato nei paragrafi 2.2.2 e 2.2.3. Risolviamo, cio`e, l’identit`a di Bianchi attraverso, Fµν ≡ ∂µ Aν − ∂ν Aµ , e consideriamo come campi lagrangiani le componenti del quadripotenziale, ϕr = Aµ ,

(3.21)

r = µ = (0, 1, 2, 3). Secondo questa strategia il principio di minima azione dovrebbe allora dare luogo alle equazioni di Maxwell, ∂µ F µν − j ν = 0,

(3.22)

come equazioni di Eulero–Lagrange associate a un’opportuna lagrangiana L. Si noti che la scelta dei campi lagrangiani (3.21) `e ora consistente con il fatto che le equazioni (3.22) sono quattro in numero. Il problema si riduce allora a trovare una lagrangiana L(A, ∂A), polinomiale in A e ∂A, tale che le equazioni di Eulero–Lagrange ad essa associate, ∂µ

∂L ∂L − = 0, ∂(∂µ Aν ) ∂Aν

(3.23)

equivalgano alle (3.22). La lagrangiana che cerchiamo dovr`a essere certamente un invariante relativistico, ma dato che abbiamo risolto l’identit`a di Bianchi introducendo il potenziale vettore, essa dovr`a essere altres`ı invariante per trasformazioni di gauge, A0µ = Aµ + ∂µ Λ, modulo quadridivergenze. Per quanto riguarda, invece, la corrente assumeremo solo che essa sia conservata, ∂µ j µ = 0, e che non dipenda da Aµ . Per individuare lo scalare L procediamo in modo euristico, sfruttando la struttura della (3.22). Il primo termine di questa equazione `e lineare in Aµ , mentre il secondo ne `e indipendente. Corrispondentemente la 80

lagrangiana dovr`a contenere un termine quadratico in Aµ , L1 , e uno lineare in Aµ , L2 . Considerata poi la forma particolare dei due termini nella (3.22) L1 dovr`a contenere due derivate, mentre L2 dovr`a esserne privo. Cerchiamo ora di determinare L1 . Questo termine deve contenere le derivate del quadripotenziale. L’invarianza di gauge impone allora che esso dipende da Aµ solo attraverso il campo gauge–invariante F µν , e in definitiva L1 deve allora essere quadratico in quest’ultimo. In effetti abbiamo due invarianti quadratici a disposizione, F µν Fµν

εµνρσ Fµν Fρσ .

e

Tuttavia, grazie all’identit`a di Bianchi il secondo invariante corrisponde a una quadridivergenza, εµνρσ Fµν Fρσ = 2 εµνρσ ∂µ Aν Fρσ = 2∂µ ( εµνρσ Aν Fρσ ) − 2Aν ( εµνρσ ∂µ Fρσ ) = 2∂µ ( εµνρσ Aν Fρσ ) . Esso d`a quindi un contributo irrilevante alla lagrangiana

(3.24) 12

. Possiamo quindi concludere

che L1 `e proporzionale a F µν Fµν . Consideriamo ora L2 . Questo termine deve essere lineare in Aµ e coinvolgere la corrente jµ . L’unico scalare che possiamo formare con queste quantit`a `e L2 ∝ Aµ j µ . Verifichiamone l’invarianza di gauge, A0µ j µ = Aµ j µ + ∂µ Λj µ = Aµ j µ + ∂µ (Λj µ ) − Λ ∂µ j µ . Siccome la corrente `e conservata vediamo che L2 `e in effetti gauge invariante – modulo una quadridivergenza. Per ottenere l’equazione di Maxwell con i coefficienti corretti poniamo, 1 L = L1 + L2 = − F µν Fµν − j ν Aν . 4

(3.25)

Verifichiamo ora che con questa scelta per L le equazioni (3.23) corrispondono proprio all’equazione di Maxwell. Al termine

∂L ∂Aν

contribuisce solo L2 ,

∂L = −j ν , ∂Aν 12

Il termine εµνρσ Fµν Fρσ in realt`a `e uno pseudoscalare e, anche se non fosse una quadridivergenza, contribuirebbe all’equazione del moto con un termine pseudovettoriale, mentre l’equazione di Maxwell `e vettoriale.

81

mentre alla derivata

∂L ∂(∂µ Aν )

contribuisce solo L1 . Per determinarla `e conveniente calcolare

la variazione di L1 per una variazione infinitesima di ∂A, 1 1 δL1 = − F µν δFµν = − F µν (δ∂µ Aν − δ∂ν Aµ ) = −F µν δ(∂µ Aν ), 2 2 e quindi, ∂L = −F µν . ∂(∂µ Aν )

(3.26)

In definitiva otteniamo, ∂µ

∂L ∂L = −∂µ F µν + j ν = 0, − ∂(∂µ Aν ) ∂Aν

(3.27)

che `e l’equazione di Maxwell. Il ruolo del potenziale vettore. Concludiamo questa deduzione con un commento sul ruolo del potenziale vettore in Elettrodinamica, classica e quantistica. Intanto insistiamo sul fatto che a livello classico l’equazione di Maxwell e l’identit`a di Bianchi di per s´e possono essere formulate, e risolte, senza mai introdurre il potenziale vettore, in quanto quest’ultimo costituisce solo un ausilio “utile”. Al contrario, se vogliamo far discendere queste equazioni da un principio variazionale allora – come abbiamo appena visto – l’introduzione del potenziale vettore risulta indispensabile. Ma il principio variazionale costituisce, a sua volta, il punto di partenza irrinunciabile per la quantizzazione di una qualsiasi teoria: concludiamo cos`ı che, mentre a livello classico l’uso del potenziale vettore `e un “optional”, a livello quantistico la sua introduzione `e inevitabile. Considerazioni completamente analoghe valgono per il ruolo dei potenziali vettore nelle altre interazioni fondamentali. Sui mediatori delle interazioni deboli e forti. Chiudiamo questo paragrafo con un commento sulla struttura della lagrangiana (3.25) nel caso particolare di corrente nulla, j µ = 0. In questo caso l’equazione (3.22) descrive il campo di Maxwell nel vuoto, disaccoppiato da qualsiasi carica, ovvero un campo “libero”. La lagrangiana, 1 L1 = − F µν Fµν , 4 descrive quindi un campo di gauge libero. Come abbiamo visto la struttura di questa lagrangiana `e essenzialmente determinata dai principi di invarianza relativistica e di invarianza di gauge. Non stupisce allora che anche la propagazione libera dei mediatori delle 82

interazioni deboli e forti, che sono soggette agli stessi principi, sia descritta da lagrangiane completamente analoghe. Ai mediatori delle interazioni deboli Z 0 e W ± sono associati rispettivamente il campo di gauge reale Zµ0 , e i campi di gauge complessi Wµ± = (W1µ ±i W2µ ), con i corrispondenti tensori di Maxwell, 0 Fµν = ∂µ Zν0 − ∂ν Zµ0 ,

± Fµν = ∂µ Wν± − ∂ν Wµ± ,

mentre agli otto mediatori delle interazioni forti sono associati i campi gluonici AIµ , I = 1, · · · , 8, con i relativi tensori di Maxwell, I = ∂µ AIν − ∂ν AIµ . Fµν

La lagrangiana totale che descrive la propagazione libera di tutti questi campi risulta allora, 1 L0 = − 4

à F µν Fµν + F 0µν F 0 µν + F +µν F − µν +

8 X

! F Iµν F I µν

.

I=1

La lagrangiana “libera” L1 d`a luogo alle equazioni di Maxwell nel vuoto ∂µ F µν = 0, le cui soluzioni sono onde (elettromagnetiche), che si propagano con la velocit`a della luce. Di conseguenza i mediatori associati hanno massa nulla. Ma mentre i fotoni e i gluoni sono effettivamente particelle prive di massa, i mediatori delle interazioni deboli sono in realt`a massivi. La lagrangiana L0 andr`a allora completata con l’aggiunta di un termine Lm , dipendente solo da Wµ± e Zµ0 , che tenga conto delle masse mW e mZ di queste particelle. Si pu`o vedere che questo termine deve essere dato da, vedi anche il problema 3.1, Lm =

¢ 1 ¡ 2 mW Wµ+ W −µ + m2Z Zµ0 Z 0µ , 2 2~

(3.28)

dove la presenza della costante di Planck ~ `e suggerita da motivi dimensionali. D’altra parte si verifica immediatamente che l’espressione in (3.28) non `e invariante sotto le trasformazioni di gauge, Wµ± → Wµ± + ∂µ Λ± ,

Zµ0 → Zµ0 + ∂µ Λ0 ,

e anche la lagrangiana totale L0 +Lm romperebbe quindi questa invarianza. Per quello che concerne le interazioni deboli si pu`o, tuttavia, vedere che questa rottura della simmetria non inficia la consistenza della teoria, se essa avviene in modo “spontaneo”. Per maggiori dettagli su questo argomento e per la giustificazione della (3.28) rimandiamo a un testo di particelle elementari. 83

3.3

Il Teorema di Noether

Il Teorema di Noether asserisce in generale che a ogni gruppo a un parametro di simmetrie di una teoria fisica, corrisponde una costante del moto, cio`e, una quantit`a conservata. A titolo di esempio ricordiamo che in una teoria invariante per traslazioni temporali si conserva l’energia, mentre se essa `e invariante per rotazioni spaziali si conserva il momento angolare. Prima di proseguire specifichiamo meglio cosa intendiamo con “invarianza di una teoria”, nel contesto del teorema di Noether. In primo luogo si potrebbe intendere l’invarianza delle equazioni del moto che governano la dinamica della teoria, sotto l’azione del gruppo di simmetria. Tuttavia vedremo che questa richiesta risulta genericamente troppo debole, perch´e l’invarianza delle equazioni del moto in generale non `e sufficiente per garantire la presenza di costanti del moto. Il teorema di Noether si basa, infatti, sulle ipotesi pi` u restrittive che, 1) le equazioni del moto discendano da un principio variazionale, 2) l’azione associata sia invariante sotto il gruppo di simmetrie. Come abbiamo visto in teoria di campo l’azione `e data a sua volta in termini di una lagrangiana,

Z I=

L d4 x.

Per le teorie di campo considerate da noi l’invarianza dell’azione sar`a poi sempre conseguenza dell’invarianza della misura d’integrazione

13

e, separatamente, della lagrangiana

– modulo quadridivergenze . Un’altro aspetto importante, peculiare del teorema di Noether in teoria di campo, `e che esso assicura la conservazione locale della grandezza fisica in questione. Questo vuol dire che si conserva non solo una “carica” totale, ma che la conservazione `e conseguenza di un’equazione di continuit` a. Per ogni gruppo di simmetrie a un parametro il teorema implica, cio`e, l’esistenza di una quadricorrente J µ a divergenza nulla, ∂µ J µ = 0. 13

Nel caso di “simmetrie interne” per definizione le coordinate non cambiano, x0µ = xµ ⇒ d4 x0 = d4 x. Per trasformazioni di Poincar´e, invece, abbiamo x0µ = Λµ ν xν + aµ ⇒ d4 x0 = d4 x |det Λ| = d4 x.

84

Come visto questo assicura che la variazione della carica QV =

R V

J 0 d3 x in un volume V ,

`e necessariamente accompagnata da un flusso di carica attraverso il suo bordo, Z dQV ~ =− J~ · dΣ. dt ∂V Non `e, cio`e, possibile che la carica scompaia in un punto e compaia in un altro punto, senza “fluire” da un punto all’altro. In Teoria dei Campi esiste una dimostrazione generale e semplice del teorema di Noether per le cosiddette “simmetrie interne”, cio`e, per simmetrie che non coinvolgono trasformazioni dello spazio–tempo, come per esempio le trasformazioni di gauge. Al contrario, il gruppo di Poincar´e origina proprio da trasformazioni dello spazio–tempo, e per questo gruppo di simmetrie la dimostrazione del teorema `e leggermente pi` u complicata. Tuttavia, date l’importanza concettuale e la rilevanza fenomenologica che esso ricopre, in questa sezione dimostreremo il teorema di Noether per il gruppo di Poincar´e in una generica teoria di campo relativistica. Il sottogruppo delle traslazioni costituisce un gruppo a quattro parametri a cui corrisponderanno quattro grandezze conservate, che identificheremo con il quadrimomento totale, mentre il sottogruppo di Lorentz costituisce un gruppo a sei parametri a cui corrisponderanno altrettante grandezze conservate, che identificheremo con il momento angolare quadridimensionale totale del sistema. 3.3.1

Trasformazioni di Poincar´ e infinitesime

Per dimostrare il teorema di Noether sfrutteremo in particolare l’invarianza della lagrangiana sotto trasformazioni di Poincar´e infinitesime. In questo paragrafo determineremo preliminarmente le variazioni dei campi sotto trasformazioni “infinitesime” – vale a dire trasformazioni valutate al primo ordine nei parametri ω µν e aµ – la cui forma esplicita ci servir`a poi nella dimostrazione del teorema. Finora abbiamo indicato l’insieme dei campi lagrangiani genericamente con ϕ = (ϕ1 , · · · , ϕN ). In una teoria relativistica i singoli campi devono essere raggruppati in “multipletti” che costituiscono tensori sotto trasformazioni di Poincar´e, per esempio cam` ovvio pi scalari Φ(x), campi vettoriali Aµ (x), campi tensoriali di rango due B µν (x), etc. E che possiamo avere anche pi` u campi dello stesso rango. L’indice r dell’insieme {ϕr }N r=1 indica allora tutte le componenti di tutti i multipletti. 85

Incominciamo ricordando la forma di una generica trasformazione di Poincar´e delle coordinate, x0µ = Λµ ν xν + aµ ,

(3.29)

dove la matrice di Lorentz `e data da, vedi paragrafo 1.4.1, µ

Λµ ν = eω ν ,

ω µν = −ω νµ .

(3.30)

Sotto questa trasformazione i singoli campi trasformano a seconda del loro rango tensoriale, Φ0 (x0 ) = Φ(x),

A0µ (x0 ) = Λµ ν Aν (x),

B 0µν (x0 ) = Λµ α Λν β B αβ (x),

(3.31)

e cos`ı via. Possiamo indicare queste trasformazioni complessivamente con, ϕ0r (x0 ) = Mr s ϕs (x),

(3.32)

per una qualche matrice N × N Mr s , indipendente da x. Si noti in particolare che queste trasformazioni sono lineari nei campi ϕr . Possiamo allora definire due tipi di variazioni – per il momento finite – dei campi: le variazioni totali δϕr , e le variazioni in forma δϕr , δϕr ≡ ϕ0r (x0 ) − ϕr (x)

(3.33)

δϕr ≡ ϕ0r (x) − ϕr (x).

(3.34)

Passiamo ora alla valutazione di queste variazioni per trasformazioni di Poincar´e infinitesime. Queste ultime corrispondono a trasformazioni di Lorentz infinitesime, Λµ ν = δ µ ν + ω µ ν , e a traslazioni infinitesime. Per le coordinate otteniamo le trasformazioni infinitesime, δxµ = x0µ − xµ = (δ µ ν + ω µ ν )xν + aµ − xµ = aµ + ω µ ν xν .

(3.35)

Usando le (3.31) troviamo allora le seguenti trasformazioni totali infinitesime, intese al primo ordine in ω αβ e aµ , δΦ = Φ0 (x0 ) − Φ(x) = 0, δAµ = (δ µ ν + ω µ ν )Aν (x) − Aµ (x) = ω µ ν Aν (x), δB µν = (δ µ α + ω µ α )(δ ν β + ω ν β )B αβ (x) − B µν (x) = ω µ α B αν (x) + ω ν β B µβ (x), 86

e cos`ı via. Da questi esempi si capisce che le generiche variazioni δϕr sono lineari nei parametri ω µν e nei campi stessi, si veda anche la (3.32). Possiamo allora scrivere la formula generale, δϕr =

1 ωαβ Σαβ r s ϕs , 2

dove le quantit`a Σαβ r s sono antisimmetriche in α e β

14

(3.36) ,

Σαβ r s = −Σβα r s , e la sommatoria su s `e sottintesa. Le espressioni esplicite di queste quantit`a si leggono facilmente dalle trasformazioni infinitesime totali dei campi calcolate sopra. Per esempio, per il campo scalare Φ si ha semplicemente Σαβ 1 1 = 0, mentre per il campo vettoriale Aµ ≡ ϕr si ha, Σαβ r s = δrα η βs − δrβ η αs .

(3.37)

Calcoliamo ora la versione infinitesima delle variazioni in forma. Aggiungendo e togliendo nella (3.34) lo stesso termine e usando la (3.36), al primo ordine in ω αβ e aµ si ottiene, δϕr = ϕ0r (x) − ϕ0r (x0 ) + ϕ0r (x0 ) − ϕr (x) = ϕ0r (x) − ϕ0r (x + δx) + δϕr = −δxν ∂ν ϕ0r + δϕr = −δxν ∂ν ϕr + δϕr 1 = −δxν ∂ν ϕr + ωαβ Σαβ r s ϕs , 2

(3.38)

dove nella penultima riga abbiamo tenuto conto che la differenza tra ϕr e ϕ0r `e del primo ordine in ω αβ e aµ . 3.3.2

Teorema di Noether per il gruppo di Poincar´ e

In una teoria di campo classica il teorema di Noether riferito al gruppo di Poincar´e si enuncia come segue. Teorema di Noether. Si consideri una teoria di campo la cui dinamica discenda dall’azione,

Z I=

d4 x L,

14

Nella (3.36) gli indici α e β di Σαβ r s sono contratti con la coppia antisimmetrica di ωαβ ; ci`o implica che comunque solo la parte antisimmetrica in α e β di Σαβ r s contribuisce a ωαβ Σαβ r s .

87

per un’opportuna lagrangiana L, ovvero, una teoria di campo le cui equazioni del moto siano date dalla (3.7). Allora, se L `e invariante per traslazioni si conserva localmente il quadrimomento, il tensore energia–impulso essendo dato dalla (3.44), mentre se L `e invariante per trasformazioni di Lorentz, allora si conserva localmente il momento angolare quadridimensionale, il tensore densit`a di momento angolare essendo dato dalla (3.45). Queste leggi di conservazione sono valide purch´e i campi soddisfino le equazioni di Eulero– Lagrange (3.7). Per comprendere meglio il significato dell’invarianza per traslazioni di L consideriamo una classe di lagrangiane leggermente pi` u ampia di quella considerata finora, del tipo, L(ϕ(x), ∂ϕ(x), x),

(3.39)

dove ammettiamo, cio`e, che L abbia anche una generica dipendenza esplicita da x. Per una traslazione, x0 = x + a, abbiamo ϕ0r (x0 ) = ϕr (x), e per la lagrangiana traslata si ottiene allora, L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) = L(ϕ(x), ∂ϕ(x), x + a), che uguaglia L(ϕ(x), ∂ϕ(x), x) solo se L non dipende esplicitamente da x. Possiamo quindi affermare che una lagrangiana `e invariante per traslazioni se e sole se essa non esibisce dipendenza esplicita da x. Dimostrazione. Il primo passo nella dimostrazione del teorema di Noether consiste nel valutare la variazione della lagrangiana per un’arbitraria trasformazione finita di Poincar´e dei campi, vedi (3.29) e (3.31), ∆L ≡ L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) − L(ϕ(x), ∂ϕ(x), x).

(3.40)

Per ogni x fissato questa espressione `e una funzione dei parametri ω αβ e aµ , e come tale pu`o essere sviluppata in serie di Taylor attorno ai valori ω αβ = 0 = aµ . Siccome ∆L si annulla per valori nulli dei parametri, otteniamo uno sviluppo del tipo, ∆L = δL + o(ω αβ , aµ )2 , dove con δL, la “variazione infinitesima della lagrangiana”, abbiamo indicato i termini di ∆L lineari in ω αβ e aµ . Se L `e invariante sotto l’azione del gruppo di Poincar´e 88

avremo ∆L = 0 identicamente, ovvero ∀ ω αβ , ∀ aµ , e per il teorema sull’identit`a delle serie di potenze ne seguir`a che δL = 0, ∀ ω αβ , ∀ aµ . Sfruttando quest’ultima identit`a e assumendo la validit`a delle equazioni di Eulero–Lagrange potremo poi concludere che le quadridivergenze di certi tensori sono nulli. Secondo questa strategia dobbiamo dunque trovare un’espressione esplicita per δL. A questo scopo `e conveniente aggiungere e togliere a ∆L lo stesso termine, e valutare poi l’espressione risultante tenendo solo i termini lineari nei parametri, δL = [L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) − L(ϕ0 (x), ∂ϕ0 (x), x)]lin + [L(ϕ0 (x), ∂ϕ0 (x), x) − L(ϕ(x), ∂ϕ(x), x)]lin . I due termini della prima parentesi quadra differiscono solo per la sostituzione x → x0 = x + δx, mentre nella seconda parentesi quadra i campi differiscono per la variazione in forma (3.34). Tenendo conto che ∂µ δxµ = ηµν ω µν = 0, vedi (3.35), e definendo i “momenti coniugati”, Πµr =

∂L , ∂(∂µ ϕr )

(3.41)

si ottiene allora, ∂L + ∂µ δϕr Πµr ∂ϕr ¶ µ δL µ µr = ∂µ (δx L) + δϕr − ∂µ Π + ∂µ (δϕr Πµr ) ∂ϕr ¶ µ δL µr µ µr = ∂µ [δx L + δϕr Π ] + δϕr − ∂µ Π , ∂ϕr

δL = δxµ ∂µ L + δϕr

(3.42)

dove la sommatoria su r `e sottintesa. Valutiamo ora il termine tra parentesi quadre in (3.42), usando la formula (3.38) per la variazione infinitesima dei campi, δxµ L + δϕr Πµr = δxν (η µν L − Πµr ∂ ν ϕr ) +

1 µr Π ωαβ Σαβ r s ϕs . 2

(3.43)

Prima di procedere definiamo il tensore energia–impulso canonico, Teµν = Πµr ∂ ν ϕr − η µν L,

(3.44)

e il tensore densit`a di momento angolare canonico, fµαβ = xα Teµβ − xβ Teµα + Πµr Σαβ r s ϕs , M 89

fµαβ = −M fµβα . M

(3.45)

Usando queste definizioni e la (3.35), la (3.43) diventa, 1 δxµ L + δϕr Πµr = −(aν + ωνρ xρ )Teµν + Πµr ωαβ Σαβ r s ϕs 2 1 µν µαβ f . = −aν Te + ωαβ M 2

(3.46)

Per la variazione di L sotto una generica trasformazione di Poincar´e infinitesima otteniamo cos`ı il seguente risultato, eµν

δL = −aν ∂µ T

1 fµαβ + δϕr + ωαβ ∂µ M 2

µ

¶ δL µr − ∂µ Π . ∂ϕr

(3.47)

Supponiamo ora, per esempio, che la lagrangiana sia invariante per il sottogruppo a un parametro del gruppo di Poincar´e costituito dalle traslazioni nel tempo, t0 = t + a0 ,

~x 0 = ~x.

Come visto sopra questo equivale all’assunzione che in L sia assente la dipendenza esplicita da t. Allora abbiamo, δL = 0,

per ai = 0 = ωαβ ,

a0

arbitrario.

Se in pi` u imponiamo che i campi soddisfino le equazioni di Eulero–Lagrange, ∂µ Πµr −

δL = 0, ∂ϕr

si ricordi la definizione (3.41), allora dalla (3.47) si ricava, 0 = −a0 ∂µ Teµ0 = 0,

∀ a0



∂µ Teµ0 = 0.

Abbiamo cos`ı ottenuto l’equazione di continuit`a per l’energia, che assicura che l’energia `e localmente conservata. Allo stesso modo dalla (3.47) segue che a ciascuno dei dieci parametri (aµ , ωαβ ) corrisponde una corrente a quadridivergenza nulla e una grandezza localmente conservata, se la lagrangiana `e invariante sotto il corrispondente gruppo a un paramentro: ad a0 (traslazioni del tempo) corrisponde la conservazione locale dell’energia, ad a1 (traslazioni lungo l’asse x) quella della componente x della quantit`a di moto, ad ω12 (rotazioni attorno all’asse z) quella della componente z del momento angolare, ad ω01 (trasformazioni di 90

Lorentz speciali lungo l’asse x) quella della componente x del boost, e via di seguito. In partciolare se la lagrangiana `e invariante sotto l’intero gruppo delle traslazioni si conserva localmente il quadrimomento, mentre se essa `e invariante sotto l’intero gruppo di Lorentz allora si conserva localmente il momento angolare quadridimensionale. Abbiamo cos`ı concluso la dimostrazione del teorema. In particolare se L `e invariante sotto l’intero gruppo di Poincar´e, dalla (3.47) otteniamo, 1 fµαβ = 0, −aν ∂µ Teµν + ωαβ ∂µ M 2

∀ aµ ,

∀ ω αβ ,

e quindi, ∂µ Teµν = 0,

fµαβ = 0. ∂µ M

In questo caso abbiamo dieci costanti del moto, raggruppate nel quadrimomento e nel momento angolare quadridimensionale, Z µ e P = Te0µ d3 x,

Z eαβ = L

f0αβ d3 x. M

Insistiamo sul fatto che queste leggi di conservazione sono valide purch´e i campi soddisfino le equazioni del moto di Eulero–Lagrange. Per illustrare la portata di questo teorema nominiamo il fatto che le teorie che descrivono le quattro interazioni fondamentali soddisfano il principio di relativit`a einsteiniana, e che sono formulate in termini di un principio variazionale: in queste teorie il teorema di Noether assicura allora che la conservazione del quadrimomento e del momento angolare `e automatica. Sulle densit`a di corrente canoniche. Concludiamo questo paragrafo con qualche osservazione sulla struttura delle correnti conservate trovate. Come prima cosa notiamo che il tensore energia–impulso canonico (3.44) in generale non `e simmetrico. In Relativit`a Ristretta questa circostanza di per s´e non costituisce nessun problema. Viceversa, si pu`o vedere che l’esistenza di un tensore energia–impulso simmetrico `e una richiesta irrinunciabile, se si vuole accoppiare una teoria di campo alla gravit`a secondo i postulati della Relativit`a Generale

15

. Come seconda cosa facciamo notare che l’espressione (3.45) per

15

Le equazioni di Einstein eguagliano, infatti, un opportuno tensore doppio simmetrico, formato con la metrica gµν (x) e le sue derivate, al tensore energia–impulso; queste equazioni sarebbero quindi inconsistenti se quest’ultimo non fosse simmetrico.

91

la densit`a di momento angolare canonico non `e “standard”, nel senso che non `e della semplice forma standard xα Teµβ − xβ Teµα . In realt`a queste due “anomalie” sono legate tra di loro. Infatti, la divergenza della densit`a di momento angolare standard non si annulla, uguagliando proprio la parte antisimmetrica del tensore energia–impulso canonico, ³ ´ ∂µ xα Teµβ − xβ Teµα = Teαβ − Teβα . fµαβ si riduce alla forma standard xα Teµβ − D’altra parte dalla (3.45) si vede che il tensore M xβ Teµα , solo se le quantit`a Σαβ r s svaniscono, ma questo succede solo se i campi della teoria sono tutti campi scalari. In quest’ultimo caso, d’altro canto, non `e difficile dimostrare che Teµν `e in effetti simmetrico, vedi problema 3.6. Concludiamo che, per quanto riguarda la densit`a di momento angolare la “anomalia” appena discussa non costituisce un problema di tipo concettuale, ma solo di naturalezza, mentre per quanto riguarda il tensore energia–impulso sorgerebbe un problema di incompatibilit`a con l’interazione gravitazionale, se non fosse possibile trovare un tensore energia–impulso simmetrico. Questo problema verr`a affrontato e risolto in tutta generalit`a nelle sezioni 3.4 e 3.5. 3.3.3

Tensore energia–impulso canonico per il campo di Maxwell

In questo paragrafo esemplifichiamo la costruzione generale del tensore energia–impulso canonico (3.44), nel caso semplice di un campo di Maxwell libero, j µ = 0. La dinamica di questo campo `e governata dalla lagrangiana, vedi (3.25), 1 L1 = − F µν Fµν , 4

(3.48)

con ϕr ≡ Aα . Ricordiamo la forma dei momenti coniugati, determinati in (3.26), Πµα =

∂L1 = −F µα . ∂(∂µ Aα )

(3.49)

Il tensore energia–impulso canonico discende allora direttamente dalla (3.44), 1 µν = −F µα ∂ ν Aα + η µν F αβ Fαβ . Teem 4

(3.50)

Notiamo che questo tensore soffre di due patologie: non ´e simmetrico, e non `e nemmeno gauge–invariante. Affronteremo questi problemi nel paragrafo 3.4.1. 92

3.4

Costruzione di un tensore energia–impulso simmetrico

In questa sezione faremo vedere che in una teoria di campo lagrangiana invariante sotto trasformazioni di Poincar´e, `e sempre possibile costruire un tensore energia–impulso simmetrico, la costruzione essendo canonica. A questo proposito notiamo che il tensore energia–impulso di una teoria in realt`a non `e definito univocamente. Consideriamo, infatti, un generico tensore di rango tre φρµν che sia antisimmetrico nei primi due indici, φρµν = −φµρν . Possiamo allora definire un tensore energia–impulso modificato attraverso, T µν = Teµν + ∂ρ φρµν .

(3.51)

Questo tensore gode, infatti, delle seguenti due propriet`a: 1) ∂µ T µν = 0, R 2) P ν ≡ T 0ν d3 x = Peν . T µν `e dunque conservato, come lo `e Teµν , ed esso d`a luogo allo stesso quadrimomento totale di Teµν . La prima propriet`a discende dal fatto che, ∂µ ∂ρ φρµν = 0, in quanto una coppia di indici antisimmmetrici contrae una coppia di indici simmetrici. La seconda segue invece da, Z ³ Z Z Z ´ ν ν 0ν 0ν 3 ρ0ν 3 i0ν 3 e e P −P = T −T d x = ∂ρ φ d x = ∂i φ d x =

φi0ν dΣi = 0, (3.52) Γ∞

dove abbiamo usato che φ00ν = 0, come conseguenza dell’antisimmetria di φρµν nei primi due indici. Nell’ultimo passaggio abbiamo applicato il teorema di Gauss, con Γ∞ superficie all’infinito spaziale, e abbiamo inoltre supposto che φρµν decada all’infinito pi` u rapidamente di 1/r2 . La propriet`a 2) assicura in particolare che l’hamiltoniana del sistema, rappresentata dalla componente P 0 , non dipende dal tensore energia–impulso che si considera. T µν pu`o dunque essere riguardato come tensore energia–impulso della teoria – alla stessa stregua di Teµν . Sfruttando questa libert`a di scelta dimostreremo ora il seguente teorema. 93

Teorema. Sia data una lagrangiana invariante sotto l’azione del gruppo di Poincar´e. Allora si pu`o costruire un tensore φρµν antisimmetrico in ρ e µ, tale che il tensore energia– impulso T µν dato in (3.51) risulti simmetrico, la costruzione essendo canonica. Dimostrazione. Siccome per ipotesi la lagrangiana `e invariante sotto trasformazioni dell’intero gruppo di Poincar´e, per la dimostrazione del teorema possiamo servirci del fµαβ a quadridivergenza nulla, definiti teorema di Noether e ricorrere ai tensori Teµν e M in (3.44) e (3.45). Riprendiamo in particolare l’espressione per la densit`a di momento angolare, fµαβ = xα Teµβ − xβ Teµα + V µαβ , M

V µαβ ≡ Πµr Σαβ r s ϕs ,

(3.53)

dove abbiamo introdotto il tensore V µαβ , antisimmetrico negli ultimi due indici, V µαβ = −V µβα . fµαβ che Teµν sono a quadridivergenza nulla, si ottiene, Sfruttando il fatto che sia M fµαβ = ∂µ xα Teµβ − ∂µ xβ Teµα + ∂µ V µαβ , 0 = ∂µ M

(3.54)

ovverosia, cambiando di nome agli indici, ∂ρ V ρµν = Teνµ − Teµν ,

(3.55)

che equivale proprio alla parte antisimmetrica di Teνµ . Tuttavia, non possiamo identificare V ρµν direttamente con φρµν , perch´e il primo non `e antisimmetrico in ρ e µ. Se poniamo invece, φρµν =

1 ρµν (V − V µρν − V νρµ ) , 2

(3.56)

possiamo verificare che questo tensore gode delle seguenti propriet`a: a) φρµν = −φµρν , ³ ´ b) ∂ρ φρµν = 12 Teνµ − Teµν − 12 ∂ρ (V µρν + V νρµ ). La prima propriet`a, che assicura che φρµν d`a luogo a una modifica consistente di Teµν , discende dall’antisimmetria di V νρµ negli ultimi due indici; la seconda `e conseguenza diretta di (3.55) e (3.56). Infine possiamo determinare il nuovo tensore energia–impulso usando la (3.51), e sfruttando la propriet`a b), T

µν

1 ³ eνµ eµν ´ 1 µν ρµν e − ∂ρ (V µρν + V νρµ ) , = T + ∂ρ φ = T +T 2 2 94

che `e manifestamente simmetrico in µ e ν. Sfruttando l’antisimmetria di V µνρ negli ultimi due indici e usando la nostra convenzione sulla simmetrizzazione dei tensori, possiamo riscrivere questo risultato anche come, T µν = Te(µν) + ∂ρ V (µν)ρ ,

∂µ T µν = 0.

(3.57)

Abbiamo quindi dato una dimostrazione costruttiva dell’esistenza di un tensore energia– impulso a quadridivergenza nulla e simmetrico, che d`a luogo allo stesso quadrimomento totale conservato del tensore energia–impulso canonico. Facciamo, per`o, notare che il quadrimomento PVµ contenuto in un volume finito dipende dal tensore energia–impulso che si considera. Tuttavia, questo quadrimomento non ha carattere tensoriale, cio`e PVµ non `e un quadrivettore. Dalla dimostrazione appena svolta traiamo inoltre le seguenti conclusioni. L’esistenza di un tensore energia–impulso conservato richiede soltanto l’invarianza per traslazioni di una teoria, mentre l’esistenza di un tensore energia–impulso conservato e simmetrico richiede in pi` u che essa sia invariante sotto trasformazioni di Lorentz. Infatti, nella nostra fµαβ = 0, vedi (3.54) e costruzione di φρµν era essenziale l’equazione di continuit`a ∂µ M (3.55), che a sua volta discende dall’invarianza di Lorentz via il teorema di Noether. Il gruppo di Poincar´e e la Relativit` a Generale. Concludiamo questa sezione con una considerazione sul doppio ruolo dell’invarianza di Poincar´e nell’interazione gravitazionale. In primo luogo menzioniamo il fatto che in base al Principio di Equivalenza qualsiasi teoria invariante sotto trasformazioni del gruppo di Poincar´e, nell’ambito della Relativit`a Generale ammette un cosiddetto “accoppiamento minimale” consistente con un campo gravitazionale esterno. In secondo luogo ricordiamo che la consistenza delle equazioni di Einstein, che governano la dinamica del campo gravitazionale, necessita del tensore energia–impulso simmetrico (3.57) – la cui esistenza `e assicurata, a sua volta, dall’invarianza di Poincar´e. Possiamo allora affermare che la consistenza dell’interazione gravitazionale di un sistema fisico – bench`e coinvolga un gruppo di simmetrie pi` u ampio del gruppo di Poincar´e, cio`e, il gruppo dei diffeomorfismi 16

16

– `e garantita in ultima analisi

Un diffeomorfismo `e una generica trasformazione di coordinate xµ → x0µ (x), invertibile e di classe C ∞ insieme alla sua inversa. I diffeomorfismi costituiscono quindi una generalizzazione delle trasformazioni di Poincar´e, x0µ (x) = Λµ ν xν + aµ .

95

dall’invarianza di Poincar´e del sistema in assenza di interazione gravitazionale. L’importanza di questa invarianza sta anche in questo: oltre ad assicurare la covarianza delle equazioni del moto e la conservazione delle grandezze fisiche fondamentali, essa garantisce anche la consistenza interna della Relativit`a Generale. 3.4.1

Tensore energia–impulso simmetrico per il campo di Maxwell

A titolo di esempio determiniamo il tensore energia–impulso simmetrico per il campo di Maxwell libero. La lagrangiana di questo sistema `e data in (3.48), e l’equazione di Eulero–Lagrange associata `e l’equazione di Maxwell nel vuoto, vedi (3.27), ∂µ F µν = 0.

(3.58)

Il tensore energia–impulso canonico associato a questa lagrangiana `e stato determinato nella (3.50), 1 µν Teem = −F µα ∂ ν Aα + η µν F αβ Fαβ . 4 Denotando i campi di gauge indistintamente con Ar o Aα , ricordiamo anche la forma dei momenti coniugati (3.49), e delle matrici Σαβ r s per un campo vettoriale, vedi (3.37), Πµr = −F µr ,

Σαβ r s = δrα η βs − δrβ η αs .

Calcoliamo dapprima il tensore V µαβ , antisimmetrico in α e β, V µαβ ≡ Πµr Σαβ r s As = −F µα Aβ + F µβ Aα .

(3.59)

Determiniamo poi il tensore φρµν definito in (3.56), vedi problema 3.7, φρµν = −F ρµ Aν ,

(3.60)

antisimmetrico in ρ e µ. Per la sua divergenza si ottiene allora, ∂ρ φρµν = −∂ρ F ρµ Aν − F ρµ ∂ρ Aν = F µα ∂α Aν , dove abbiamo utilizzato l’equazione di Eulero–Lagrange (3.58). Il nuovo tensore energia– impulso risulta in definitiva, 1 1 µν µν + ∂ρ φρµν = F µα (∂α Aν − ∂ ν Aα ) + η µν F αβ Fαβ = F µα Fα ν + η µν F αβ Fαβ , = Teem Tem 4 4 che `e gauge invariante oltre che simmetrico, ed in perfetto accordo con la (2.69). 96

3.5

Densit` a di momento angolare “standard”

Concludiamo questo capitolo dimostrando che per una lagrangiana L invariante per il gruppo di Poincar´e esiste sempre una densit`a di momento angolare M µαβ “standard”, legata al tensore energia–impulso simmetrico dalla relazione, M µαβ = xα T µβ − xβ T µα .

(3.61)

La dimostrazione di questa propriet`a segue una strategia molto simile a quella usata per dimostrare l’esistenza di un tensore energia–impulso simmetrico. Sfrutteremo, cio`e, il fatto che anche la densit`a di momento angolare `e determinata a meno della quadridivergenza di un tensore con opportune propriet`a di antisimmetria. Dimostreremo, infatti, che esiste un tensore Λµναβ di rango quattro, antisimmetrico nella prima coppia di indici oltre che nella seconda, tale che, fµαβ + ∂ρ Λρµαβ , M µαβ = M con M µαβ definito in (3.61). Con un argomento standard, vedi (3.52), si verifica allora facilmente che,

Z αβ

L



Z 3

d xM

0αβ

=

f0αβ ≡ L eαβ , d3 x M

purch´e Λµναβ svanisca all’infinito spaziale pi` u rapidamente di 1/r2 . Incominciamo la dimostrazione ricordando la definizione della densit`a canonica di momento angolare, fµαβ = xα Teµβ − xβ Teµα + V µαβ , M

V µαβ ≡ Πµr Σαβ r s ϕs ,

e la relazione tra il tensore energia–impulso canonico e quello simmetrico, T µν = Teµν + ∂ρ φρµν ,

φρµν ≡

1 ρµν (V − V µρν − V νρµ ) . 2

Allora si pu`o scrivere, fµαβ = xα T µβ − xβ T µα − xα ∂ρ φρµβ + xβ ∂ρ φρµα + V µαβ M ¡ ¢ = M µαβ − ∂ρ xα φρµβ − xβ φρµα + φαµβ − φβµα + V µαβ ¡ ¢ = M µαβ − ∂ρ xα φρµβ − xβ φρµα ,

97

(3.62)

dove nell’ultimo passaggio abbiamo usato la definizione di φρµν riportata in (3.62), che comporta l’identit`a, φαµβ − φβµα = −V µαβ . Otteniamo quindi, fµαβ + ∂ρ Λρµαβ , M µαβ = M

con Λρµαβ ≡ xα φρµβ − xβ φρµα ,

(3.63)

dove Λρµαβ `e antisimmetrico nella prima coppia di indici oltre che nella seconda, che `e quanto volevamo dimostrare.

3.6

Problemi

3.1 Si consideri un campo scalare reale ϕ (“particella neutra con spin 0 e massa m”) con lagrangiana, L=

¢ λ 1¡ ∂µ ϕ∂ µ ϕ − m2 ϕ2 − ϕ4 , 2 4!

dove m e λ sono costanti reali. a) Si scrivano le equazioni di Eulero–Lagrange associate a L. b) Si verifichi esplicitamente che tali equazioni sono equivalenti alla richiesta di stazioRt nariet`a dell’azione I = t12 L d4 x, per variazioni generiche del campo ϕ, purch´e nulle in t = t1 e t = t2 . 3.2 Si consideri un campo scalare complesso Φ = ϕ1 + iϕ2 (“particella carica con spin 0 e massa m”) con lagrangiana, L = ∂µ Φ∗ ∂ µ Φ − m2 Φ∗ Φ −

λ ∗ 2 (Φ Φ) , 4

dove m e λ sono costanti reali. a) Si scrivano le equazioni di Eulero–Lagrange associate a L. [Sugg.: si considerino come campi indipendenti Φ e Φ∗ .] b) Si dica per quali valori di λ e m le equazioni del moto per ϕ1 e ϕ2 risultano disaccoppiate tra di loro. 3.3 Si consideri l’azione,

Z

t2

I= t1

98

L d4 x,

con L data in (3.25). a) Si determini la variazione di I per variazioni generiche di Aµ . b) Si verifichi esplicitamente che la variazione di I `e nulla per variazioni arbitrarie dei campi, purch´e nulle in t = t1 e t = t2 , se e solo se il campo di gauge soddisfa l’equazione di Maxwell. 3.4 Si consideri la lagrangiana per il campo reale scalare data nel problema 3.1. a) Si derivi il tensore energia–impulso canonico, analizzandone le propriet`a di simmetria. b) Si scriva l’espressione esplicita per la densit`a di energia e per l’energia totale del sistema. Si dica per quali valori di m e λ l’energia `e definita positiva. 3.5 Si verifichi esplicitamente che il tensore energia–impulso canonico del campo di Maxwell libero dato in (3.50) ha quadridivergenza nulla. 3.6 Si dimostri che per una teoria di campo di soli campi scalari il tensore energia– impulso canonico `e simmetrico. [Sugg.: per l’invarianza di Lorentz la lagrangiana pu`o dipendere da ∂µ ϕr solo attraverso la “matrice” Mrs = ∂µ ϕr ∂ µ ϕs , simmetrica in r e s.] 3.7 Si verifichi che per un campo di Maxwell libero il tensore φρµν ha la forma data in (3.60). fµαβ per un campo di Max3.8 Si determini la densit`a di momento angolare canonico M well libero. Si verifichi che la corrispondente densit`a di momento angolare “standard”, µβ µα come definita in (3.63), risulta uguale a xα Tem − xβ Tem .

~ B}, ~ 3.9 Si consideri una teoria di campo descritta dai sei campi lagrangiani ϕ ≡ {E, con lagrangiana, ³ ´ ~ ~ ·∇ ~ ×E ~ +B ~ ·∇ ~ ×B ~ − ~j · B, ~ ~ · ∂B + 1 E L=E ∂t 2 dove ~j `e un campo esterno indipendente da ϕ. Si confrontino le equazioni del moto associate a questa lagrangiana con le equazioni di Maxwell (2.28)–(2.31). 3.10 Si consideri la lagrangiana L del campo complesso del problema 3.2. a) Si verifichi che L `e invariante sotto il gruppo a un parametro di trasformazioni (gruppo

99

U (1) di “trasformazioni di gauge globali”), Φ0 (x) = eiΛ Φ(x),

Φ∗0 (x) = e−iΛ Φ∗ (x),

Λ ∈ R,

con Λ indipendente da x. b) Si dimostri che sotto una generica variazione infinitesima Φ → Φ + δΦ si ha, µ ¶ µ ¶ ∂L ∂L ∂L δL = − ∂µ δΦ + c.c. + ∂µ δΦ + c.c. ∂Φ ∂(∂µ Φ) ∂(∂µ Φ)

c) Si dimostri il teorema di Noether relativo al gruppo di simmetria di cui al punto a), determinando la forma esplicita della corrente j µ associata. [Sugg.: per una trasformazione infinitesima si ha δΦ = Φ0 − Φ = iΛΦ.] d) Si verifichi esplicitamente che la corrente j µ `e conservata, se il campo Φ soddisfa le equazioni di Eulero–Lagrange determinate nel punto a) del problema 3.2.

100

4

Il metodo variazionale per l’Elettrodinamica di particelle puntiformi

In questa sezione estenderemo il metodo variazionale a una teoria di campo accoppiata ad un sistema di particelle puntiformi. Per concretezza ci limiteremo a considerare il caso dell’Elettrodinamica, ovvero una teoria di campo con un unico campo vettoriale Aµ , interagente con un sistema di particelle cariche.

4.1

Principio variazionale per una particella libera

Prima di considerare il sistema accoppiato deduciamo la forma dell’azione per una particella relativistica libera. La richiesta di stazionariet`a di questa azione deve allora dare luogo alle equazioni del moto di una particella libera, cio`e, dpµ = 0. ds

(4.1)

Si tratta in sostanza di trovare la generalizzazione relativistica dell’azione newtoniana per la particella libera, con coordinate lagrangiane ~y (t), ¶ Z tb µ 1 2 mv dt, I0 [~y ] = 2 ta

(4.2)

dove questa volta abbiamo indicato gli estremi temporali con ta e tb , al posto di t1 e t2 . Come abbiamo visto il primo passo nella formulazione di un principio variazionale consiste nella scelta delle variabili lagrangiane. In questo caso stiamo cercando un’azione relativistica, e le coordinate lagrangiane appropriate non sono allora le ~y (t), ma le quattro funzioni, y µ (λ), che parametrizzano una generica linea di universo. Conseguentemente l’azione I[y] che stiamo cercando dovr`a essere invariante non solo sotto trasformazioni di Poincar´e, ma anche sotto riparametrizzazione, perch´e tale `e l’equazione (4.1). Come primo passo nella covariantizzazione di I0 sostituiamo la misura dt con la misura invariante, sia per Poincar´e che per riparametrizzazione, r dy µ dyµ ds = dλ, dλ dλ 101

che nel limite non relativistico si riduce in effetti a dt. L’azione che stiamo cercando dovrebbe quindi avere la forma, Z

b

I[y] =

l(y, y) ˙ ds, a

per un’opportuna lagrangiana invariante l. In questa espressione a e b indicano gli estremi del tratto di linea di universo considerato, e abbiamo definito, y˙ µ =

dy µ . dλ

A questo punto facciamo notara che, al contrario delle “velocit`a” y˙ µ , le coordinate y µ in realt`a non hanno carattere “tensoriale”, perch´e sotto traslazioni non sono invarianti. Di conseguenza l non pu`o dipendere dalle y µ , ma solo dalle y˙ µ . D’altra parte l’unico quadriscalare indipendente che possiamo formare con le y˙ µ `e la quantit`a, y˙ µ y˙ µ , ma questa non `e invariante sotto riparametrizzazione. Concludiamo che l deve essere indipendente anche dalle y˙ µ , e quindi necessariamente una costante. Poniamo allora per l’azione relativistica,

Z

b

I[y] = l

ds, a

che dal punto di vista geometrico corrisponde alla “lunghezza” dell’arco quadridimensionale della linea di universo compreso tra a e b. Per determinare infine la costante l richiediamo che nel limite non relativistico, v ¿ 1, questa azione si riduca a I0 . A questo scopo ricordiamo la definizione di ds e ne eseguiamo lo sviluppo non relativistico, µ ¶ 2 √ v 4 ds = 1 − v 2 dt = 1 − + o(v ) dt. 2 Arrestandoci al termine quadratico ottieniamo allora, ¶ Z tb µ l 2 I[y] = l(ta − tb ) − v dt. 2 ta Il primo termine `e indipendente dalle variabili dinamiche ed `e irrilevante. Il secondo si riduce in effetti a I0 se poniamo l = −m. Otteniamo quindi per l’azione relativistica di una particella libera, Z

Z br

b

I[y] = −m

ds = −m a

a

102

dy µ dyµ dλ. dλ dλ

(4.3)

Ci possiamo ora domandare quali sono le linee di universo che rendono stazionaria questa azione per variazioni generiche delle coordinate

17

,

δy µ (λ) = y 0µ (λ) − y µ (λ), purch´e nulle ai bordi, δy µ (a) = 0 = δy µ (b).

(4.4)

Faremo ora vedere che le linee di universo in questione sono esattamente quelle che soddisfano le (4.1). Per farlo calcoliamo la variazione dell’azione (4.3) per variazioni generiche delle coordinate, ¶ ¶ µ µ µ µ Z b Z b 1 1 dy dyµ dy d δyµ q q δI = −m δ dλ = −m dλ. dλ dλ dλ dλ dy µ dyµ dy µ dyµ a 2 a dλ dλ dλ dλ Usando le relazioni,

r

dy µ dyµ ds = , dλ dλ dλ

otteniamo,

Z

b

δI = −

pµ = m



a

dy µ , ds

d δyµ ds, ds

e integrando per parti arriviamo poi a, ¯b Z ¯ δI = −p δyµ ¯ +

b

µ

a

a

dpµ δyµ ds. ds

Se imponiamo ora che l’azione sia stazionaria per variazioni δy µ arbitrarie purch´e soddisfacenti le (4.4), il primo termine si annulla, e otteniamo la condizione di stazionariet`a, dpµ = 0. ds

4.2

L’azione per l’Elettrodinamica

In questa sezione consideriamo un generico sistema di particelle cariche in interazione con il campo elettromagnetico. Se introduciamo come al solito un potenziale vettore Aµ e 17

In alternativa l’azione di una particella relativistica potrebbe essere considerata anche come funzionale delle variabili lagrangiane ~y (t), al posto delle y µ (λ). In questo caso si otterrebbero equazioni del moto ` facile vedere che nel caso della particella completamente equivalenti, ma non in forma covariante a vista. E libera, per esempio, dalla (4.3) si otterrebbe l’equazione d~ p/dt = 0, al posto di dpµ /ds = 0. La scelta delle variabili y µ (λ) ha evidentemente il pregio di mantenere la covarianza a vista.

103

definiamo, Fµν = ∂µ Aν − ∂ν Aµ , allora le equazione del moto di questo sistema sono l’equazione di Maxwell (2.14) per il potenziale vettore, e le equazioni di Lorentz (2.12) per le particelle. In questa sezione rideriveremo queste equazioni da un principio variazionale. Useremo poi il teorema di Noether applicato al gruppo di Poincar´e, per riottenere le noti leggi di conservazione. Confermeremo in particolare le espressioni esplicite delle correnti (2.69), (2.70) e (2.85), ottenute precedentemente in modo euristico. Punto di partenza deve essere un’azione I[A, yr ] – funzionale del campo elettromagnetico Aµ (x) e delle linee di universo yrµ (λr ) delle particelle – che sia invariante sotto trasformazioni di Poincar´e. Abbiamo gi`a dedotte l’equazione di Maxwell da un principio variazionale a partire dalla lagrangiana (3.25), e conosciamo inoltre l’azione (4.3) corrispondente a una particella libera. Per l’azione del sistema interagente viene allora naturale ipotizzare l’espressione, Z Z Σb Z br X 1 Σb µν 4 µ 4 dsr = I1 + I2 + I3 . F Fµν d x − Aµ j d x − mr I[A, yr ] = − 4 Σa ar Σa r

(4.5)

In questa espressione gli integrali quadridimensionali sono eseguiti tra due ipersuperfici di tipo spazio Σa e Σb non intersecantesi, mentre ar e br sono rispettivamente i punti d’intersezione della linea di universo r–esima con Σa e Σb

18

. Interpretiamo I1 come la

parte dell’azione che descrive la propagazione libera di Aµ , I3 come la parte che descrive il moto libero delle cariche, e I2 come la parte che descrive l’interazione tra particelle cariche e campo elettromagnetico. La giustificazione ultima di questa azione deriva, ovviamente, dal fatto che essa d`a luogo alle equazioni del moto desiderate, come faremo vedere di seguito. Per impostare il problema variazionale `e conveniente riscrivere l’azione in una forma diversa. Sfruttando la definizione della corrente possiamo intanto riscrivere il termine di interazione, Z

Σb

I2 = −

Aµ (x) Σa

X

Z er

4

δ (x −

yr ) dyrµ

4

d x=−

X r

r

18

Z

br

er ar

Aµ (yr ) dyrµ .

(4.6)

Ogni linea di universo γr interseca le ipersuperfici Σa,b un’unica volta, perch´e la prima `e di tipo tempo, mentre le seconde sono di tipo spazio.

104

Come nella sezione precedente introduciamo per le derivate delle variabili lagrangiane yrµ (λr ) la notazione abbreviata, y˙ rµ =

dyrµ . dλr

Usando (4.3) e (4.6) `e allora immediato ottenere, X Z br I2 + I3 = − (mr dsr + er Aµ (yr )dyrµ ) r

= −

XZ

=

r

br ar

r

XZ

ar

µ q ¶ µ µ mr y˙ r y˙ rµ + er Aµ (yr )y˙ r dλr

(4.7) (4.8)

br

Lr (yr , y˙ r ) dλr ,

(4.9)

ar

dove abbiamo definito le Lagrangiane “ordinarie”, Lr (yr , y˙ r ) = −mr

p y˙ rν y˙ rν − er Aν (yr ) y˙ rν .

(4.10)

Dalle formule scritte si vede anche che l’azione pu`o essere posta nella forma, Z Σb I= L d4 x, Σa

se definiamo la lagrangiana totale, L = L1 + L2 + L3

Z X 1 µν µ = − F Fµν − Aµ j − mr δ 4 (x − yr ) dsr 4 r XZ = L1 + Lr δ 4 (x − yr ) dλr .

(4.11) (4.12)

r

Il problema variazionale. Secondo il principio variazionale cerchiamo ora le configurazioni di campi e particelle che rendono stazionaria l’azione – δI = 0 – per variazioni arbitrarie δAµ e δyrµ , purch´e soddisfacenti, δyrµ (ar ) = 0 = δyrµ (br ).

δAµ |Σa = 0 = δAµ |Σb ,

Consideriamo separatamente variazioni dei campi e variazioni delle linee di universo. Per variazioni dei campi, siccome I3 `e indipendente da Aµ , il problema si riduce a considerare R l’azione I1 +I2 = d4 x (L1 +L2 ). Ma sappiamo che le configurazioni dei campi che rendono stazionaria questa azione sono quelle che soddisfano le equazioni di Eulero–Lagrange associate alla lagrangiana L1 + L2 . Queste ultime, d’altro canto, sono state derivate nella sezione 3.2.3 e viste coincidere con l’equazione di Maxwell (3.27). 105

Resta da imporre la stazionariet`a dell’azione per variazioni delle coordinate. In questo caso, siccome I1 `e indipendente dalle yr , `e sufficiente considerare l’azione I2 +I3 . Potremmo calcolare la variazione di questa azione con le tecniche usate nella sezione precedente, e troveremmo che le condizioni di stazionariet`a coincidono proprio con le equazioni di Lorentz, vedi problema 4.1. Di seguito proponiamo una dimostrazione alternativa di questo risultato, basata direttamente sul metodo lagrangiano per un sistema a finiti di gradi di libert`a, vedi sezione 3.1. Riprendiamo a questo scopo l’azione I2 + I3 , scritta come in (4.9). Questa azione si separa in una somma di termini, X I2 + I3 = I[yr ],

Z

br

I[yr ] =

Lr (yr , y˙ r ) dλr , ar

r

ciascuno dei quali dipende solo da una delle coordinate. L’azione I2 + I3 sar`a quindi stazionaria se ciascuna I[yr ] `e stazionaria per variazioni generiche delle yrµ , con le solite condizioni agli estremi. Ma I[yr ] `e l’integrale della lagrangiana ordinaria Lr , corrispondente a un sistema lagrangiano con quattro gradi di libert`a. Come sappiamo dalla sezione 3.1, il problema della stazionariet`a di questa azione si riduce allora alle equazioni di Lagrange associate, vale a dire, d ∂Lr ∂Lr − µ = 0. dλr ∂ y˙ rµ ∂yr Valutiamo dunque i due termini di questa equazione, tralasciando per semplicit`a l’indice r. Dalla (4.10) si ottiene immediatamente, ∂L = −e ∂µ Aν y˙ ν . ∂y µ Calcoliamo poi, ∂L my˙ µ = − √ ν − eAµ (y) = −pµ − eAµ (y), µ ∂ y˙ y˙ y˙ ν

(4.13)

dove abbiamo introdotto il quadrimomento pµ della particella, ed utilizzato la solita √ ds relazione y˙ ν y˙ ν = dλ . Infine dobbiamo valutare, d ∂L dpµ = − − e y˙ ν ∂ν Aµ . dλ ∂ y˙ µ dλ In definitiva otteniamo, d ∂L ∂L dpµ ds − µ =− + e y˙ ν (∂µ Aν − ∂ν Aµ ) = − µ dλ ∂ y˙ ∂y dλ dλ che `e l’equazione di Lorentz. 106

µ

dpµ − eFµν uν ds

¶ = 0,

(4.14)

4.3

Il teorema di Noether in Elettrodinamica

Nella sezione precedente abbiamo stabilito un principio variazionale per l’Elettrodinamica classica, compatibile con i postulati della Relativit`a Ristretta. Pi` u precisamente, abbiamo individuato un’azione invariante sotto trasformazione del gruppo di Poincar´e da cui discendono le equazioni del moto per campi e particelle. Secondo il teorema di Noether dovrebbe quindi essere possibile derivare la forma delle “correnti” conservate T µν e M µαβ , sfruttando l’invarianza dell’azione rispettivamente per traslazioni e per trasformazioni di Lorentz. Anche in questo caso la dimostrazione del teorema pu`o essere svolta secondo la strategia adottata nel capitolo precedente per un sistema di soli campi, ma dal punto di vista tecnico essa `e leggermente pi` u complicata per via della presenza delle particelle. Seguendo il metodo della sezione 3.3 impostiamo la dimostrazione a partire non direttamente dall’azione, ma dalla lagrangiana del sistema, vedi (4.11). Per brevit`a indichiamo le dipendenze funzionali di questa lagrangiana con L(A(x), yr , x), omettendo di indicare esplicitamente la dipendenza dalle derivate ∂A e y˙ r . Notiamo, comunque, che formalmente questa lagrangiana esibisce anche una dipendenza esplicita dalla coordinata x – indicata dal suo terzo argomento – attraverso le δ 4 (x − yr ) che compaiono in (4.11). Tuttavia, vedremo fra poco che in questo caso non sussiste nessuna rottura dell’invarianza per traslazioni. Per le trasformazioni di Poincar´e adottiamo le notazioni del paragrafo 3.3.1. Per trasformazioni finite abbiamo, x0µ = Λµ ν xν + aµ ,

yr0µ = Λµ ν yrν + aµ ,

A0µ (x0 ) = Λµ ν Aν (x),

e per trasformazioni infinitesime, Λµ ν = δ µ ν + ω µ ν , ne segue, δyrµ = aµ + ω µ ν yrν .

δxµ = aµ + ω µ ν xν ,

(4.15)

Per le trasformazioni del campo vettoriale distinguiamo di nuovo trasformazioni totali e trasformazioni in forma, δAα ≡ A0α (x0 ) − Aα (x) = ωα β Aβ (x), δAα ≡ A0α (x) − Aα (x) = −δxν ∂ν Aα + δAα = −δxν ∂ν Aα + ωα β Aβ (x). 107

(4.16)

L’invarianza di L sotto trasformazioni di Poincar´e `e allora espressa dall’identit`a, δL ≡ L(A0 (x0 ), yr0 , x0 ) − L(A(x), yr , x) = 0.

(4.17)

Difatti l’unico elemento nella (4.11) la cui invarianza va controllata `e la δ 4 di Dirac, δ 4 (x0 − yr0 ) = δ 4 (Λx + a − (Λyr + a)) = δ 4 (Λ(x − yr )) =

δ 4 (x − yr ) = δ 4 (x − yr ). |detΛ|

Questo vuol dire che le trasformazioni delle δ 4 in seguito potranno essere semplicemente ignorate. Manipoliamo ora l’identit`a (4.17) in completa analogia con il caso di una teoria con soli campi. Scriviamo, δL = [L(A0 (x0 ), yr0 , x0 ) − L(A0 (x), yr , x)] + [L(A0 (x), yr , x) − L(A(x), yr , x)] . I due termini della prima parentesi quadra differiscono solo per le variazioni (4.15) di x e yr , mentre nella seconda parentesi quadra compare solo una trasformazione in forma di Aµ . Nella prima parentesi quadra conviene usare l’espressione (4.12), mentre nella seconda `e pi` u conveniente la (4.11). Si ottiene cos`ı, " # · ¸ XZ ∂L µν µ 4 δAν + Π ∂µ δAν . δL = δx ∂µ L1 + δLr δ (x − yr ) dλr + ∂A ν r

(4.18)

Con δLr intendiamo qu`ı la variazione di Lr per le variazioni delle yr date in (4.15), e abbiamo usato la definizione consueta per i momenti coniugati, Πµν ≡

∂L ∂(∂µ Aν )

= −F µν .

Alla seconda parentesi quadra contribuiscono solo i termini L1 +L2 , e possiamo riscriverla come, · ¸ ∂L ∂L µν µν µν δAν + Π ∂µ δAν = ∂µ (Π δAν ) + − ∂µ Π δAν , ∂Aν ∂Aν = ∂µ (Πµν δAν ) + (∂µ F µν − j ν ) δAν , dove nell’ultimo termine riconosciamo l’equazione di Maxwell. In modo completamente analogo possiamo manipolare la variazione di Lr , facendo comparire le equazioni di Lorentz, δLr

µ ¶ µ ¶ d ∂Lr d ∂Lr ∂Lr ν ∂Lr ν ∂Lr ν = + δ y˙ r = δyr ν + δyr − ∂yrν ∂ y˙ rν dλr ∂ y˙ r ∂yrν dλr ∂ y˙ rν µ ¶ µ ¶ d dsr dprν ∂Lr = δyrν ν + − Fνµ uµr δyrν , dλr ∂ y˙ r dλr dsr δyrν

108

dove l’ultimo termine corrisponde alle equazioni di Lorentz, vedi (4.14). Il primo termine, invece, inserito in (4.18), attraverso un’integrazione per parti d`a luogo a, µ ¶ Z Z d ∂Lr d 4 ν ∂Lr 4 δyr ν δ (x − yr ) dλr = − δyrν ν δ (x − yr ) dλr dλr ∂ y˙ r ∂ y˙ r dλr ¶¯λr =+∞ µ ¯ ν ∂Lr 4 + δyr δ (x − yr ) ¯¯ . ν ∂ y˙ r λr =−∞ Per ogni x fissato, per λr → ±∞ la δ 4 (x − yr ) si annulla, quindi il secondo termine `e nullo. Per quanto riguarda il primo termine notiamo invece che, d 4 δ (x − yr ) = −y˙ rµ ∂µ δ 4 (x − yr ) = −∂µ (y˙ rµ δ 4 (x − yr )), dλr e otteniamo una quadridivergenza, µ ¶ µZ ¶ Z d ν ∂Lr 4 µ ν ∂Lr 4 δyr ν δ (x − yr ) dλr = ∂µ δ (x − yr ) dλr . y˙ r δyr dλr ∂ y˙ r ∂ y˙ rν Inseriamo ora questi risultati nella (4.18), " # XZ ∂L r δL = ∂µ δxµ L1 + Πµν δAν + y˙ rµ δyrν ν δ 4 (x − yr ) dλr ∂ y˙ r r ¶ µ Z X dprν µν ν µ + (∂µ F − j ) δAν + − Fνµ ur δyrν δ 4 (x − yr ) dsr . dsr r

(4.19)

Questa formula ha ora la stuttura prevista dal teorema di Noether: eguaglia la variazione della lagrangiana alla quadridivergenza di un certo quadrivettore – la parentesi ` ora un semplice eserciquadra – modulo termini proporzionali alle equazioni del moto. E zio esplicitare la parentesi quadra e determinare i coefficienti di aν e di ω αβ , per ottenere ` sufficiente inserire le formule (4.13), (4.15) la forma esplicita delle correnti conservate. E e (4.16). Per i primi due termini della parentesi quadra in (4.19) otteniamo, µν − F µν ωνρ Aρ , δxµ L1 + Πµν δAν = δxν (η µν L1 − Πµν ∂ ν Aν ) + Πµν δAν = −δxν Teem

(4.20)

dove abbiamo ritrovato il tensore energia–impulso canonico per un campo di Maxwell libero, (3.50). Per il terzo termine in (4.19) notiamo che per le propriet`a della δ 4 possiamo sostituire δyrν con δxν . Con l’aiuto di (4.13) e parametrizzando l’integrale con il tempo proprio, questo termine pu`o allora essere posto nella forma, XZ XZ ν ∂Lr 4 µ y˙ r δyr δ (x − yr ) dλr = −δxν uµr (pνr + er Aν (yr )) δ 4 (x − yr ) dsr ν ∂ y ˙ r r ¡ r µν ¢ (4.21) = −δxν Tp + j µ Aν , 109

dove abbiamo ritrovato il tensore energia–impulso delle particelle, (2.70). Sommando (4.20) e (4.21) ed esplicitando δxν = aν + ωνβ xβ , la parentesi quadra in (4.19) pu`o allora essere scritta come, ³ −δxν

Tpµν

´ 1 µν µ ν e fµαβ , + Tem + j A − F µν ωνρ Aρ = −aν Teµν + ωαβ M 2

dove abbiamo definito i tensori energia–impulso e densit`a di momento angolare canonici dell’Elettrodinamica classica, µν + j µ Aν Teµν = Tpµν + Teem

fµαβ = xα Teµβ − xβ Teµα − F µα Aβ + F µβ Aα . M

(4.22) (4.23)

In definitiva possiamo riscrivere la (4.19) come, 1 fµαβ ωαβ ∂µ M 2 ¶ X Z µ dprν ν µ − j ) δAν + − Fνµ ur δyrν δ 4 (x − yr ) dsr , dsr r

δL = −aν ∂µ Teµν + + (∂µ F µν

(4.24)

da confrontare con l’analoga identit`a per una teoria di soli campi, vedi (3.47). Dato che la lagrangiana `e invariante per l’intero gruppo di Poincar´e abbiamo che δL = 0 identicamente. Concludiamo quindi che, se i campi e le particelle soddisfano le fµαβ risultano conservati, rispettive equazioni del moto, allora i tensori Teµν e M fµαβ . ∂µ Teµν = 0 = ∂µ M

(4.25)

Tensore energia–impulso simmetrico e densit`a di momento angolare standard. Di nuovo vediamo che le correnti che abbiamo ottenuto non hanno la forma che abbiamo trovato fµαβ nei paragrafi 2.4.3 e 2.4.4 con metodi euristici; in particolare Teµν non `e simmetrico e M non ha la forma standard. Inoltre, nessuno dei due tensori `e gauge invariante. Vediamo µν , mentre in assenza di campo comunque che in assenza di particelle Teµν si riduce a Teem

elettromagnetico esso si riduce a Tpµν . Ma nella (4.22) c’`e anche il termine di interferenza j µ Aν , di interpretazione pi` u difficile. Tuttavia, anche in questo caso possiamo adottare la strategia generale per la simmetrizzazione del tensore energia–impulso, sviluppata in sezione 3.4. Poniamo, T µν = Teµν + ∂ρ φρµν , 110

φρµν = −φµρν ,

(4.26)

dove il tensore φρµν `e dato in termini del tensore V µαβ secondo la definizione (3.56). D’altra parte quest’ultimo si pu`o determinare confrontando la (4.23) con la (3.53). Risulta, V µαβ = −F µα Aβ + F µβ Aα , come nel caso del campo di Maxwell libero, vedi (3.59). Anche il tensore φρµν `e allora quello corrispondente al campo di Maxwell libero, φρµν = −F ρµ Aν . Tuttavia, in presenza di particelle la divergenza di questo tensore contiene anche un termine proporzionale alla corrente. Risulta infatti, ∂ρ φρµν = −∂ρ F ρµ Aν − F ρµ ∂ρ Aν = −j µ Aν − F αµ ∂α Aν . Aggiungendo questa espressione a (4.22) si vede che il termine di interferenza j µ Aν si cancella, e che si ricombina il tensore energia–impulso simmetrico del campo elettromagnetico, µν T µν = Tem + Tpµν ,

∂µ T µν = 0,

a conferma dei risultati (2.69) e (2.70) del capitolo 2. Analogamente, secondo la (3.63) si pu`o modificare la densit`a di momento angolare (4.23) ponendo, fµαβ + ∂ρ Λρµαβ , M µαβ = M

Λρµαβ = xα φρµβ − xβ φρµα .

Nel nostro caso risulta, ∂ρ Λρµαβ = φαµβ + xα ∂ρ φρµβ − (α ↔ β) = F µα Aβ + xα (T µβ − Teµβ ) − (α ↔ β). Aggiungendo questo termine a (4.23) si vede immediatamente che risulta, M µαβ = xα T µβ − xβ T µα , in accordo con il nostro risultato euristico (2.85). Abbiamo cos`ı riottenuto la forma dei tensori energia–impulso e densit`a di momento angolare per l’Elettrodinamica. Pi` u del risultato, gi`a noto, `e importante il metodo che 111

abbiamo utilizzato, cio`e, il teorema di Noether. Nella sezione 3.3 abbiamo dato una dimostrazione generale di questo teorema per una teoria di soli campi. In questa sezione abbiamo dimostrato il teorema in una situazione fisica molto diversa, in cui alcuni gradi di libert`a non sono distribuiti con continuit`a nello spazio, come i campi, ma costituiscono dei “difetti” puntiformi, appunto le particelle. In questo capitolo abbiamo difatti illustrato una circostanza molto generale, e cio`e che in Fisica il teorema di Noether vale a tutti i livelli: vale per teorie contenenti campi, particelle, stringhe e – pi` u in generale – membrane di qualsiasi estensione spaziale; vale a livello newtoniano cos`ı come vale in Relativit`a Ristretta e in Relativit`a Generale, vale in Fisica Classica e in Meccanica Quantistica, in Teoria Quantistica Relativistica dei Campi e, ancora, nelle Teorie di Superstringa.

4.4

Invarianza di gauge e conservazione della carica elettrica

Nella sezione precedente abbiamo discusso il teorema di Noether relativo al gruppo di Poincar´e, con conseguente conservazione del quadrimomento e del momento angolare quadridimensionale. Ma in Elettrodinamica esiste un’altra grandezza conservata – non associata al gruppo di Poincar´e – che `e la carica elettrica, e se vale il teorema di Noether, allora anche ad essa dovrebbe essere associato un gruppo a un parametro di simmetrie. In effetti l’Elettrodinamica `e dotata di una simmetria fondamentale che abbiamo gi`a ampiamento esplorato – l’invarianza di gauge – che potrebbe essere legata alla conservazione della carica via il teorema di Noether. Per analizzare questo possibile nesso facciamo intanto notare che le trasformazioni di gauge costituiscono effettivamente un gruppo (abeliano), con un solo parametro Λ. Posto A01µ = Aµ + ∂µ Λ1 , abbiamo infatti, A02µ = A01µ + ∂µ Λ2 = Aµ + ∂µ (Λ1 + Λ2 ). Esploriamo allora la variazione della lagrangiana (4.11) sotto una generica trasformazione di gauge δAµ = A0µ − Aµ = ∂µ Λ. Risulta, δL = −∂µ Λj µ = −∂µ (Λj µ ) + Λ ∂µ j µ ∼ = Λ ∂µ j µ , 112

dove abbiamo sfruttato il fatto che le lagrangiana sono definite modulo quadridivergenze. Avremmo dunque trovato proprio il legame implicato dal teorema di Noether, ovvero che l’invarianza della lagrangiana implica la conservazione locale della carica, δL = 0

∂µ j µ = 0.



(4.27)

Tuttavia, il nesso appena evidenziato non segue proprio le linee del teorema di Noether, per come l’abbiamo illustrato nella sezione precedente. Il primo motivo `e che il parametro Λ(x) non `e un parametro “globale”, ovvero costante, come invece previsto dal teorema di Noether; d’altra parte se Λ `e costante la trasformazione di gauge si riduce banalmente alla trasformazione identica. Il secondo motivo `e che nella derivazione della (4.27) le equazioni del moto dell’Elettrodinamica non hanno giocato nessun ruolo, mentre il loro uso era essenziale nella dimostrazione delle leggi di conservazione (4.25). Sappiamo, infatti, che la corrente (2.6) `e conservata identicamente, indipendentemente dalla validit`a delle equazioni del moto. Si intuisce che questa a–simmetria esistente in Elettrodinamica classica tra il gruppo di Poincar`e e il gruppo delle trasformazioni di gauge, `e dovuta al fatto che le particelle cariche in questo ambito vengono trattate come “difetti” puntiformi: conseguentemente la conservazione della carica totale – in ultima analisi – corrisponde semplicemente al “conteggio” delle particelle contenute in un dato volume. Infatti, integrando la (2.40) su un volume finito V si ottiene per la carica QV (t) contenuta all’istante t in V , Z 0

QV (t) =

3

j (t, ~x) d x = V

X

Z δ 3 (~x − ~yr (t)) d3 x =

er V

r

X

er ,

r∈ V

dove la somma si estende a tutte le particelle che all’istante t si trovano in V . Si pu`o, al contrario, vedere che quando anche le particelle cariche vengono rappresentate da campi – alla stessa stregua del campo elettromagnetico – allora la conservazione della carica elettrica segue esattamente lo schema “a la Noether”, illustrato sopra per la conservazione di quadrimomento e momento angolare quadridimensionale. Questo succede, per esempio, nell’ambito della teoria quantistica relativistica di campo.

113

4.5

Problemi

4.1 Seguendo il procedimento della sezione 4.1 si deducano le equazioni di Lorentz (2.12), imponendo la stazionariet`a dell’azione (4.8) per variazioni generiche δyrµ delle coordinate, purch´e nulle in ar e br . 4.2 Si deduca la forma della lagrangiana di un sistema di cariche non relativistiche interagenti con un campo elettromagnetico esterno, eseguendo il limite non relativistico dell’azione (4.7),

114

5

Onde elettromagnetiche

In questo capitolo avviamo la ricerca di soluzioni esatte dell’equazioni di Maxwell e l’analisi delle loro propriet`a. La prima classe di soluzioni che analizzeremo `e costituita dalle onde piane elettromagnetiche, le quali costituiscono un particolare insieme completo di soluzioni dell’equazione di Maxwell nel vuoto, cio`e, in assenza di sorgenti, j µ = 0. La rilevanza fenomenologica di queste soluzioni `e evidente. Basta pensare che l’energia fornita dal sole viaggia interamente a cavallo di onde elettromagnetiche, e che qualsiasi tipo di segnale che si propaga sulla terra via “etere” `e costituito da queste onde. Ricordiamo inoltre che la quasi totalit`a dell’informazione che acquisiamo sull’universo arriva sulla terra tramite segnali luminosi emessi da oggetti stellari, segnali costituiti da onde elettromagnetiche che si propagano nello spazio vuoto su distanze molto grandi. L’universo stesso poi `e pervaso dalla cosiddetta radiazione cosmica di fondo, con ottima approssimazione isotropa ed omogenea, che `e caratterizzata da uno spettro in frequenza di corpo nero ad una temperatura di T = 2.73 o K. Questa radiazione `e messaggera di un’epoca primordiale in cui la materia era costituita prevalentemente da particelle cariche dissociate, soggette in continuazione a urti di natura elettromagnetica. Dopo “l’ultimo scattering” e la conseguente ricombinazione delle particelle cariche in molecole neutre, il campo di radiazione prodotto in questi urti si `e disaccoppiato dalle cariche e si manifesta oggi come “radiazione” di fondo – apparentemente priva di sorgenti. In questo capitolo studieremo le propriet`a delle onde elettromagnetiche, in quanto base completa di soluzioni dell’equazione di Maxwell nel vuoto. Nel prossimo capitolo ci occuperemo invece delle soluzioni dell’equazione di Maxwell in presenza di sorgenti. In particolare determineremo il campo elettromagnetico esatto creato da una quadricorrente j µ arbitraria. Lontano dalle sorgenti questo campo soddisfa di nuovo l’equazione di Maxwell nel vuoto, ed in quella regione potr`a quindi essere analizzato a sua volta in termini di onde elettromagnetiche. Tuttavia, prima di poter affrontare questi argomenti dobbiamo capire qual `e il contenuto cinematico del campo elettromagnetico, ovverosia, quali sono le variabili indipendenti 115

che descrivono il suo stato in ogni istante. Detto in altre parole, dobbiamo individuare i gradi di libert` a fisici coinvolti nell’evoluzione temporale del campo elettromagnetico. Solo allora saremo in grado di impostare correttamente il problema di Cauchy, cio`e, di assegnare un insieme completo di dati iniziali, che attraverso l’equazione di Maxwell determinano il valore del campo in ogni istante.

5.1

I gradi di libert` a del campo elettromagnetico

Innanzitutto dobbiamo spiegare cosa intendiamo con “grado di libert`a” in una generica teoria di campo. La definizione che ne daremo costituisce una generalizzazione del concetto analogo in meccanica classica – prototipo di un sistema lagrangiano a finiti gradi di libert`a. Prima di passare alla teoria di campo `e allora utile ricordare brevemente il significato di questo importante concetto in meccanica. 5.1.1

I gradi di libert` a in meccanica newtoniana

In meccanica newtoniana il concetto di grado di libert`a si riferisce al numero di variabili lagrangiane necessarie per descrivere cinematicamente un sistema fisico. Per esempio, una particella che si muove nello spazio tridimensionale `e caratterizzata da tre gradi di libert`a, in quanto la sua posizione `e specificata in ogni istante t dalle tre coordinate ~y (t). Ma possiamo analizzare lo stesso sistema fisico anche da un altro punto vista, ponendoci la domanda: quanti dati iniziali, diciamo a t = 0, dobbiamo assegnare per poter predire la posizione della particella in ogni istante? La risposta – sei e non tre – `e strettamente legata alla dinamica della particella, vale a dire all’equazione di Newton, m

d2 ~y = F~ , dt2

quale equazione differenziale del secondo ordine nel tempo, che richiede di assegnare sia ~y (0) che ~v (0). Potremmo porre il problema dinamico equivalentemente nella forma, m

d~v = F~ , dt

d~y = ~v , dt

che rappresenterebbe in effetti un sistema a sei gradi di libert`a. Ci rendiamo cos`ı conto che la convenzione comune “una particella corrisponde a tre gradi di libert`a” sottintende 116

in realt`a tre gradi di libert` a del secondo ordine. Equivalentemente potremmo infatti dire che una particella corrisponde a sei gradi di libert` a del primo ordine. La preferenza per la prima convenzione discende dal fatto che il determinismo newtoniano – confermato sperimentalmente in modo universale – prevede in generale che una variabile fondamentale `e determinata in ogni istante, se a un dato istante si conoscono il suo valore e la sua derivata prima. D’ora in poi useremo il termine “grado di libert`a” – sottintendendo “del secondo ordine” – per una variabile la cui dinamica sia governata da un’equazione del moto che, noti il suo valore e la sua derivata ad un dato istante, determina la variabile in ogni istante. 5.1.2

I gradi di libert` a in teoria di campo

In teoria di campo le variabili fondamentali sono i campi – che da un punto di vista meccanico corrispondono a un sistema a infiniti gradi di libert`a. Mantenendo l’analogia con la meccanica, ma adattando la prospettiva, diamo allora la seguente definizione. Definzione. Diremo che un campo ϕ(t, ~x) corrisponde a un grado di libert`a (del secondo ordine) se le equazioni del moto che governano la sua dinamica sono tali, che noti ϕ(0, ~x) e ∂0 ϕ(0, ~x) in tutto lo spazio, esse determinano ϕ(t, ~x) per ogni t. Come prototipo di un’equazione di questo tipo consideriamo l’equazione per un campo scalare, 2 ϕ = P (ϕ),

(5.1)

dove P (ϕ) `e un polinomio in ϕ e, 2 ≡ ∂µ ∂ µ = ∂02 − ∇2 , `e l’operatore d’Alembertiano, completamento relativistico dell’operatore Laplaciano tridimensionale. Questa equazione `e del secondo ordine nella derivata temporale e ci aspettiamo quindi che essa assegni a ϕ un grado di libert`a. Per convincerci che questo `e effettivamente il caso fissiamo i dati iniziali, ϕ(0, ~x) e ∂0 ϕ(0, ~x),

117

e cerchiamo di determinare ϕ(t, ~x) imponendo la (5.1). Se assumiamo che la soluzione sia una funzione analitica in t possiamo svilupparla in serie di Taylor, ϕ(t, ~x) =

∞ X ∂0n ϕ(0, ~x) n t , n! n=0

(5.2)

e cercare di determinare i coefficienti usando la (5.1). I coefficienti con n = 0 e n = 1 sono fissati dai dati inizili. Il coefficiente con n = 2 si ottiene invece valutando la (5.1) in t = 0, ∂02 ϕ(0, ~x) = ∇2 ϕ(0, ~x) + P (ϕ(0, ~x)). Derivando poi la (5.1) una volta rispetto al tempo e valutandola in t = 0 si ottiene il coefficiente con n = 3, ∂03 ϕ(0, ~x) = ∇2 ∂0 ϕ(0, ~x) + P 0 (ϕ(0, ~x)) ∂0 ϕ(0, ~x). Derivando ripetutamente la (5.1) rispetto al tempo si ottengono cos`ı tutte le derivate ∂0n ϕ(0, ~x) in termini delle derivate spaziali dei dati iniziali ϕ(0, ~x) e ∂0 ϕ(0, ~x), e la solu` poi facile vedere che si giunge alla stessa zione `e quindi univocamente determinata. E conclusione se P `e un arbitrario polinomio in ϕ e ∂µ ϕ, e anche se il membro di destra della (5.1) contiene un termine aggiuntivo noto j(x), indipendente da ϕ. 5.1.3

Il problema di Cauchy per l’equazione di Maxwell

Siamo ora in grado di affrontare il problema di Cauchy, ovverosia il problema alle condizioni inziali, per l’equazione di Maxwell. In particolare vogliamo stabilire quanti e quali sono i gradi di libert`a associati alla propagazione del campo elettromagnetico. Se secondo la nostra consueta strategia risolviamo l’identit`a di Bianchi introducendo un potenziale vettore Aµ , allora il sistema di equazioni da risolvere schematicamente si scrive, ∂µ F µν = j ν ,

F µν ≡ ∂ µ Aν − ∂ ν Aµ ,

Aµ ≈ Aµ + ∂ µ Λ.

Condizioni asintotiche. Prima di affrontare la soluzione di questo sistema specifichiamo la classe di configurazioni del potenziale vettore e della corrente che consideriamo “fisicamente accettabili”. Assumeremo intanto che la corrente sia nota e – ovviamente – a

118

quadridivergenza nulla. Supporremo inoltre che per ogni t fissato essa sia a supporto spaziale compatto, come succede per qualsiasi distribuzione di carica realizzabile in natura. Richiederemo, cio`e, che, j µ (t, ~x) = 0,

per |~x| > R,

(5.3)

dove il raggio R in generale dipende da t. Corrispondentemente accetteremo come soluzioni “fisiche” dell’equazione di Maxwell solo quelle che per ogni t fissato all’infinito spaziale si annullano, lim Aµ (t, ~x) = 0.

|~ x|→∞

(5.4)

Si pu`o, infatti, vedere che questa condizione discende essenzialmente dall’assunzione che non ci siano cariche all’infinito. Nel caso particolare di un campo elettromagnetico nel vuoto, in realt`a non sembra esserci nessun legame tra la condizione (5.4) e la posizione delle cariche – semplicemente perch´e le cariche sono assenti. Tuttavia, un “campo nel vuoto” costituisce la schematizzazione matematica di una situazione realizzabile fisicamente, in cui il campo `e stato generato da delle cariche “lontane” in un “passato lontano”, e quindi anche in questo caso all’infinito esso sar`a zero. Facciamo comunque notare che la condizione (5.4) esclude anche certe soluzioni idealizzate – di per s´e non fisiche – che vengono per`o spesso utilizzate in Elettrodinamica per semplificare le analisi svolte. Cos`ı essa esclude il campo elettromagnetico costante e uniforme f µν , con potenziale vettore, Aµ (x) =

1 xν f νµ , 2

F µν (x) = f µν ,

i campi prodotti da fili e piani infiniti uniformemente carichi, e la stessa onda piana, in quanto infinitamente estesa, vedi (5.61). Esplicitiamo ora l’equazione di Maxwell in termini del potenziale vettore, ∂µ (∂ µ Aν − ∂ ν Aµ ) = 2Aν − ∂ ν (∂µ Aµ ) = j ν . Per via della presenza delle derivate seconde rispetto al tempo ci si potrebbe aspettare che questo sistema corrisponda a quattro gradi di libert`a. Tuttavia, questa conclusione `e affrettata, per i seguenti due motivi.

119

Un vincolo. Il primo motivo `e costituito dal fatto che – come gi`a notato nel paragrafo 2.2.3 – le quattro componenti dell’equazione di Maxwell non sono funzionalmente indipendenti. Definito, Gν ≡ ∂µ F µν − j ν = 2Aν − ∂ ν (∂µ Aµ ) − j ν ,

(5.5)

vale infatti identicamente, ∂ν Gν = 0



∂0 G0 = −∂i Gi .

(5.6)

Ci`o significa che le quattro equazioni di Maxwell, Gµ = 0, sono equivalenti al sistema, Gi (t, ~x) = 0,

∀t

G0 (0, ~x) = 0.

(5.7) (5.8)

Infatti, imposto Gi (t, ~x) = 0 ∀ t la (5.6) assicura che ∂0 G0 (t, ~x) = 0, e quindi la funzione G0 (t, ~x) `e indipendente dal tempo; `e allora sufficiente imporre il suo annullamento all’istante t = 0. La componento 0 dell’equazione di Maxwell si riduce quindi a un vincolo sui dati iniziali, e non va considerata come una vera e propria equazione del moto. Invarianza di gauge e gauge–fixing. Il secondo motivo per cui il conteggio dei gradi di libert`a di cui sopra `e errato `e costituito dal fatto che il potenziale vettore `e definito solo modulo una trasformazione di gauge: i potenziali Aµ e Aµ + ∂ µ Λ corrispondono allo stesso campo elettromagnetico F µν , e sono quindi fisicamente equivalenti. Si rende allora necessario selezionare tra tutti i potenziali vettore associati ad un dato F µν , un unico rappresentante, ovverosia, come si suol dire, attuare un “gauge–fixing” su Aµ . Evidentemente ci sono infiniti modi diversi di fissare la gauge, tutti fisicamente equivalenti. Noi optiamo per la cosiddetta “gauge di Lorentz”, rappresentata dal vincolo, ∂µ Aµ = 0,

(5.9)

per il suo pregio di essere preservata sotto trasformazioni di Lorentz 19 . La consistenza di questa scelta deriva dal fatto che a partire da un potenziale vettore arbitrario `e sempre ~ ·A ~ = 0, e la gauge assiale Gauge–fixing non covarianti usati talvolta sono la gauge di Coulomb ∇ A = 0, oppure, pi` u in generale, nµ Aµ = 0, con nµ vettore costante. 19

0

120

possibile eseguire una trasformazione di gauge, tale che il nuovo potenziale vettore abbia quadridivergenza nulla, ∂µ (Aµ + ∂ µ Λ) = 0. ` infatti sufficiente scegliere Λ tale che, E 2Λ = −∂µ Aµ , equazione che, come visto nel paragrafo precedente, ammette in effetti infinite soluzioni. Con il gauge–fixing (5.9) l’equazione di Maxwell (5.5) si semplifica e diventa, Gµ = 2Aµ − j µ = 0. Useremo questa forma per le componenti spaziali Gi dell’equazione mentre, per quello che segue, per la componente G0 `e pi` u conveniente usare l’espressione originale (5.5), G0 = 2A0 − ∂ 0 (∂0 A0 + ∂i Ai ) − j 0 = −∇2 A0 − ∂i (∂ 0 Ai ) − j 0 = 0.

(5.10)

Si noti che questa equazione non contiene la derivata seconda rispetto al tempo: come anticipato sopra, essa va infatti interpretata come un vincolo, piuttosto che come equazione dinamica. Invarianza di gauge residua. Resta a questo punto la domanda se la gauge di Lorentz `e completa, cio`e, se essa fissa il potenziale vettore univocamente. La risposta `e negativa perch´e, assumendo che valga ∂µ Aµ = 0 e volendo restare nella classe di potenziali che soddisfano questa condizione, possiamo ancora eseguire trasformazioni di gauge Aµ → Aµ + ∂ µ Λ, a patto che, ∂µ (Aµ + ∂ µ Λ) = 0



2Λ = 0.

Sussiste, cio`e, l’invarianza di gauge “residua”, Aµ ≈ Aµ + ∂ µ Λ,

2Λ = 0.

(5.11)

Anche il gauge–fixing dell’invarianza residua pu`o essere eseguito in infiniti modi equivalenti. Noi optiamo per le condizioni, A3 (0, ~x) = 0 = ∂0 A3 (0, ~x), 121

(5.12)

che si possono in effetti imporre eseguendo una trasformazione di gauge residua. Per farlo vedere ricordiamo dal paragrafo precedente che la soluzione dell’equazione 2Λ = 0 `e completamente determinata dalle “condizioni iniziali”, Λ(0, ~x) ≡ Φ1 (~x),

∂0 Λ(0, ~x) ≡ Φ2 (~x).

Per una trasformazione di gauge abbiamo, A03 = A3 + ∂ 3 Λ,

(5.13)

ed `e facile vedere che esistono dei campi Φ1 e Φ2 tali che, A03 (0, ~x) = A3 (0, ~x) + ∂ 3 Λ(0, ~x) = A3 (0, ~x) + ∂ 3 Φ1 (~x) = 0, ∂0 A03 (0, ~x) = ∂0 A3 (0, ~x) + ∂ 3 ∂0 Λ(0, ~x) = ∂0 A3 (0, ~x) + ∂ 3 Φ2 (~x) = 0.

(5.14) (5.15)

Infatti, `e sufficiente scegliere per Φ1 e Φ2 delle primitive rispetto alla variabile x3 , rispettivamente di −A3 (0, ~x) e −∂0 A3 (0, ~x). Per il potenziale trasformato le (5.14) e (5.15) equivalgono allora effettivamente alle (5.12). In conclusione, tenendo conto delle condizioni di gauge–fixing (5.9) e (5.12) ci siamo ricondotti al seguente sistema di equazioni, 2Ai = j i ,

(5.16)

∇2 A0 = −∂i (∂ 0 Ai ) − j 0 ,

per t = 0,

∂µ Aµ = 0,

(5.17) (5.18)

A3 (0, ~x) = 0 = ∂0 A3 (0, ~x).

(5.19)

Facciamo ora vedere che questo sistema ammette in effetti soluzione unica per Aµ (t, ~x), una volta assegnate le condizioni iniziali “fisiche”, A1 (0, ~x),

∂0 A1 (0, ~x),

A2 (0, ~x),

∂0 A2 (0, ~x).

(5.20)

Intanto osserviamo che con queste condizioni iniziali e con le (5.19), le tre equazioni (5.16) determinano Ai (t, ~x) per ogni t. Noti i campi Ai , la (5.17) determina allora univocamente A0 (0, ~x), perch´e nello spazio delle funzioni che svaniscono all’infinito il Laplaciano tridimensionale ammette inverso unico, vedi sezione 6.1. Noti A0 (0, ~x) e i campi Ai (t, ~x), la 122

(5.18) determina infine A0 (t, ~x) per ogni t, Z 0

t

0

A (t, ~x) = A (0, ~x) −

~ · A(t ~ 0 , ~x) dt0 . ∇

0

In conclusione, una volta assegnate le quattro condizioni iniziali fisiche (5.20), l’equazione di Maxwell determina i campi Aµ (t, ~x) in modo univoco. Con la procedura scelta da noi i campi “fisici” sono risultati A1 e A2 , ma `e chiaro che una scelta diversa del gauge–fixing porter`a ad assegnazioni diverse. Quello che rester`a per`o invariato `e il numero di condizioni iniziali – quattro – che si possono imporre arbitrariamente. Resta poi il problema, solo tecnico, di come si deducono i dati (5.20) a partire dai dati iniziali osservabili sperimentalmente, che sono i campi elettrico e magnetico all’istante iniziale. ~ ~x) e B(0, ~ ~x) e imposti i gauge–fixing (5.18) e (5.19), la determinazione Difatti, noti E(0, dei dati iniziali (5.20) `e un semplice esercizio, lasciato al lettore. I due gradi di libert` a del campo elettromagnetico. Dai dati indipendenti (5.20) vediamo infine che il campo elettromagnetico corrisponde a due gradi di libert`a, come anticipato nel paragrafo 2.2.3, e non a quattro. Dalla nostra trattazione si desume in particolare che il meccanismo che elimina da Aµ due gradi di libert`a `e essenzialmente il seguente: un grado di libert`a viene assorbito dall’invarianza di gauge e l’altro dall’invarianza di gauge residua, in concomitanza con il fatto che una delle quattro equazioni di Maxwell in realt`a `e un vincolo. Aggiungiamo, tuttavia, che 1) quali siano le componenti di Aµ che appaiono come fisiche, dipende dalla scelta del gauge–fixing, e che 2) sotto una trasformazione di Lorentz queste componenti non restano invariate. Infatti, mentre la gauge di Lorentz ` im(5.9) `e invariante sotto trasformazioni di Lorentz, le condizioni (5.12) non lo sono. E portante notare che questa circostanza non viola affatto l’invarianza relativistica, perch`e, come abbiamo visto, in qualsiasi sistema di riferimento le condizioni (5.12) possono essere ripristinate eseguendo un’opportuna trasformazione di gauge. Il fatto che i gradi di libert`a fisici del campo elettromagnetico sono due ha varie conseguenze importanti: a livello classico esso implica, come vedremo tra poco, che le onde elettromagnetiche sono caratterizzate da due vettori di polarizzazione indipendenti, mentre a livello quantistico esso comporta che i fotoni esistono in due stati di polarizzazione indipendenti, contrassegnati da “elicit`a” opposte. 123

5.2

L’equazione delle onde

Consideriamo un campo scalare reale con lagrangiana, L=

1 ∂µ ϕ∂ µ ϕ. 2

(5.21)

L’equazione di Eulero–Lagrange associata a questa lagrangiana viene chiamata equazione delle onde, o anche equazione di d’Alembert, ∂µ

∂L ∂L − = ∂µ ∂ µ ϕ = 2ϕ = 0. ∂(∂µ ϕ) ∂ϕ

(5.22)

Essa riveste un ruolo importante in Fisica e in particolar modo in Elettrodinamica, motivo per cui ora analizzeremo in dettaglio la sua soluzione generale. In particolare vedremo che la ricerca delle soluzioni dell’equazione di Maxwell nel vuoto sar`a molto facilitata dalla conoscenza della soluzione generale della (5.22). In analogia con le condizioni asintotiche (5.4) considereremo solo soluzioni che soddisfano, lim ϕ(t, ~x) = 0.

|~ x|→∞

(5.23)

Se assumiamo che eventuali singolarit`a di ϕ(x) siano di tipo distribuzionali, vale a dire se assumiamo che ϕ sia un elemento di S 0 (R4 ), un metodo potente per risolvere l’equazione delle onde `e fornito dalla trasformata di Fourier, che costituisce appunto una biiezione di S 0 in se stesso. Ricordiamo che in notazione simbolica questa trasformata `e definita da, Z Z 1 1 4 −ik·x d xe ϕ(x), ϕ(x) = d4 k eik·x ϕ(k), b (5.24) ϕ(k) b = (2π)2 (2π)2 dove abbiamo introdotto la variabile duale k ≡ k µ e definito k · x = k µ xµ ηµν . Tra le propriet`a della trasformata di Fourier ci serviranno le seguenti, vedi paragrafo 2.3.2. 1) Se il campo ϕ `e reale, come da noi sottinteso, allora la trasformata soddisfa, ϕ b ∗ (k) = ϕ(−k). b

(5.25)

Per vederlo `e sufficiente prendere il complesso coniugato della prima relazione in (5.24), e sfruttare il fatto che ϕ∗ (x) = ϕ(x). 2) Se ϕ(x) `e un campo scalare sotto trasformazioni di Lorentz, e se assegniamo a k µ carattere vettoriale, k 0µ = Λµ ν k ν , 124

allora anche la trasformata ϕ(k) b `e un campo scalare, ϕ b0 (k 0 ) = ϕ(k). b Per la dimostrazione `e sufficiente usare le relazioni k 0 · x0 = k · x, e d4 x0 = d4 x. 3) Per la trasformata delle derivate di ϕ abbiamo, [P\ (∂µ )ϕ](k) = P (ikµ )ϕ(k), b dove P (∂µ ) `e un qualsiasi polinomio nelle derivate parziali ∂µ . Usando la propriet`a 3) `e immediato eseguire la trasformata di Fourier dell’equazione delle onde, e si ottiene, k 2 ϕ(k) b = 0,

(5.26)

dove, k 2 = kµ k µ = (k 0 )2 − |~k|2 . In seguito useremo anche, ω ≡ |~k|, per indicare la “frequenza”. Vediamo che la trasformata di Fourier ha mutato l’equazione differenziale (5.22) in un’equazione algebrica, facilmente risolubile nello spazio delle distribuzioni. Dalla (5.26) si vede in particolare che ϕ(k) b ha come supporto il cono luce, k 0 = ±|~k|, ed `e quindi chiaro che essa non pu`o essere una “funzione” ordinaria. In realt`a le soluzioni di questa equazione cadono in due categorie, che ora analizzeremo separatamente. Soluzioni di tipo I. Analizziamo innanzitutto le soluzioni in una regione del cono luce che non contenga l’origine, cio´e, per ~k 6= 0. Per ~k fissato `e allora conveniente considerare le ϕ(k) b come distribuzioni nella sola variabile k 0 , perch´e in questo modo le soluzioni della ` infatti (5.26) possono essere derivate direttamente dalla soluzione del problema 2.3. E sufficiente eseguire in questo problema le sostituzioni, x → k0,

a → ω,

x2 − a2 → (k 0 )2 − ω 2 = k 2 ,

125

f (x) → f (k),

con f (k) generica funzione complessa di k µ , per ottenere le soluzioni della (5.26), ϕ bI (k) = δ(k 2 )f (k).

(5.27)

Ricordando che ϕ(x) `e reale la (5.25) impone poi, f ∗ (k) = f (−k).

(5.28)

Inoltre, dato che δ(k 2 ) `e Lorentz–invariante e ϕ(k) b `e campo scalare, anche la funzione f (k) `e dunque uno scalare per trasformazioni di Lorentz. Usando le propriet`a della δ di Dirac possiamo allora esplicitare le soluzioni (5.27) come segue, 1 2ω 1 = 2ω 1 = 2ω

ϕ bI (k) =

¡

¢ δ(k 0 − ω) + δ(k 0 + ω) f (k 0 , ~k) ³ ´ 0 0 ~ ~ δ(k − ω)f (ω, k) + δ(k + ω)f (−ω, k) ³ ´ 0 0 ∗ ~ ~ δ(k − ω) ε(k) + δ(k + ω) ε (−k) ,

(5.29)

dove nell’ultimo passaggio abbiamo definito la funzione complessa di tre variabili, ε(~k) ≡ f (ω, ~k), e sfruttato la (5.28). Soluzioni di tipo II. Il problema 2.3 `e ben posto solo se a 6= 0, ovvero ω 6= 0, che esclude dal cono luce l’origine quadridimensionale k µ = 0. Potrebbero dunque esistere ulteriori soluzioni della (5.26), supportate nel punto k µ = 0. Per il teorema sulle distribuzioni supportate in un punto, vedi paragrafo 2.3.2, sappiamo allora che queste soluzioni sarebbero necessariamente combinazioni lineari finite della δ 4 (k) e delle sue derivate, ϕ bII (k) =

N X

C µ1 ···µn ∂µ1 · · · ∂µn δ 4 (k),

(5.30)

n=1

dove i C µ1 ···µn sono arbitrari tensori costanti completamente simmetrici. Antitrasformando questa espressione nello spazio delle configurazioni e tenendo conto che la trasformata della δ 4 vale 1/(2π)4 si ottiene, N 1 X ϕII (x) = (−i)n C µ1 ···µn xµ1 · · · xµn . (2π)4 n=1

126

(5.31)

Inserendo questa espressione nella (5.22) `e facile vedere che l’equazione di d’Alembert `e soddisfatta, se e solo se i tensori simmetrici C sono anche a traccia nulla, Cν νµ3 ···µn = 0.

(5.32)

Ed `e altrettanto immediato vedere che queste condizioni ammettono infinite soluzioni. Per esempio, nel caso n = 2, che corrisponde a un polinomio del secondo ordine, la soluzione generale della (5.32) `e data da, C µν = H µν −

1 µν ρ η H ρ, 4

dove H µν `e un’arbitraria matrice simmetrica costante. Concludiamo quindi che esiste una seconda classe di soluzioni, rappresentate dalla (5.31), che sono polinomi in xµ . Tuttavia, come tali non svaniscono all’infinito spaziale, e quindi non le ammettiamo come soluzioni fisiche. Ritorniamo allora alle soluzioni di tipo I (5.29), antitrasformandole nello spazio delle coordinate secondo la (5.24). Integrando la δ di Dirac in k 0 e eseguendo nell’integrale che coinvolge ε∗ (−~k) il cambiamento di variabili ~k → −~k, si ottiene la soluzione generale dell’equazione delle onde, Z 3 Z ³ ´ 1 dk x) 0 i(k0 x0 −~k·~ 0 ~k) + δ(k 0 + ω) ε∗ (−~k) , ϕ(x) = dk e δ(k − ω) ε( (2π)2 2ω Z 3 ³ ´ d k ik·x ~ 1 e ε(k) + c.c. . (5.33) = (2π)2 2ω Sottolineiamo il fatto che nell’espressione finale (5.33) la componente k 0 nell’esponenziale `e definita da k 0 = +ω, e che k 2 = 0. Vediamo quindi che la soluzione generale `e identificata da due funzioni reali di tre variabili, ε(~k) = ε1 (~k) + i ε2 (~k), in accordo con il fatto che un campo scalare che soddisfa l’equazione delle onde corrisponde a un grado di libert`a. Difatti non `e difficile determinare ε1 (~k) e ε2 (~k) in termini dei dati iniziali ϕ(~x, 0) e ∂0 ϕ(~x, 0), e viceversa, vedi il prossimo paragrafo. Onde elementari. Vediamo che la soluzione generale (5.33) dell’equazione delle onde pu`o essere riguardata come una sovrapposizione di infinite “onde elementari” di vettore 127

d’onda ~k fissato, ϕel (x) = ε(~k) eik·x + c.c.,

k 0 = ω.

(5.34)

Esaminiamo ora le principali propriet`a di queste onde. a) Le ϕel sono onde piane, i cui piani delle fasi sono ortogonali a ~k. Per t fissato su un piano delle fasi la funzione ϕel (x) assume lo stesso valore. b) Le ϕel sono onde che si propagano con la velocit` a della luce nella direzione di ~k. Se scegliamo ~x//~k abbiamo infatti: kµ xµ = ω t − ~k · ~x = ω(t − |~x|). c) Le ϕel sono onde monocromatiche di frequenza ω, periodo T = 2π/ω e lunghezza d’onda λ = 2πc/ω, fissati. d) Le ϕel sono onde scalari nel senso che il “tensore di polarizzazione” ε, che ne identifica l’intensit`a, `e uno scalare sotto trasformazioni di Lorentz. e) Contenuto in energia. Dalla lagrangiana (5.21) `e immediato ottenere il tensore energia– impulso del campo, vedi problema 3.4, T µν = ∂ µ ϕ∂ ν ϕ −

1 µν α η ∂ ϕ∂α ϕ. 2

(5.35)

Per valutarlo determiniamo le derivate dell’onda elementare, ∂µ ϕel (x) = i kµ ε(~k) eik·x + c.c. e introduciamo il “vettore” di tipo nullo, nµ ≡

kµ , ω

n0 = 1,

~n =

~k , ω

n2 = nµ nµ = 0,

(5.36)

dove ~n `e il versore tridimensionale che indica la direzione di propagazione dell’onda. Allora possiamo scrivere in modo compatto, ∂µ ϕel = nµ ϕ˙ el , e ne segue che ∂ α ϕel ∂α ϕel = 0. Usando queste relazioni nella (5.35) e inserendo la (5.34) si ottiene, ¡ ¢ T µν = nµ nν ϕ˙ 2el = nµ nν ω 2 2|ε|2 − ε2 e2ik·x − ε∗2 e−i2k·x .

(5.37)

Mediando il tensore energia–impulso su scale temporali grandi rispetto al periodo e su scale spaziali grandi rispetto alla lunghezza d’onda, gli esponenziali si mediano a zero e 128

si ottiene, hT µν i = 2 k µ k ν |ε|2 . Vediamo che la densit`a di energia dell’onda vale in media hT 00 i = 2 ω 2 |ε|2 , mentre il flusso di energia vale hT 0i i = 2 ω 2 |ε|2 ni ed `e diretto lungo la direzione di propagazione dell’onda. Considerando infine un volume V piccolo, ma grande rispetto alla lunghezza d’onda, possiamo determinare il quadrimomento P µ ivi contenuto. Otteniamo, P 0 = hT 00 i V = 2 ω 2 |ε|2 V,

P i = hT 0i i V = 2 ω 2 |ε|2 V ni .

La massa della “particella” corrispondente a questo volume risulta allora essere uguale a zero in quanto, ¡ ¢2 ¡ ¢ M 2 = P µ Pµ = 2 ω 2 |ε|2 V 1 − |~n|2 = 0. Questo risultato `e in accordo con il fatto che in teoria quantistica di campo la particella associata a un campo scalare soddisfacente l’equazione delle onde (5.22), `e in effetti una particella (neutra e di spin zero) priva di massa. 5.2.1

Il problema alle condizioni iniziali

Affrontiamo infine il problema alle condizioni iniziali. Vogliamo, cio`e, trovare la forma esplicita della soluzione dell’equazione delle onde, fissati i dati iniziali, ϕ(0, ~x) ≡ f (~x), ∂0 ϕ(0, ~x) ≡ g(~x). Si tratta dunque di determinare la funzione complessa ε(~k) della (5.33), in termini delle due funzioni reali f e g. A questo scopo `e conveniente sviluppare queste ultime in trasformata di Fourier, Z 1 ~ f (~x) = d3 k e−ik·~x fb(~k), 3/2 (2π)

1 g(~x) = (2π)3/2

Z ~ d3 k e−ik·~x gb(~k),

e valutare la (5.33) e la sua derivata temporale a t = 0, Z 3 ³ ´ 1 d k −i~k·~x ~ e ε(k) + c.c. , f (~x) = ϕ(0, ~x) = (2π)2 2ω Z 3 ³ ´ dk 1 −i~k·~ x ~ i ω e ε( k) + c.c. . g(~x) = ∂0 ϕ(0, ~x) = (2π)2 2ω 129

(5.38)

(5.39)

Confrontando con le (5.38) e antitrasformando si trova, 1 fb(~k) = √ 2π 1 gb(~k) = √ 2π e quindi, ε(~k) =

´ 1 ³ ~ ∗ ~ ε(k) + ε (−k) , 2ω ´ i ³ ~ ∗ ~ ε(k) − ε (−k) , 2

´ b ~ ~ (2π) ω f (k) − i gb(k) .

p

³

Sostituendo questa espressione nella (5.33) si ottiene, 1 ϕ(x) = (2π)3/2

Z

´ i d3 k h ik·x ³ b ~ ~ ω f (k) − ib g (k) + c.c. . e 2ω

(5.40)

Infine possiamo invertire le trasformate (5.38) per riesprimere fb e gb in termini di f e g. Sostituendo le espressioni che ne risultano nella (5.40) si trova infine la formula cercata, vedi problema 5.1, Z d3 y [D(t, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂0 D(t, ~x − ~y ) ϕ(0, ~y )] ,

ϕ(t, ~x) =

(5.41)

dove il “kernel antisimmetrico” D `e dato da, 1 D(t, ~x) = (2π)3

Z

¢ d3 k ¡ ik·x 1 e − e−ik·x = 2ωi (2π)3

Z d3 k

sen(ωt) i~k·~x e . ω

(5.42)

La trasformata di Fourier tridimensionale che compare in questa espressione `e da intendersi nel senso delle distribuzioni. Eseguendola esplicitamente si trova, vedi problema 5.1, D(t, ~x) =

1 1 (δ(t − r) − δ(t + r)) = ε(t) δ(x2 ), 4πr 2π

(5.43)

dove ε(·) indica la funzione “segno” e r = |~x|. Dalle espressioni scritte sopra si deduce facilmente che questo kernel gode delle seguenti propriet`a, 2D = 0,

(5.44)

D(0, ~x) = 0,

(5.45)

∂0 D(0, ~x) = δ 3 (~x).

(5.46)

Usando queste propriet`a `e poi immediato verificare esplicitamente che la (5.41) soddisfa l’equazione delle onde (5.22), con le corrette condizioni iniziali. Per quanto riguarda 130

ϕ(0, ~x) questo discende direttamente dalle (5.45), (5.46), mentre per quanto riguarda ∂0 ϕ(0, ~x), derivando la (5.41) rispetto al tempo e ponendo t = 0 si ottiene, Z £ ¤ ∂0 ϕ(0, ~x) = d3 y ∂0 D(0, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂02 D(0, ~x − ~y ) ϕ(0, ~y ) . Il primo integrale si riduce a ∂0 ϕ(0, ~x) grazie alla (5.46), mentre il secondo si annulla perch´e la (5.44) valutata in t = 0 d`a, ∂02 D(0, ~x) = ∇2 D(0, ~x) = 0, grazie alla (5.45). Torneremo sul significato fisico del kernel D, e le conseguenti propriet`a della soluzione (5.41), nella prossima sezione.

5.3

Soluzioni dell’equazione di Maxwell nel vuoto

In questa sezione determineremo la soluzione generale dell’equazione di Maxwell in assenza di sorgenti, ∂µ F µν = 0,

F µν ≡ ∂ µ Aν − ∂ ν Aµ ,

Aµ ≈ Aµ + ∂ µ Λ.

(5.47)

Un campo elettromagnetico che soddisfa questa equazione viene chiamato “campo libero”, oppure “campo di radiazione”. Stiamo quindi cercando la forma di un generico campo di radiazione. Siccome il sistema di equazioni in questione `e lineare nei campi, la tecnica di soluzione pi` u appropriata `e ancora quella della trasformata di Fourier. Ricordiamo infatti che, in base all’analisi svolta nella sezione 2.3, consideriamo sia F µν che Aµ come distribuzioni temperate. Per affrontare la soluzione del sistema (5.47) dobbiamo innanzitutto decidere il tipo di gauge–fixing che vogliamo adottare. Come esemplificato nel paragrafo 5.1.3, ci conviene scegliere la gauge di Lorentz, ∂µ Aµ = 0, per via della sua covarianza a vista, mentre ci riserviamo di fissare la gauge residua in un secondo momento. Secondo l’analisi svolta nel paragrafo 5.1.3, particolarizzata al caso j µ = 0, dobbiamo allora risolvere il seguente sistema, 2Aµ = 0,

(5.48) 131

∂µ Aµ = 0,

(5.49)

Aµ ≈ Aµ + ∂ µ Λ,

2Λ = 0.

(5.50)

La trasformata di Fourier del potenziale vettore `e definita in modo standard, Z 1 µ b A (k) = d4 x e−ik·x Aµ (x), (2π)2 b bµ (k) e e analogamente quella Λ(k) del campo Λ(x). L’unica differenza sostanziale tra A la trasformata di Fourier del campo scalare ϕ(k), b `e che sotto trasformazioni di Lorentz bµ (k) trasforma come un campo vettoriale, vedi problema 5.2, A b0µ (k 0 ) = Λµ ν A bν (k). A Il sistema di equazioni differenziali (5.48)–(5.50) muta allora nuovamente in un sistema algebrico, bµ (k) = 0, k2A

(5.51)

bµ (k) = 0, kµ A

(5.52)

bµ (k) ≈ A bµ (k) + i k µ Λ(k), b A

b k 2 Λ(k) = 0.

(5.53)

La soluzione generale della (5.51) si ottiene come nel caso delle onde scalari, vedi (5.27) e (5.29), con l’unica differenza che la funzione “peso” ora `e un quadrivettore f µ (k), ³ ´ bµ (k) = δ(k 2 )f µ (k) = 1 δ(k 0 − ω) εµ (~k) + δ(k 0 + ω) ε∗µ (−~k) , A 2ω

(5.54)

dove abbiamo posto, εµ (~k) ≡ f µ (ω, ~k),

ω = |~k|.

Cos`ı come nel caso delle onde scalari ε(~k) era un quadriscalare cos`ı ora εµ (~k) `e un quadrivettore, che viene chiamato “vettore di polarizzazione”. A questo punto la (5.52) impone su questo vettore la condizione di “trasversalit`a”, kµ εµ = 0,

con k 0 = ω.

b si ottiene, Analogamente, risolvendo l’equazione (5.53) per Λ ´ 1 ³ 0 0 ∗ ~ ~ b δ(k − ω)λ(k) − δ(k + ω)λ (−k) . Λ(k) = 2ωi 132

(5.55)

La (5.53) asserisce allora che i vettori di polarizzazione, oltre a essere soggetti al vincolo (5.55), sono definiti modulo la trasformazione di gauge residua, εµ (~k) ≈ εµ (~k) + k µ λ(~k).

(5.56)

Si noti che questa trasformazione preserva la gauge di Lorentz (5.55), in quanto grazie a k 2 = 0 si ha, kµ (εµ + k µ λ) = 0. Si evince cos`ı che delle quattro componenti del vettore di polarizzazione solo due hanno rilevanza fisica: una componente viene eliminata dalla condizione (5.55), e un’altra dalla gauge residua (5.56). Scegliendo per esempio nella (5.56), λ=−

ε0 , ω

possiamo annullare ε0 , e la (5.55) si riduce allora a, ~k · ~ε = 0, che impone l’annullamento della componente di ~ε lungo la direzione di ~k. Riconfermiamo cos`ı il fatto che il campo elettromagnetico propaga due gradi di libert`a fisici. Antitrasformando la (5.54) si trova infine il potenziale vettore nello spazio delle coordinate, 1 A (x) = (2π)2

Z

´ d3 k ³ ik·x µ ~ e ε (k) + c.c. , 2ω

µ

(5.57)

e per il campo elettromagnetico si ottiene allora, F

µν

1 =∂ A −∂ A = (2π)2 µ

ν

ν

Z

µ

¢ d3 k ¡ ik·x µ ν i e [k ε − k ν εµ ] + c.c. . 2ω

(5.58)

Introducendo per la variabile di integrazione ~k coordinate polari, ~k ↔ (ω, ϕ, ϑ), d3 k = ω 2 dω dΩ, si pu`o anche scrivere, i F (t, ~x) = 2(2π)2

Z

Z



µν

dω e

iωt

ω

³ dΩ e

−i~k·~ x

´ [k ε − k ε ] + c.c. µ ν

ν µ

(5.59)

0

Riconosciamo in particolare che questa espressione pu`o essere posta nella forma, 1 F (t, ~x) = √ 2π µν

Z



dω eiωt F µν (ω, ~x),

−∞

133

F ∗µν (ω, ~x) = F µν (−ω, ~x).

(5.60)

Vediamo cos`ı che la trasformata di Fourier di F µν nella sola variabile t, ovvero la quantit`a F µν (ω, ~x), rappresenta il peso relativo con cui ogni frequenza ω compare nella sovrapposizione di onde piane, di cui `e composto il campo elettromagnetico nel vuoto. Questo risultato verr`a utilizzato quando analizzeremo il contenuto energetico della radiazione “frequenza per frequenza”, cio`e, quando eseguiremo la sua analisi spettrale, vedi capitolo 10. 5.3.1

Propriet` a delle onde elettromagnetiche elementari

Dalla soluzione generale (5.57) dell’equazione di Maxwell nel vuoto vediamo che il generico potenziale vettore risulta sovrapposizione di onde elementari, con vettore d’onda ~k fissato, Aµel (x) = εµ eik·x + c.c.,

k 0 = ω,

kµ εµ = 0,

εµ ≈ εµ + k µ λ.

(5.61)

Dalla sezione 5.2 sappiamo gi`a che queste onde sono piane, moncocromatiche, e che viaggiano con la velocit` a della luce. Ma queste onde non sono scalari, perch´e il tensore di polarizzazione εµ `e ora un vettore. Le relazioni delle onde. Per derivare le caratteristiche addizionali derivanti dalla naturale tensoriale di queste onde, vedi le propriet`a 1) – 4) elencate sotto, `e conveniente trovare un’opportuna forma per le derivate di Aµel . Per non appesantire la notazione d’ora in poi indicheremo questo potenziale vettore semplicemente con Aµ . Derivando la (5.61) risulta allora, ∂µ Aν = ikµ εν eik·x + c.c.

(5.62)

Seguendo la notazione della sezione 5.2, vedi (5.36), nµ ≡

kµ , ω

n0 = 1,

~n =

~k , ω

n2 = nµ nµ = 0,

dalle (5.61) e (5.62) seguono cos´ı facilmente le “relazioni delle onde”, ∂µ Aν = nµ A˙ ν ,

nµ A˙ µ = 0,

nµ nµ = 0.

(5.63)

Queste relazioni investono un ruolo importante perch´e, come vedremo pi` u avanti, non valgono solo per le onde piane, ma anche per un generico campo elettromagnetico nella cosiddetta “zona delle onde”, ovvero a grandi distanze dalle sorgenti. La dimostrazione 134

delle propriet`a 1), 2) e 4) si baser`a infatti su queste relazioni, e non sulle formule esplicite (5.61): queste propriet`a varranno quindi anche per un generico campo nella zona delle onde – circostanza che sfrutteremo pesantemente quando studieremo il fenomeno dell’irraggiamento da parte di cariche accelerate, vedi capitolo 7. 1) Onde trasverse. Le onde elettromagnetiche sono polarizzate trasversalmente, vale a dire, ~ = 0 = ~n · B. ~ ~n · E

(5.64)

I campi elettrico e campo magnetico sono quindi sempre ortogonali alla direzione di propagazione. Per far vedere questo determiniamo il campo elettromagnetico usando le (5.63), F µν = ∂ µ Aν − ∂ ν Aµ = nµ A˙ ν − nν A˙ µ .

(5.65)

E i = F i0 = ni A˙ 0 − A˙ i = ni (nk A˙ k ) − A˙ i 1 B i = − εijk F jk = −εijk nj A˙ k , 2

(5.66)

Quindi,

(5.67)

dove abbiamo usato che, nµ A˙ µ = 0



A˙ 0 = nk A˙ k .

(5.68)

Le condizioni di trasversalit`a (5.64) seguono allora immediatamente dalle (5.66), (5.67). ~ e B. ~ Le onde elettromagnetiche sono tali che, 2) Relazione tra E ~ = |B|, ~ |E|

~ ·B ~ = 0. E

(5.69)

Per fare vedere questo `e sufficiente ricordare la forma degli invarianti quadratici, ~ · B, ~ εαβγδ Fαβ Fγδ = −8 E

F αβ Fαβ = 2 (B 2 − E 2 ).

Inserendo la (5.65) si trova che entrambi gli invarianti sono nulli – il primo per l’antisimmetria del tensore di Levi–Civita, e il secondo per le (5.63) – e seguono le (5.69). Possiamo riassumere le propriet`a 1) e 2) nelle formule, ~ = ~n × E, ~ B

135

~ = 0. ~n · E

(5.70)

3) Due stati di polarizzazione fisici. Per ogni ~k fissato esistono due stati di polarizzazione fisici indipendenti. Abbiamo gi`a accennato a questo fatto nel paragrafo precedente, qu`ı lo illustriamo da un altro punto di vista. Per concretezza scegliamo come asse z la direzione di propagazione dell’onda, sicch´e, k µ = (ω, 0, 0, ω). La condizione kµ εµ = 0 pone allora εµ = (ε0 , ε1 , ε2 , ε0 ). Questo vettore di polarizzazione pu`o essere considerato come sovrapposizione dello stato “longitudinale” non fisico, εµl = (ε0 , 0, 0, ε0 ), e dei due stati di polarizzazione “trasversi” fisici, εµt = (0, ε1 , ε2 , 0). Questa terminologia `e giustificata dal fatto che lo stato longitudinale pu`o essere eliminato con una trasformazione di gauge residua, εµ → ε0µ = εµ + λ k µ = (ε0 + λω, ε1 , ε2 , ε0 + λω), scegliendo λ = −ε0 /ω, mentre gli stati trasversi sono gauge invarianti e quindi osservabili. Vedremo che in pratica non sar`a quasi mai necessario usare l’invarianza di gauge residua per eliminare lo stato longitudinale dal potenziale vettore – operazione che violerebbe l’invarianza di Lorentz manifesta. Al contrario, la presenza formale dello stato longitudinale pu`o essere usata in molti casi per controllare la correttezza dei calcoli che si stanno svolgendo: infatti, tutti le quantit`a osservabili non devono risentire della presenza dello stato longitudinale. Dal punto di vista matematico questa richiesta si traduce nel fatto che le grandezze osservabili devono essere invarianti sotto trasformazioni di gauge residue. A titolo di esempio consideriamo i campi elettrico e magnetico dati in (5.66), (5.67), che certamente costitituiscono delle grandezze osservabili. Dalle (5.61) vediamo che la trasformazione di gauge residua per l’onda elementare assume la forma, Aµ → Aµ + nµ ϕ,

136

(5.71)

` allora immediato verificare dove ϕ `e un’arbitraria onda piana scalare di vettore d’onda ~k. E che sotto queste trasformazioni le espressioni (5.66), (5.67) sono invarianti, E i → E i + ni (nk nk ϕ) ˙ − ni ϕ˙ = E i B i → B i − εijk nj nk ϕ˙ = B i . La presenza di due soli gradi di libert`a fisici nelle onde piane elettromagnetiche pu`o essere ~ `e desunta anche direttamente dalle relazioni (5.70): queste implicano appunto che B ~ e che E ~ `e vincolato dall’equazione ~n · E ~ = 0. completamente determinato in termini di E, Fissato ~k le uniche osservabili fisiche indipendenti dell’onda sono quindi le due componenti ~ ortogonali ad ~n. di E 4) Contenuto in energia. Il contenuto in energia e quantit`a di moto di un generico campo elettromagnetico `e espresso dal tensore energia–impulso (2.69), µν Tem = F µ α F αν +

1 µν αβ η F Fαβ . 4

Valutiamolo per le onde elementari usando le (5.65). Sappiamo gi`a che l’invariante F αβ Fαβ si annulla, e resta da valutare, µν Tem = (nµ A˙ α − nα A˙ µ )(nα A˙ ν − nν A˙ α ) = −nµ nν (A˙ α A˙ α ),

(5.72)

da confrontare con la (5.37). Possiamo riscrivere questa formula in vari modi. Eliminando A˙ 0 secondo la (5.68), otteniamo un’espressione che coinvolge solo il potenziale vettore spaziale, µν Tem = nµ nν (A˙ i A˙ j ) Λij ,

Λij ≡ δ ij − ni nj .

(5.73)

Da questa espressione si vede in particolare che il tensore energia–impulso – certamente una grandezza osservabile – `e invariante sotto le trasformazioni di gauge residue (5.71), che equivalgono alla sostituzione, Ai → Ai + ni ϕ. Per vederlo `e sufficiente notare che vale identicamente, Λij nj = 0. 137

(5.74)

In effetti la matrice 3 × 3 simmetrica Λij `e un proiettore di rango due, che elimina da µν Tem la componente longitudinale di Ai – quella parallela a ni – la quale non pu`o essere

trasportatrice di quadrimomento, in quanto non fisica. Quanto detto diventa molto trasparente se scegliamo come asse z la direzione di propagazione dell’onda, ni = (0, 0, 1). In questo caso la (5.73) si riduce a, µ ³ ´2 ¶ h i µ ν i i i i µν = nµ nν (A˙ 1 )2 + (A˙ 2 )2 , T = n n A˙ A˙ − n A˙ em

(5.75)

mentre la (5.74) equivale a, A1 → A1 ,

A2 → A2 ,

A3 → A3 + ϕ.

L’invarianza del tensore energia–impulso sotto trasformazioni di gauge residue si riduce allora semplicemente al fatto che esso non dipende dalla componente longitudinale A3 . Confrontando la (5.75) con la (5.37) riscontriamo di nuovo il fatto che alle onde elettromagnetiche restano associati due gradi di libert`a fisici – trasportatori di quadrimomento – uno rappresentato da A1 e l’altro da A2 . Secondo l’analisi svolta dopo la formula (5.37) ci aspettiamo inoltre che a livello quantistico a ciascuno dei due stati trasversi sia associata una particella priva di massa, ovvero un fotone “trasverso”. Nel prossimo paragrafo vedremo che quello che distingue questi due stati trasversi tra di loro `e l’elicit` a. Infine, usando la (5.66) `e facile vedere che possiamo riscrivere la (5.73) anche come, µν ~ 2= Tem = nµ nν |E|

´ 1 µ ν³ ~ 2 ~ 2 , n n |E| + |B| 2

espressione che `e in accordo con il fatto che per le onde piane il vettore di Poynting assume la forma, vedi (5.70), ~=E ~ ×B ~ =E ~ × (~n × E) ~ = |E| ~ 2 ~n. S

(5.76)

00 0i = 12 (E 2 + B 2 ), e Tem = S i . In particolare il Ritroviamo quindi le formule generali Tem

flusso di energia in un’onda piana `e diretto lungo la direzione di propagazione dell’onda, come c’era da aspettarsi. Concludiamo questo paragrafo con il caveat che le propriet`a 1)–4) valgono per le onde elettromagnetiche elementari (5.61), e non per un generico campo di radiazione (5.58), sovrapposizione generica delle prime. Ma abbiamo anticipato che il potenziale vettore 138

lontano dalle sorgenti – nella zona (asintotica) delle onde – pur non essendo un’onda piana elementare soddisfer` a ugualmente le relazioni delle onde (5.63). Come gi`a osservato le propriet`a 1), 2) e 4) saranno quindi valide anche per un generico campo elettromagnetico nella zona delle onde. Ci riferiamo in particolare alle formule (5.66), (5.70) e (5.73), che danno il campo elettrico, il campo magnetico e il tensore energia–impulso in termini del solo potenziale vettore spaziale, ~ = −A ~˙ + (~n · A ~˙ ) ~n = ~n × (~n × A ~˙ ), E

(5.77)

~ = ~n × E, ~ B

(5.78)

~ = 0, ~n · E

µν ~ 2, Tem = nµ nν (A˙ i A˙ j ) Λij = nµ nν |E|

Λij ≡ δ ij − ni nj .

(5.79)

Insistiamo su questo punto perch´e, come vedremo, l’analisi energetica di quasi tutti i fenomeni di radiazione non richiede la conoscenza del potenziale vettore esatto, ma soltanto la conoscenza della sua forma asintotica nella zona delle onde. Per quest’ultima potremo allora usare le formule molto semplici scritte sopra, e l’analisi energetica risulter`a cos`ı notevolmente semplificata. 5.3.2

Onde piane ed elicit` a

In questo paragrafo analizzeremo una propriet`a caratteristica delle onde piane, che viene chiamata elicit` a. Questo concetto riveste un ruolo significativo per la sua connessione con un’altra grandezza fisica, che gioca invece un ruolo fondamentale nella descrizione quantistica di un’onda, ovvero lo spin

20

. Pi` u precisamente, si pu`o far vedere che l’elicit`a

di un’onda piana corrisponde esattamente allo spin delle particelle che la rappresentano a livello quantistico. Per chiarire meglio il significato di questo concetto metteremo a confronto onde scalari, onde elettromagnetiche e onde gravitazionali. Riportiamo dunque la forme delle onde piane rispettivamente nei tre casi, ϕ(x) = ε(~k) eik·x + c.c.,

(5.80)

Aµ (x) = εµ (~k) eik·x + c.c.,

kµ εµ = 0,

hµν (x) = εµν (~k) eik·x + c.c.,

kµ εµν =

20

εµ ≈ εµ + λ k µ , 1 ν µ k ε µ, 2

(5.81)

εµν ≈ εµν + λµ k ν + λν k µ . (5.82)

Il termine “elicit`a” viene talvolta usato anche a livello quantistico. In quel caso si intende la proiezione dello spin di una particella priva di massa lungo la sua direzione di propagazione.

139

Onde gravitazionali. Per le onde gravitazionali abbiamo riportato le previsioni fatte dalla Relativit`a Generale. In uno spazio–tempo curvo la forma dell’intervallo si generalizza a, ds2 = dxµ dxν ηµν



ds2 = dxµ dxν gµν (x),

dove il tensore simmetrico gµν (x) rappresenta la “metrica” del continuo spazio–temporale. Se la si scrive come, gµν (x) = ηµν + hµν (x), allora il campo gravitazionale `e rappresentato dal tensore doppio simmetrico hµν . Questo campo descrive dunque lo scostamento della metrica di uno spazio–tempo curvo dalla metrica “piatta” ηµν . Si pu`o poi vedere che nell’approssimazione di campi gravitazionali deboli, ovvero per, |hµν | ¿ 1, le equazioni di Einstein ammettono come soluzioni le onde piane date nella (5.82). In questo caso il tensore di polarizzazione εµν `e simmetrico, ed `e soggetto alle condizioni di gauge–fixing e di invarianza di gauge residua, riportate in formula. In questo caso si hanno quattro parametri di gauge, λµ , ed `e immediatamente verificare che le trasformazioni di gauge residua preservano la condizione di gauge–fixing. Grazie a k 2 = 0, vale infatti, kµ (εµν + λµ k ν + λν k µ ) =

1 ν µ k (ε µ + λµ kµ + λµ kµ ), 2

∀ λµ .

Anche le onde gravitazionali viaggiano con la velocit`a della luce. Per determinare il numero di gradi di libert`a associati a queste onde osserviamo innanzitutto che il tensore εµν , essendo simmetrico, ha dieci componenti indipendenti. Abbiamo quattro condizioni di gauge–fixing, e quattro trasformazioni di gauge residua, rappresentate dal vettore λµ . Le onde gravitazionali sono quindi caratterizzate da 10 − 4 − 4 = 2 gradi di libert`a – esattamente come le onde elettromagnetiche. Dal punto di vista cinematico l’unica cosa che le distingue dalle onde elettromagnetiche – in ultima analisi – `e l’elicit`a. Elicit`a. Il concetto di elicit`a `e legato alle propriet`a di trasformazione dei tensori di polarizzazione ε(~k), εµ (~k), εµν (~k), sotto una certa classe di rotazioni tridimensionali. Ricordiamo che sotto una generica trasformazione di Lorentz Λµ ν questi tensori sono soggetti 140

a leggi di trasformazione ben definite, ε0 (~k 0 ) = ε(~k),

ε0µ (~k 0 ) = Λµ ν εν (~k),

ε0µν (~k 0 ) = Λµ α Λν β εαβ (~k),

(5.83)

dove, k 0µ = Λµ ν k ν . Ricordiamo che k 0 = ω = |~k|, in quanto k 2 = 0. Consideriamo ora un generico vettore d’onda ~k, che teniamo fisso in tutta l’analisi che segue. Una generica onda piana `e allora completamente caratterizzata dal suo tensore di polarizzazione, soggetto alla rispettiva condizione di gauge–fixing. Chiamiamo Vi (i = 1, 2, 3) lo spazio vettoriale lineare complesso dei tensori di polarizzazione in ciascuno dei tre casi, vincolati dalle rispettive condizioni di gauge–fixing. Le dimensioni di di questi spazi sono allora, d1 = 1,

d2 = 4 − 1 = 3,

d3 = 10 − 4 = 6.

Definiamo ora il sottogruppo G del gruppo di Lorentz, costituito dalle rotazioni spaziali di un generico angolo ϑ attorno alla direzione di ~k. G costituisce un sottogruppo di Lie abeliano ad un solo parametro in quanto, se indichiamo il suo generico elemento con Λµ ν (ϑ), abbiamo, Λµ ν (ϑ1 )Λν ρ (ϑ2 ) = Λµ ρ (ϑ1 + ϑ2 ). Per trasformazioni di questo tipo ~k resta ovviamente invariante, k 0µ = Λµ ν (ϑ) k ν = k µ . Nelle (5.83) trasformano allora solo i tensori di polarizzazione, ma non i loro argomenti. Di conseguenza le polarizzazioni trasformate continuano a soddisfare le condizioni di gauge– fixing indicate in (5.80)–(5.82), con lo stesso k µ . Concludiamo quindi che ciascuno spazio vettoriale Vi `e sede di una rappresentazione di G – in generale riducibile. Ma secondo un noto teorema della teoria dei gruppi, le rappresentazioni complesse irriducibili del gruppo G sono tutte unidimensionali, con sede i numeri complessi E ∈ C, e in ogni rappresentazione irriducibile il gruppo agisce secondo, E → E 0 = ei hϑ E, 141

(5.84)

per un qualche numero reale h. Deve allora essere possibile decomporre lo spazio vettoriale Vi delle polarizzazioni in di sottospazi unidimensionali, sedi di rappresentazioni irriducibili di G del tipo (5.84). Ogni sottospazio rappresenta cos`ı un grado di libert`a – fisico o non fisico – e la polarizzazione E associata trasforma per una rotazione attorno a ~k secondo la (5.84). A ciascuno dei gradi di libert`a dell’onda piana, classificati in questo modo, resta quindi associato in modo univoco un numero reale h – che viene chiamato elicit` a. Il fatto importante `e che si pu`o dimostrare che a un grado di libert` a con elicit`a h, a livello quantistico corrisponde una particella di spin h. Per eseguire esplicitamente la decomposizione in rappresentazioni irriducibili in ciascuno dei tre casi, `e conveniente scegliere come asse z la direzione di ~k, sicch´e k µ = (ω, 0, 0, ω). La matrice Λµ ν (ϑ) `e allora la matrice di rotazione di un angolo ϑ attorno all’asse z,   1 0 0 0  0 cos ϑ sen ϑ 0   Λµ ν (ϑ) =  (5.85)  0 −sen ϑ cos ϑ 0  . 0 0 0 1 Per ridurre le rappresentazioni di G date in (5.83) in rappresentazioni unidimensionali, occorre trovare opportune combinazioni lineari E delle componenti dei tensori di polarizzazione, tali che per esse le trasformazioni (5.83) assumano la forma diagonale (5.84). Eseguiamo ora questa riduzione in ciascuno dei tre casi. Onde scalari. Per le onde scalari abbiamo d1 = 1. Per qualsiasi trasformazione di Lorentz, e quindi anche per la trasformazione Λµ ν (ϑ), abbiamo ε0 = ε. La rappresentazione `e gi`a unidimensionale e vale la (5.84) con E = ε, e h = 0. Le onde scalari corrispondono quindi a un solo grado di libert`a fisico, di elicit`a zero. Onde elettromagnetiche. Per queste onde abbiamo d2 = 3. Per via del gauge–fixing kµ εµ = 0 il vettore εµ ha infatti tre componenti indipendenti: le due polarizzazioni fisiche trasverse ε1 e ε2 , e la componente non fisica longitudinale ε3 = ε0 . Esplicitando la trasformazione ε0µ = Λµ ν (ϑ) εν , si ottiene, ε00 = ε0 , ε01 = cos ϑ ε1 + sen ϑ ε2 , ε02 = −sen ϑ ε1 + cos ϑ ε2 , 142

ε03 = ε3 . Riconosciamo quindi che la componente longitudinale porta elicit`a zero. Le combinazioni lineari delle componenti trasverse che diagonalizzano la trasformazione, sono invece date da, E± = ε1 ∓ iε2 . Infatti, E−0 = ε01 + iε02 = cos ϑ ε1 + sen ϑ ε2 + i (−sen ϑ ε1 + cos ϑ ε2 ) = e−iϑ E− , e analogamente per E+ . Risulta quindi, E±0 = e±i ϑ E± . Concludiamo che un’onda elettromagnetica contiene uno stato di polarizzazione non fisico, di elicit`a zero, e due stati di polarizzazione fisici, di elicit`a h = ±1. Si pu`o poi vedere, vedi problema 5.5, che questi due stati corrispondono a onde elettromagnetiche polarizzate circolarmente – rispettivamente in senso orario e antiorario. Onde gravitazionali. Nel caso dell’onda gravitazionale il tensore di polarizzazione εµν , per via del gauge–fixing, kµ εµν =

1 ν µ k ε µ, 2

(5.86)

ha d3 = 6 componenti indipendenti, di cui due fisici e quattro non fisici. Per brevit`a in questo caso ci occupiamo solo delle due componenti fisiche. Per individuarle facciamo notare che le componenti 0µ di εµν possono essere eliminate con una trasformazione di gauge residua, ε00µ = ε0µ + λ0 k µ + λµ ω = 0. ` sufficiente scegliere, E 1 00 ε , λ =− 2ω 0

1 λ = ω i

µ

¶ 1 i 00 0i nε −ε . 2

Una volta posto ε0µ = 0, le condizioni (5.86) per ν = 0 implicano, εµ µ = −εii = 0, 143

(5.87)

e per ν = i esse si riducono allora a, kµ εµi = −k j εji = 0. Dato che abbiamo scelto ~k = (0, 0, ω), si ottiene quindi che anche ε3µ = 0. La (5.87) d`a allora, ε11 + ε22 = 0. Concludiamo cos`ı che possiamo annullare tutte le componenti di εµν , tranne, ε12 = ε21 ,

e

ε11 = −ε22 .

ε12 e ε11 rappresentano allora le due polarizzazioni fisiche indipendenti. Si noti in particolare che esse sono invarianti sotto le trasformazioni residue di (5.82), perch´e k µ non ha componenti lungo le direzioni x e y. Per una rotazione attorno all’asse z queste componenti si trasformano secondo, ε0µν = Λµ α (ϑ)Λν β (ϑ) εαβ , ed esplicitando si trova, ε011 = Λ1 1 (ϑ)Λ1 1 (ϑ)ε11 + 2Λ1 2 (ϑ)Λ1 1 (ϑ)ε12 + Λ1 2 (ϑ)Λ1 2 (ϑ)ε22 = cos2 ϑ ε11 + 2 sen ϑ cos ϑ ε12 − sen2 ϑ ε11 = cos 2ϑ ε11 + sen 2ϑ ε12 . E analogamente, ε012 = −sen 2ϑ ε11 + cos 2ϑ ε12 . Come per le onde elettromagnetiche queste trasformazioni si diagonalizzano ponendo, E± = ε11 ∓ iε12 . Ma ora risulta, E±0 = e±2i ϑ E± . Le due polarizzazioni fisiche contenute in un’onda gravitazionale hanno quindi elicit`a h = ±2. A livello classico le onde elettromagnetiche e le onde gravitazionali hanno dunque 144

in comune la velocit`a di propagazione e il numero di gradi di libert`a, ma si distinguono per l’elicit`a. Possiamo quindi concludere che a livello quantistico un campo scalare, la cui dinamica discenda dalla lagrangiana (5.21), corrisponder`a a una particella priva di massa e di spin, che il campo elettromagnetico sar`a composto da particelle prive di massa di spin ±1, i fotoni, mentre il campo gravitazionale, supposto che esista una teoria quantistica consistente dell’interazione gravitazionale, sar`a composto da particelle prive di massa di spin ±2, i gravitoni. Basi diverse di soluzioni. In questa sezione abbiamo studiato una particolare base completa di soluzioni dell’equazione di Maxwell nel vuoto, le onde piane, e ne abbiamo analizzato le propriet`a pi´ u salienti. Ne menzioniamo ora un’altra, non meno significativa e forse la pi` u caratteristica: per trasformazioni di Lorentz ogni suo elemento va in un altro elemento della stessa base. Detto in altre parole, sotto trasformazioni di Lorentz l’onda piana (5.61) resta un’onda piana. Tuttavia `e chiaro che la base delle onde piane, pur essendo di particolare rilevanza, non `e l’unica base di interesse fisico. Un altro importante sistema completo di soluzioni `e costituito dalle cosiddette onde sferiche, sistema che risulta molto utile nello sviluppo sistematico della radiazione in multipoli. Non ci occuperemo in dettaglio di questo sistema di soluzioni, perch´e avremo bisogno dello sviluppo in multipoli solo nel limite non relativistico, dove sar`a sufficiente tenere conto dei termini di dipolo e di quadrupolo. Si vedano tuttavia i paragrafi 9.6 e 9.7 del testo di J.D. Jackson 5.3.3

21

.

Onde elettromagnetiche e invarianza di gauge manifesta

Abbiamo visto che l’introduzione del potenziale vettore risulta inevitabile se si vuole basare l’Elettrodinamica su un principio variazionale, il quale costituisce a sua volta il punto di partenza indispensabile per la quantizzazione della teoria. D’altra parte il difetto principale delle procedure che coinvolgono il campo di gauge – e non direttamente il campo elettromagnetico – `e la mancanza dell’invarianza di gauge manifesta, sicch´e l’assenza di gradi di libert`a non fisici in linea di principio deve essere controllata di volta in volta. 21

J.D. Jackson, Classical Electrodynamics, 3a edizione, Wiley & Sons, New York, 1998.

145

In realt`a nell’ambito dell’Elettrodinamica classica l’introduzione del potenziale vettore costituisce solo un fatto di convenienza, in quanto pu`o rendere pi` u agevole lo studio di certi fenomeni. Abbbiamo visto, per esempio, che l’introduzione del potenziale vettore, insieme all’uso della trasformata di Fourier, ci ha permesso di risolvere agevolmente l’equazione di Maxwell nel vuoto – salvo di controllare poi alla fine l’invarianza di gauge della procedura. Rimarchiamo, tuttavia, che l’intera Elettrodinamica classica pu`o essere analizzata anche senza mai nominare il potenziale vettore Aµ , ma usando solo il campo elettromagnetico F µν , con i pregi evidenti che in questo modo non si introducono mai elementi non–fisici e che l’invarianza di gauge `e manifesta. Per illustrare le tecniche che si usano e le difficolt`a che si incontrano in questo framework alternativo, in questo paragrafo risolviamo di nuovo le equazioni di Maxwell nel vuoto – utilizzando solo il campo elettromagnetico. In questa ottica alternativa dobbiamo riconsiderare oltre all’equazione di Maxwell anche l’identit`a di Bianchi, e il sistema da risolvere `e allora, ∂µ F µν = 0, 1 (∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν ) = 0. ∂[µ Fνρ] = 3

(5.88) (5.89)

Come primo passo della soluzione dimostriamo che tutte le componenti del campo elettromagnetico devono soddisfare l’equazione delle onde. Per fare vedere questo `e sufficiente applicare all’identit`a di Bianchi l’operatore ∂ µ . Risulta, 2Fνρ + ∂ν ∂ µ Fρµ + ∂ρ ∂ µ Fµν = 0. Grazie alla (5.88) il secondo e il terzo termine di questa equazione sono nulli, e si ottiene effettivamente, 2F µν = 0.

(5.90)

Facciamo per`o notare che questa equazione segue dalle (5.88), (5.89), ma non le implica. Con l’esperienza accumulata finora `e comunque immediato scrivere la soluzione generale della (5.90), F

µν

1 = (2π)2

Z

´ d3 k ³ ik·x µν ~ e f (k) + c.c. , 2ω

(5.91)

dove f µν (~k) per il momento `e un arbitrario tensore complesso antisimmetrico, e ricordiamo che k 2 = 0. A questo punto cerchiamo di capire per quali f µν l’espressione appena scritta 146

soddisfa anche le (5.88), (5.89). Calcoliamo allora, Z 3 ³ ´ d k ik·x i µν µν ~ ∂ρ F = e kρ f (k) + c.c. , (2π)2 2ω dove abbiamo portato la derivata sotto il segno di integrale e derivato l’esponenziale. L’equazione di Maxwell e l’identiti`a di Bianchi equivalgono quindi rispettivamente alle equazioni algebriche, kµ f µν = 0,

(5.92)

k[µ fνρ] = 0.

(5.93)

Non `e difficile convincersi che la soluzione generale della seconda `e, fµν = kµ βν − kν βµ ,

(5.94)

per qualche vettore complesso β µ , e che la prima allora implica che, kµ β µ = 0.

(5.95)

D’altra parte si vede anche subito che non tutti i vettori β µ danno luogo a soluzioni diverse. Infatti, i vettori β µ e β µ + λ k µ soddisfano entrambi la (5.95), ma danno luogo allo stesso f µν . ` allora immediato vedere che le soluzioni (5.91), con f µν dato dalle (5.94) e (5.95), E combaciano perfettamente con le soluzioni (5.58) trovate usando il potenziale vettore – previa l’identificazione, β µ = i εµ . Problema di Cauchy. Analizziamo ora brevemente il problema alle condizioni iniziali per il campo elettromagnetico. In realt`a, data la (5.90) e visti gli sviluppi del paragrafo 5.2.1, sappiamo gi`a come si scrive F µν in funzione dei valori del campo all’istante inziale, vedi (5.41), Z µν

F (x) =

d3 y [D(t, ~x − ~y ) ∂0 F µν (0, ~y ) + ∂0 D(t, ~x − ~y ) F µν (0, ~y )] .

(5.96)

D’altra parte, le derivate temporali ∂0 F µν (0, ~y ) all’istante iniziale sono determinati dai valori iniziali degli stessi campi F µν (0, ~y ), attraverso le (5.88) e (5.89). Risultano infatti le solite relazioni, ~ =∇ ~ × B, ~ ∂0 E

~ = −∇ ~ × E. ~ ∂0 B 147

Valutandole a t = 0 e inserendole nella (5.96) si ottiene allora, Z h i ~ ~ × B(0, ~ ~y ) + ∂0 D(t, ~x − ~y ) E(0, ~ ~y ) , E(x) = d3 y D(t, ~x − ~y ) ∇ Z h i 3 ~ ~ ~ ~ B(x) = d y −D(t, ~x − ~y ) ∇ × E(0, ~y ) + ∂0 D(t, ~x − ~y ) B(0, ~y ) .

(5.97) (5.98)

A questo punto `e un semplice esercizio verificare che queste espressioni soddisfano in effetti le (5.88) e (5.89) per ogni t, purch´e i dati iniziali soddisfino i vincoli di fisicit`a, ~ · E(0, ~ ~x) = 0 = ∇ ~ · B(0, ~ ~x). ∇ Vediamo di nuovo che solo quattro campi iniziali possono essere scelti in modo arbitrario, per esempio, E 1 (0, ~x),

E 2 (0, ~x),

B 1 (0, ~x),

B 2 (0, ~x),

(5.99)

a conferma del fatto che il campo elettromagnetico corrisponde a due gradi di libert`a del secondo ordine. Covarianza. Concludiamo questo paragrafo con una breve analisi delle propriet`a strutturali delle formule risolutive (5.96)–(5.98); in particolare vogliamo fare vedere come si pu`o rendere la (5.96) manifestamente Lorentz–covariante. Riprendiamo la forma esplicita del kernel antisimmetrico (5.43), D(x) =

1 1 [δ(t − |~x|) − δ(t + |~x|)] = ε(t) δ(x2 ), 4π|~x| 2π

(5.100)

e facciamo vedere che esso `e invariante sotto trasformazioni di Lorentz proprie xµ → Λµ ν xν , D(Λx) = D(x),

Λ ∈ SO(1, 3)c .

(5.101)

Dato che il fattore δ(x2 ) `e manifestamente invariante, per dimostrare la (5.101) `e sufficiente fare vedere che ε(t) – il segno di t – `e invariante sotto trasformazioni di Lorentz proprie, se xµ `e di tipo tempo o nullo, x2 = t2 − |~x|2 ≥ 0,

ovvero |t| > |~x|.

(5.102)

Per fare vedere questo notiamo che per Λ ∈ SO(1, 3)c abbiamo Λ0 0 ≥ 1, e che la condizione Λµ α Λν β η αβ = η µν , per µ = ν = 0, implica, ~ 2, (Λ0 0 )2 = 1 + |L| 148

L i ≡ Λ0 i .

(5.103)

Per il tempo trasformato abbiamo allora,

Ã

~ · ~x = Λ0 0 t0 = Λ0 0 t + Λ0 i xi = Λ0 0 t + L

~ · ~x L t+ 0 Λ0

! .

Siccome le (5.102), (5.103) implicano, ¯ ¯ ¯L ¯ ~ · |~x| ~ |L| ¯ · ~x ¯ ≤ |t|, ¯ 0 ¯≤ q ¯Λ0¯ ~ 2 1 + |L| abbiamo dunque che il segno di t0 uguaglia quello di t. Invarianza relativistica dei coni luce. Con l’analisi appena svolta abbiamo in particolare dimostrato che il “cono luce futuro” e il “cono luce passato”, ovvero, gli insiemi di quadrivettori, L+ = {V µ ∈ R4 /V 2 ≥ 0, V 0 > 0},

L− = {V µ ∈ R4 /V 2 ≥ 0, V 0 < 0},

sono invarianti sotto trasformazioni di Lorentz proprie. Useremo queste propriet`a nel prossimo capitolo. Data la (5.101) siamo ora in grado covariantizzare la (5.96), generalizzandola al caso in cui i valori “iniziali” dei campi sono dati su un’arbitrario iperpiano di tipo spazio Γ, vedi paragrafo 3.2.1. Questi iperpiani sono caratterizzati da un vettore normale di tipo tempo costante Nµ , che possiamo normalizzare scegliendo Nµ N µ = 1. Ricordiamo che l’equazione di Γ `e, Nµ (xµ − xµ0 ) = 0. Se si assegnano i valori di F µν e della sua derivata normale Nρ ∂ ρ F µν su Γ, allora la versione covariante della (5.96) si scrive, Z µν F (x) = dΣρ [D(x − y) ∂ ρ F µν (y) + ∂ ρ D(x − y) F µν (y)] ,

(5.104)

Γ

dove la misura dΣρ = Nρ d3 λ `e stata definita nel paragrafo 3.2.1. Per verificare che la (5.104) soddisfa le condizioni al bordo corrette, nonch´e l’equazione 2F µν = 0, occorro usare le seguenti versioni covarianti delle propriet`a (5.44)–(5.46) del kernel, 2D = 0,

(5.105)

per x2 < 0 Z ∞ = Nµ δ 4 (x − N λ) dλ.

D(x) = 0, ∂µ D(x)|Nν xν =0

−∞

149

(5.106) (5.107)

Causalit`a. L’altra propriet`a importante del kernel consiste nel fatto che esso `e supportato sul (bordo del) cono luce, vale a dire `e diverso da zero solo per t = ±|~x|. Questa circostanza assicura che un generico campo elettromagnetico – e non solo le onde piane – si propaga con la velocit`a della luce. Se supponiamo, per esempio, che i campi iniziali (5.99) siano diversi da zero solo all’interno di una sfera di raggio L, allora nelle (5.97), (5.98) l’integrale su ~y si restringe alla regione |~y | < L. Di conseguenza, in un generico punto ~x all’esterno della sfera, a un istante t > 0 il campo sar`a diverso da zero solo se per qualche |~y | < L si ha, |~x − ~y | = t. In ~x il primo segnale giunger`a quindi all’istante t = |~x| − L, mentre in tutti gli istanti t < |~x| − L il campo elettromagnetico in ~x sar`a nullo. Essendo invariante per trasformazioni di Lorentz, il kernel `e in particolare invariante per rotazioni spaziali ~x → R ~x, con R ∈ SO(3), D(t, R~x) = D(t, ~x). Da questo segue che il campo elettromagnetico si propaga localmente in modo isotropo in tutte le direzioni, a conferma del principio di Huygens. Inversione temporale. L’ultima caratteristica del kernel che facciamo notare `e che esso cambia di segno per inversione temporale t → −t, D(−t, ~x) = −D(t, ~x). Vogliamo fare vedere che questa propriet`a `e intimamente legata con l’invarianza per inversione temporale dell’equazione delle onde, ¢ ¡ 2ϕ = ∂02 − ∇2 ϕ = 0, la quale resta appunto invariata se si sostituisce ∂0 con −∂0 . Ci`o comporta che se ϕ(t, ~x) `e soluzione, allora `e soluzione anche la funzione, ϕ(t, e ~x) ≡ ϕ(−t, ~x). In particolare la soluzione ϕ e `e univocamente determinata dalle condizioni iniziali, ϕ(0, e ~x) = ϕ(0, ~x),

∂0 ϕ(0, e ~x) = −∂0 ϕ(0, ~x). 150

Scrivendo la (5.41) per ϕ e si ottiene allora, Z ϕ(x) e = d3 y [−D(t, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂0 D(t, ~x − ~y ) ϕ(0, ~y )] . D’altra parte ϕ e pu`o essere anche ottenuta effettuando nella (5.41) la sostituzione t → −t, Z ϕ(x) e = d3 y [D(−t, ~x − ~y ) ∂0 ϕ(0, ~y ) − ∂0 D(−t, ~x − ~y ) ϕ(0, ~y )] . Si vede che affinch´e le due formule coincidano `e necessario e sufficiente che D sia funzione antisimmetrica di t. Vediamo quindi che l’antisimmetria del kernel (5.100) `e – in ultima analisi – una conseguenza dell’invarianza per inversione temporale delle equazioni di Maxwell. Si pu`o vedere che la trasformazione t → −t costituisce, in realt`a, una simmetria discreta esatta non solo dell’interazione elettromagnetica, ma anche di quelle gravitazionale e forte, mentre `e violata dalle interazioni deboli. Infine facciamo notare che l’invarianza per inversione temporale `e intrinseca anche alla meccanica non relativistica, in quanto l’equazione di Newton, m

d2~x ~ (~x), = F~ = −∇V dt2

`e invariante per t → −t, purch´e il potenziale non dipenda esplicitamente dal tempo. E anche in questo caso ne consegue che se ~x(t) `e soluzione, allora lo `e anche ~x(−t).

5.4

Effetto Doppler relativistico

Nella sezione precedente abbiamo visto che nel passaggio da un sistema di riferimento a un altro, un’onda piana elementare resta un’onda piana elementare, ma polarizzazione, direzione di propagazione e frequenza cambiano. In questo paragrafo ci occuperemo in particolare del cambiamento della frequenza. A questo scopo consideriamo una sorgente che emette segnali luminosi monocromatici di frequenza “propria” – vale a dire quando `e a riposo – ω0 =

2π , λ0

in tutte le direzioni. Vogliamo allora determinare la frequenza del

segnale, quando la sorgente si trova in moto rettilineo uniforme con velocit`a ~v . Consideriamo allora il sistema di riferimento K ∗ in cui la sorgente `e a riposo. In K ∗ la quadrivelocit`a della sorgente e il vettore d’onda quadridimensionale sono dati rispettivamente da, u∗µ = (1, ~0),

k ∗µ = (ω0 , ~k0 ). 151

Nel sistema di riferimento K del laboratorio le analoghe quantit`a sono date da, µ ¶ 1 ~v µ u = √ ,√ , k µ = (ω, ~k). 2 2 1−v 1−v Se indichiamo l’angolo tra la direzione di propagazione dell’onda e la velocit`a della sorgente – entrambe misurate in K – con α, possiamo sfruttare l’invarianza di Lorentz dello scalare u · k per ottenere, ω0 = u∗µ k ∗µ = uµ k µ = √

1 (ω − ω v cos α). 1 − v2

Per frequenza e lunghezza d’onda nel sistema del laboratorio si ottiene allora, √ 1 − v2 1 − v cos α ω= ω0 , λ= √ λ0 . 1 − v cos α 1 − v2

(5.108)

Queste formule descrivono l’effetto Doppler relativistico. Nei casi particolari in cui la sorgente che si avvicina (allontana) frontalmente abbiamo α = 0 (α = π), e ripristinando la velocit`a della luce otteniamo, 1 ∓ v/c λ0 . λ= p 1 − v 2 /c2

(5.109)

Questa formula pu`o essere confrontata con la formula dell’effetto Doppler non relativistico, λn.r. = (1 ∓ v/vp ) λ0 , dove vp rappresenta la velocit`a di propagazione del segnale. Si vede che se la sorgente si muove con velocit`a v piccola rispetto alla velocit`a della luce, il risultato relativistico si riduce formalmente a quello non relativistico, se si pone vp = c. Redshift cosmologico. Concludiamo la sezione con un’applicazione importante dell’effetto Doppler relativistico, il cosiddetto redshift. Per sorgenti che si allontanano dall’osservatore frontalmente, la (5.109) permette di ricavare la variazione relativa della lunghezza d’onda,

s z≡

λ − λ0 = λ0

1 + v/c − 1 > 0. 1 − v/c

(5.110)

Le lunghezze d’onda aumentano dunque all’aumentare della velocit`a. Questo fenomeno `e noto come “redshift”, in quanto le frequenze si abbassano e le righe spettrali si spostano verso il rosso, ed `e di importanza fondamentale in cosmologia: attraverso un’analisi 152

sistematica del “redshift cosmologico” nella radiazione emessa dalle galassie, Hubble nel 1929 `e stato in grado di scoprire l’espansione dell’universo. Le galassie osservate da lui avevano velocit`a piccole rispetto alla velocit`a della luce, dell’ordine di v ≈ 3.000km/s, per cui l’aumento relativo delle lunghezze d’onda era piccolo. Sviluppando la (5.110) si ottiene infatti, z≈

v = 10−2 . c

Ma oggi sono note anche galassie con valori di z molto elevati. Per esempio, per la galassia 8C1435+635 nel 1994 si `e misurato il redshift z = 4.25, corrispondente a una velocit`a di allontanamento pari a v = 0.93 c. Per concludere notiamo che misure molto precise del redshift cosmologico nelle supernovae di tipo Ia, effettuate di recente, hanno permesso di trarre conclusioni nuove e rivoluzionarie sullo stato del nostro universo: da queste misure sappiamo, infatti, che l’universo non solo `e in espansione, ma che sta accelerando. D’altra parte secondo la Relativit`a Generale un universo che accelera esige necessariamente una costante cosmologica diversa zero e positiva, circostanza che ha arricchito la cosmologia odierna di una serie di problematiche nuove, tuttora irrisolte.

5.5

Problemi

5.1 In riferimento alla soluzione dell’equazione delle onde del paragrafo 5.2.1, a) si dimostri che la (5.40) si pu`o riscrivere come in (5.41); b) si dimostri che il kernel antisimmetrico D dato in (5.42) pu`o essere scritto come in (5.43). [Sugg.: si passi dalla variabile d’integrazione ~k in coordinate polari, e si sfrutti l’invarianza per rotazioni per porre ~x = (0, 0, |~x|). Infine si ricordi che la δ di Dirac ammette la rappresentazione simbolica in trasformata di Fourier, Z 1 eik(x−a) dk.] δ(x − a) = 2π 5.2 Supponendo che Aµ (x) sia un campo vettoriale e che per una trasformazione di Lorentz si abbia k 0µ = Λµ ν k ν , si dimostri che anche la trasformata di Fourier, Z 1 µ b A (k) = d4 x e−ik·x Aµ (x), (2π)2 153

`e un campo vettoriale nella variabile k. 5.3 Utilizzando il gauge–fixing, A0 = 0, si dimostri che l’equazione di Maxwell, ∂µ F µν = j ν , propaga due gradi di libert`a fisici. Si adotti la seguente strategia: a) si impongano condizioni iniziali per A1 e A2 e le loro derivate temporali, a t = 0; b) si determini la forma delle trasformazioni di gauge residue; c) imponendo l’equazione G0 ≡ ∂µ F µ0 − j 0 = 0 a t = 0, e utilizzando le trasformazioni di gauge residue, si fissino le condizioni iniziali per A3 e ∂0 A3 a t = 0. 5.4 Partendo dalla (5.58) si deducano le espressioni generali per i campi elettrico e magnetico nel vuoto, Z ¡ ik·x ¢ 1 3 ~ ~x) = E(t, d k i e [(~ n · ~ ε ) ~ n − ~ ε ] + c.c. , 2(2π)2 Z ¡ ¢ 1 ~ B(t, ~x) = d3 k i eik·x [~ε × ~n] + c.c. . 2 2(2π) a) Si verifichi che questi campi soddisfano le equazioni di Maxwell nel vuoto (2.28)–(2.31), nonch´e le equazioni delle onde, ~ = 0 = 2B. ~ 2E ~ ~x) e B(0, ~ ~x), si determini il campo vettoriale tridimensionale, b) Noti i campi iniziali E(0, V~ (~k) ≡ ~ε − (~n · ~ε) ~n, ~ eB ~ ad ogni t. [Sugg.: si veda il paragrafo 5.2.1.] e quindi E c) Il campo ~ε(~k) `e univocamente determinato? 5.5 Si consideri un’onda piana elementare propagantesi lungo l’asse z, con vettore d’onda k µ = (ω, 0, 0, ω), e polarizzazione εµ = (ε0 , ε1 , ε2 , ε0 ) generica, Aµ (x) = εµ eik·x + c.c. ~ ~x) e B(t, ~ ~x) e si verifichi che essi sono a) Si determinino esplicitamente i campi E(t, gauge–invarianti, ovvero indipendenti da ε0 , e che soddisfano le condizioni di trasversalit`a 154

E 3 = 0 = B3. b) Nel piano trasverso (x, y) si definisca il campo elettrico complesso E ≡ E 1 + iE 2 . Si dimostri che risulta, ¡ ¢ E = −i ω E− eik·x − E+∗ e−ik·x ,

(5.111)

dove E± sono gli “autostati” di elicit`a: E± = ε1 ∓ iε2 . c) Si verifichi che per E− = 0 (E+ = 0) la punta del campo elettrico descrive un’elica percorsa in senso orario, di “elicit`a” positiva, (antiorario, di “elicit`a” negativa), corrispondente a polarizzazione circolare lungo la direzione del moto (in direzione opposta al moto). La soluzione generale (5.111) corrisponde quindi a una generica sovrapposizione dei due stati di polarizzazione circolare. d) Se εµ `e reale si ha E−∗ = E+ . Si verifichi che in questo caso l’onda risulta polarizzata ~ ha direzione costante. linearmente, ovvero, che E 5.6 Si dimostri che il tensore energia impulso associato all’onda elettromagnetica elementare (5.61), mediato su scale temporali grandi rispetto al periodo `e dato da, µν hTem i = −2 k µ k ν ε∗α εα . 00 Si dimostri che vale hTem i ≥ 0.

5.7 Si consideri l’onda scalare “sferica”, ϕ(t, ~x) =

1 G(t − r), r

r ≡ |~x|,

dove G `e una funzione arbitraria. a) Si dimostri che ϕ soddisfa l’equazione delle onde 2ϕ = 0, in ogni regione spaziale che non contiene il punto ~x = 0. [Sugg.: pu`o essere utile scrivere il Laplaciano in coordinate polari, 1 ∇ = r 2

µ

∂ ∂r

¶2 r+

1 2 L, r2

dove L2 `e un operatore differenziale che coinvolge solo gli angoli.] b) Si spieghi perch´e ϕ non `e soluzione dell’equazione delle onde in tutto lo spazio, e se ne dia un’interpretazione fisica.

155

5.8 Si consideri l’equazione delle onde in una dimensione spaziale, ¡

¢ ∂t2 − ∂x2 ϕ(x, t) = 0.

Utilizzando la tecnica della trasformata di Fourier si dimostri che la soluzione generale di questa equazione si pu`o scrivere come, ϕ(t, x) = f (x − t) + g(x + t), con f e g funzioni arbitrarie.

156

6

Generazione di campi elettromagnetici

Nel capitolo precedente abbiamo determinato la forma di un generico campo di radiazione, ovverosia di un campo elettromagnetico che soddisfa l’equazione di Maxwell in assenza di sorgenti. Abbiamo trovato che questo campo consiste di una sovrapposizione lineare di onde piane, monocromatiche e trasverse, che si propagano con la velocit`a della luce, le onde elettromagnetiche. In questo capitolo affronteremo un altro problema centrale dell’Elettrodinamica classica: la determinazione del campo elettromagnetico generato da un’arbitraria distribuzione di cariche in movimento. Risolveremo, infatti, l’equazione di Maxwell in presenza di una generica quadricorrente j µ conservata. Scopo ultimo di questo capitolo `e la derivazione di formule esplicite per i campi elettrico e magnetico, creati da una singola particella carica in moto arbitrario. Questi campi rivestono a loro volta un ruolo cruciale in Elettrodinamica classica, e portano i nomi dei loro scopritori, Lienard (1898), e Wiechert (1900). In presenza di correnti il campo elettromagnetico deve soddisfare le equazioni, ∂µ F µν = j ν ,

F µν = ∂ µ Aν − ∂ ν Aµ ,

ovverosia, in gauge di Lorentz, 2Aµ = j µ ,

(6.1)

∂µ Aµ = 0.

(6.2)

Queste equazioni sono lineari in Aµ , ma non omogenee. La soluzione generale si potr`a quindi scrivere come somma di una soluzione particolare Aµret , e della soluzione generale Aµin del sistema omogeneo associato, Aµ = Aµret + Aµin .

(6.3)

Il potenziale Aµin `e dunque la soluzione generale del sistema, 2Aµin = 0,

∂µ Aµin = 0,

che corrisponde a un campo di Maxwell libero. Dal capitolo precedente sappiamo allora che Aµin `e una generica sovrapposizione di onde elettromagnetiche piane – un generico campo di radiazione – che gioca il ruolo di un campo esterno “entrante dall’infinito”. 157

Il “potenziale ritardato” Aµret rappresenta invece il campo generato causalmente dalla corrente j µ , secondo le equazioni (6.1) e (6.2), della cui soluzione ci occuperemo nelle prossime sezioni. Siccome nel resto di questo capitolo ignoreremo il campo di radiazione, indicheremo Aµret semplicemente con Aµ . I pedici in e ret significano rispettivamente incoming e retarded. Questa nomenclatura deriva dal fatto che convenzionalmente la radiazione Aµin , che si sovrappone al potenziale ritardato (fisico) Aµret , viene considerata entrante dall’infinito. Per completezza menzioniamo che la soluzione (6.3) pu`o essere scritta formalmente anche in termini del cosiddetto potenziale avanzato (non fisico) Aµadv , vedi sezione 6.2, Aµ = Aµadv + Aµout . La radiazione sovrapposta ad Aµadv viene considerata uscente verso l’infinito, outgoing, e indicata con Aµout . I potenziali Aµadv e Aµout hanno una certa rilevanza nella teoria dello scattering, ma noi non ce ne serviremo. Questa nomenclatura diventer`a comunque pi` u trasparente, quando avremo risolto l’equazione di Maxwell. Una tecnica efficace per risolvere equazioni differenziali alle derivate parziali del tipo (6.1), `e costituita dal cosiddetto “metodo della funzione di Green”. Prima di applicare questo metodo alla soluzione della (6.1), nella prossima sezione lo illustriamo nel caso di un’equazione pi` u semplice, ma fisicamente rilevante, ovvero, quello dell’equazione di Poisson.

6.1

Il metodo della funzione di Green: equazione di Poisson

Consideriamo l’equazione di Poisson in tre dimensioni spaziali, −∇2 F (~x) = ϕ(~x),

(6.4)

nell’incognita F . Per definitezza assumiamo che sia, F ∈ S 0 (R3 ),

ϕ ∈ S(R3 ),

ma vedremo che le soluzioni che troveremo saranno valide sotto ipotesi meno restrittive. Se interpretiamo F come il potenziale elettrico A0 , e ϕ come la densit`a di carica j 0 , allora 158

la (6.4) si identifica con l’equazione fondamentale dell’Elettrostatica. Ispirati da questa interpretazione aggiungiamo allora la richiesta ulteriore che ϕ sia a supporto compatto, ϕ(~x) = 0,

per |~x| > R.

Corrispondentemente imponiamo la condizione “fisica” che F si annulli all’infinito, lim F (~x) = 0.

|~ x|→∞

(6.5)

Vedremo, infatti, che con questa condizione asintotica l’equazione di Poisson ammetter`a soluzione unica. Per completezza ricordiamo che in generale non ha senso imporre una condizione asintotica, come la (6.5), a una distribuzione. Tuttavia, vedremo che per un’ampia classe di “funzioni” ϕ, non necessariamente appartenenti ad S, le soluzioni della (6.4) sono rappresentate da funzioni, di classe C ∞ al di fuori di un compatto di R3 . Per tali ϕ la (6.5) `e quindi ben posta. Esempi ne sono le ϕ corrispondenti alla densit`a di carica associata a un numero finito di cariche puntiformi statiche, ϕ(~x) =

N X

er δ 3 (~x − ~yr ),

(6.6)

r=1

che appartengono ad S 0 , ma non ad S. Discuteremo comunque la soluzione generale dell’equazione di Poisson – indipendentemente dalla validit`a della (6.5) – alla fine di questa sezione. 6.1.1

Una soluzione particolare

Siccome l’equazione di Poisson `e un’equazione lineare non omogenea, la sua soluzione generale `e data da una soluzione particolare, sovrappposta alla soluzione generale dell’equazione omogenea associata, ovvero, dell’equazione di Laplace, ∇2 F = 0. Ovviamente la soluzione particolare non `e unica, ma possiamo circoscriverla attraverso qualche richiesta aggiuntiva. Osserviamo che la (6.4) `e “congiuntamente lineare” in F e ϕ, nel senso che una soluzione particolare relativa alla densit`a di carica ϕ1 +ϕ2 , pu`o essere ottenuta sommando le soluzioni individuali F1 e F2 . Lasciando per il momento da parte le 159

propriet`a di regolarit`a delle grandezze coinvolte, possiamo allora avanzare l’ipotesi che il valore di F in ~x dipende linearmente dai valori che ϕ assume in tutti i punti dello spazio, ovvero, che per ogni ~x fissato il numero F (~x) definisca “un funzionale lineare e continuo” f~x , sullo spazio delle ϕ, F (~x) = f~x (ϕ). In notazione simbolica avremo allora, Z Z 3 F (~x) = d y f~x (~y ) ϕ(~y ) ≡ d3 y g(~x, ~y ) ϕ(~y ),

(6.7)

per qualche funzione incognita di due variabili g(~x, ~y ). Possiamo vincolare la forma di questa funzione se adottiamo l’interpretazione elettrostatica della (6.4), e invochiamo il gruppo di simmetria dello spazio tridimensionale vuoto, ovvero, le rototraslazioni, ~x → ~x 0 = R ~x + ~a,

R ∈ SO(3),

~a ∈ R3 .

In un altro sistema di riferimento la (6.7) diventa infatti 22 , Z 0 0 F (~x ) = d3 y 0 g(~x 0 , ~y 0 ) ϕ0 (~y 0 ). Sotto queste trasformazioni il potenziale elettrico e la densit`a di carica siano invarianti, F 0 (~x 0 ) = F (~x),

ϕ0 (~x 0 ) = ϕ(~x),

e dato che d3 y 0 = d3 y, ne segue che deve essere, g(~x 0 , ~y 0 ) = g(~x, ~y ), per una qualsiasi rototraslazione. Scegliendo R = 1 e ~a = −~y si ottiene allora, g(~x, ~y ) = g(~x − ~y , 0) ≡ g(~x − ~y ), mentre l’invarianza per rotazioni impone poi che g(~x) dipenda solo da |~x|. La (6.7) si riduce allora a,

Z F (~x) =

d3 y g(~x − ~y ) ϕ(~y ),

22

g(~x) = g(|~x|).

(6.8)

Si noti che la funzione g deve essere indipendente dal sistema di riferimento, perch´e in caso contrario un osservatore in un altro sistema di riferimento potrebbe accorgersi di essere stato rototraslato. In altre parole, deve valere g(~x 0 , ~y 0 ) = g(~x, ~y ), e non g 0 (~x 0 , ~y 0 ) = g(~x, ~y ).

160

Ricordando la definizione della convoluzione, vedi paragrafo 2.3.2, si riconosce che questa formula pu`o essere riscritta in modo compatto come, F = g ∗ ϕ.

(6.9)

Posta in questa forma la soluzione F apparterr`a effettivamente a S 0 , purch´e anche g appartenga a S 0 . Ricordiamo, infatti, che la convoluzione tra una distribuzione e una funzione di test definisce sempre una distribuzione. La funzione di Green. Data la (6.8), l’equazione di Poisson si trasforma ora in un’equazione per g,

Z 2

−∇ F (~x) = −

d3 y ∇2 g(~x − ~y ) ϕ(~y ) = ϕ(~x).

Per l’arbitrariet`a della ϕ dovr`a dunque valere, −∇2 g(~x − ~y ) = δ 3 (~x − ~y ), ovvero, pi` u semplicemente, −∇2 g(~x) = δ 3 (~x).

(6.10)

Questa equazione identifica g come la funzione di Green associata all’equazione (6.4), chiamata talvolta anche “propagatore”, o “kernel integrale” dell’equazione. Il metodo della funzione di Green consiste nel risolvere esplicitamente l’equazione per il kernel (6.10), e di scrivere la soluzione dell’equazione di partenza nella forma integrale (6.8). L’efficacia del metodo risiede nel fatto che esso riconduce la soluzione della (6.4), che a priori dovrebbe essere risolta per ogni ϕ separatamente, alla soluzione di una sola equazione: l’equazione del kernel (6.10). L’inverso del Laplaciano. La particolare forma della soluzione (6.9), (6.10) permette di dare un’interpretazione alternativa a g. Infatti, come qualsiasi kernel integrale anche g induce un operatore lineare O nello spazio delle funzioni su R3 , definito da, ϕ



O ϕ = g ∗ ϕ.

Alla luce dell’identit`a, −∇2 O ϕ = −∇2 (g ∗ ϕ) = −(∇2 g) ∗ ϕ = δ 3 ∗ ϕ = ϕ, 161

l’operatore O costituisce un inverso dell’operatore −∇2 . Per questo motivo si dice anche che il kernel g “inverte il Laplaciano”, e formalmente si scrive, 1 = g. −∇2 Ci siamo dunque ricondotti alla soluzione del sistema, −∇2 g(~x) = δ 3 (~x),

g(~x) = g(|~x|),

g ∈ S 0.

(6.11)

In realt`a conosciamo gi`a una soluzione di questo sistema, vedi (2.53), g(~x) =

1 . 4π|~x|

(6.12)

Ma essa `e anche unica, modulo l’aggiunta di una costante additiva. Infatti, come faremo vedere sotto, l’equazione omogenea associata alla (6.11), ∇2 g = 0, ammette come unica soluzione invariante per rotazioni la costante. Ma `e facile vedere che l’addizione di una costante alla (6.12), porta a una F che non svanisce all’infinito. Sostituendo la (6.12) nella (6.8) possiamo allora affermare che una soluzione particolare dell’equazione di Poisson `e data da, 1 F (~x) = 4π

Z d3 y

1 ϕ(~y ), |~x − ~y |

(6.13)

espressione che riproduce correttamente il potenziale elettrico creato da una densit`a di carica statica. Resta da verificare la validit`a della condizione asintotica (6.5). Per fare questo valutiamo il limite, 1 lim lim |~x| F (~x) = |~ x|→∞ 4π |~x|→∞

Z

|~x| 1 dy ϕ(~y ) = |~x − ~y | 4π 3

Z d3 y ϕ(~y ) =

Q , 4π

dove Q `e la “carica” totale, finita, perch´e ϕ `e a supporto compatto. Asintoticamente F va quindi a zero come, F (~x) ∼

Q . 4π|~x|

(6.14)

Infine facciamo notare che la formula risolutiva (6.13), assieme all’andamento asintotico (6.14), possono restare validi anche se ϕ non appartiene ad S, ma `e, per esempio, della forma pi` u singolare (6.6). In questo caso la (6.13) si riduce infatti all’espressione nota, P X er er F (~x) = ∼ r , per |~x| → ∞. 4π|~x − ~yr | 4π|~x| r 162

6.1.2

Validit` a della soluzione e soluzione generale

Affrontiamo ora la questione della validit`a della soluzione (6.13), ovvero della (6.9), F = g ∗ ϕ,

(6.15)

in generale. Ricordiamo che avevamo richiesto F ∈ S 0 e ϕ ∈ S. Come osservato sopra, la funzione di Green (6.12) appartiene ad S 0 , e di conseguenza la convoluzione in (6.15) definisce effettivamente un elemento di S 0 , se ϕ appartiene ad S. Per di pi` u in questo caso la convoluzione equivale proprio all’integrale (6.13). Tuttavia, come abbiamo fatto notare nel paragrafo precedente, in diversi casi di interesse fisico ϕ non appartiene a S. In Elettrostatica esempi sono la (6.6), oppure certe densit`a di carica macroscopiche “singolari”, come quelle corrispondenti a distribuzioni di carica superficiali, o filiformi. In questi casi abbiamo, ϕ ∈ S 0,

ϕ∈ / S,

e la (6.15) `e a priori priva di senso, perch´e in generale la convoluzione tra due distribuzioni non `e definita. Una convoluzione tra due distribuzioni. Per uscire dall’empasse manteniamo per il momento ϕ ∈ S, ed eseguiamo la trasformata di Fourier della (6.15), vedi paragrafo 2.3.2, Fb(~k) = (2π)3/2 gb(~k) ϕ( b ~k).

(6.16)

Sappiamo che la trasformata gb sta in S 0 , ma possiamo anche valutarla esplicitamente. Per determinarla in modo spedito procediamo formalmente, cio`e, scrivendo l’integrale corrispondente – di per s´e divergente – e sfruttando l’invarianza per rotazioni per porre ~k = (0, 0, k), con k = |~k|. Valutiamo l’integrale passando in coordinate polari, Z Z ∞ Z 2π Z 1 1 1 1 1 3 −i~k·~ x 2 ~ gb(k) = d xe = r dr dϕ d cos ϑ e−i cos ϑrk 3/2 3/2 (2π) 4π|~x| (2π) 4π 0 r −1 Z ∞ Z ∞0 ¡ ¢ i i dr e−ikr − eikr = dx e−ikx ε(x) = 3/2 3/2 2 (2π) k 0 2 (2π) k −∞ i = εb (k), . 2 (2π) k Nell’ultimo passaggio abbiamo introdotto la trasformata di Fourier della funzione segno, ε(x) = H(x) − H(−x), 1 εb (k) = √ 2π

Z

r



dx e

−ikx

ε(x) = −i

−∞

163

2 P π

µ ¶ 1 , k

dove P indica la “parte principale”. Dato che k `e positivo si ottiene in definitiva, gb(~k) =

1 (2π)3/2 |~k|2

∈ S 0,

(6.17)

e quindi, 1 ϕ( b ~k). Fb(~k) = 2 ~ |k|

(6.18)

Si noti in particolare l’esatta corrispondenza tra le relazioni (6.17), (6.18), e le trasformate di Fourier delle equazioni (6.10), (6.4). A questo punto notiamo, per`o, che il membro di destra della (6.18) – e pi` u in generale della (6.16) – ha senso anche se gb ∈ S 0 e ϕ b ∈ OM

23

, perch´e il prodotto di una generica

distribuzione con una funzione in OM definisce sempre una distribuzione, vedi paragrafo 2.3.2. D’altra parte, per il teorema di Paley–Wiener

24

la trasformata di Fourier di una

generica distribuzione ϕ ∈ S 0 a supporto compatto, appartiene a OM . Di conseguenza, per una tale ϕ il membro di destra della (6.18) costituisce una distribuzione in S 0 . In questo caso possiamo allora definire F come l’antitrasformata di Fourier del membro di destra della (6.18). In conclusione, l’espressione formale (6.15), definita come l’antitrasformata di Fourier del membro di destra della (6.16), costituisce una soluzione della (6.4) con F ∈ S 0 , purch´e ϕ sia una distribuzione a supporto compatto. Tali sono in particolare tutte le distribuzioni statiche di carica realizzate in natura. Unicit`a della soluzione ed equazione di Laplace. Per concludere discutiamo brevemente la soluzione generale della (6.4), indipendentemente dalla condizione asintotica (6.5). Per ottenere la soluzione generale dell’equazione di Poisson `e sufficiente aggiungere alla soluzione particolare (6.13), la soluzione generale F0 dell’equazione omogenea associata, ovvero dell’equazione di Laplace, ∇2 F0 (~x) = 0.

(6.19)

Questa equazione ammette in effetti infinite soluzioni, ma nessuna di queste svanisce all’infinito. Per provarlo troviamo la soluzione generale per F0 ∈ S 0 (R3 ). A questo scopo 23

Ricordiamo che con OM (RD ) si intende lo spazio delle funzioni C ∞ su RD , polinomialmente limitate assieme a tutte le loro derivate parziali. 24 Vedi per esempio, M. Reed e B. Simon, Methods of Modern Mathematical Physics – I Functional Analysis, Academic Press, New York, 1980.

164

`e conveniente eseguire la trasformata di Fourier della (6.19), |~k|2 Fb0 (~k) = 0,

(6.20)

e sfruttare il teorema sulle distribuzioni con supporto in un punto, vedi paragrafo 2.3.2. L’equazione appena scritta implica, infatti, che Fb0 (~k) ha come supporto l’origine ~k = 0. Essa `e dunque necessariamente una combinazione lineare finita della δ 3 (~k) e delle sue derivate. Avremo cio`e, Fb0 (~k) =

N X

C i1 ···in ∂i1 · · · ∂in δ 3 (~k),

(6.21)

n=1

dove i C i1 ···in sono tensori costanti completamente simmetrici. Inserendo questa espressione nella (6.20) si trova che, affinch´e Fb0 (~k) sia soluzione, `e necessario e sufficiente che i coefficienti siano a traccia nulla, vedi il problema analogo per l’equazione di D’Alembert in sezione 5.2, δi1 i2 C i1 ···in = 0.

(6.22)

Esistono quindi effettivamente infinite soluzioni. Tuttavia, eseguendo l’antitrasformata di Fourier della (6.21), si ottiene semplicemente il polinomio, N 1 X (−i)n C i1 ···in xi1 · · · xin , F0 (~x) = 3/2 (2π) n=1

(6.23)

che all’infinito diverge. Concludiamo che l’equazione di Laplace non ammette soluzioni che svaniscono all’infinito, esclusa la soluzione banale F0 = 0. Infine, per dimostrare l’unicit`a della soluzione del sistema (6.11), facciamo vedere che l’equazione di Laplace non ammette soluzioni invarianti per rotazioni, a parte la costante. A questo scopo `e conviente introdurre una base di soluzioni alternativa alle (6.23), che si ottiene risolvendo la (6.19) in coordinate polari. Scrivendo il Laplaciano come nel problema 5.7, `e infatti immediato vedere che la base di soluzioni che ne risulta `e data da, F0lm (~x) = rl Ylm (ϕ, ϑ),

(6.24)

dove le Ylm sono le armoniche sferiche, e r = |~x|. Contando le potenze di ~x nella (6.23), si vede che l’indice l della base (6.24) si identifica direttamente con l’intero n della base (6.23). Usando la base F0lm si vede poi che l’unica soluzione dell’equazione di Laplace invariante per rotazioni, ovvero, indipendente dagli angoli, `e F000 , che `e una costante. 165

Metodo della funzione di Green in generale. Il metodo della funzione di Green si generalizza facilmente a un’equazione differenziale lineare in uno spazio D–dimensionale, che coinvolge un arbitrario operatore polinomiale nelle derivate parziali P (∂), P (∂) F = ϕ. Secondo l’esempio appena svolto la funzione di Green g associata a questa equazione deve soddisfare l’equazione del kernel, P (∂) g(x) = δ D (x), e la soluzione si scrive come, F = g ∗ ϕ. Infatti, ricordando le propriet`a della convoluzione riportate nel paragrafo 2.3.2 si trova, P (∂) F = P (∂) (g ∗ ϕ) = P (∂) g ∗ ϕ = δ D ∗ ϕ = ϕ.

6.2

Il campo generato da una corrente generica

Cerchiamo ora di applicare il metodo della funzione di Green per risolvere l’equazione di Maxwell in presenza di una generica corrente conservata, in gauge di Lorentz, 2Aµ = j µ ,

(6.25)

∂µ Aµ = 0.

(6.26)

Come anticipato cercheremo non la soluzione generale, ma il campo generato causalmente dalla corrente j µ . Per il momento per definitezza assumeremo che sia, Aµ ∈ S 0 ≡ S 0 (R4 ),

j µ ∈ S ≡ S(R4 ).

(6.27)

Ricordiamo tuttavia che – come nel caso dell’equazione di Poisson – la corrente di un sistema di particelle puntiformi in realt`a non sta in S, ma in S 0 . Anche nel caso dell’equazione di Maxwell, alla fine dovremo allora affrontare il problema di come estendere la soluzione al caso “fisico” – in cui j µ ∈ S 0 . La differenza principale tra la (6.25) e l’equazione di Poisson `e essenzialmente che la seconda vive in tre dimensioni spaziali, mentre la prima 166

`e formulata nello spazio quadrimensionale di Minkowski: il suo gruppo di invarianza sar`a quindi il gruppo di Poincar´e, in sostituzione del gruppo delle rototraslazioni. Ci occuperemo prima della soluzione della (6.25), e imporremo poi la gauge di Lorentz alle soluzioni trovate. Per la linearit`a congiunta in Aµ e j µ dell’equazione di Maxwell, cerchiamo ora una soluzione della forma, Z µ

d4 y G(x, y) j µ (y),

A (x) =

(6.28)

dove la funzione di Green G(x, y) `e una funzione incognita delle coordinate spazio– temporali xµ e y µ . Come prima cosa vediamo allora quali sono i vincoli imposti a questa funzione dalla richiesta di covarianza sotto trasformazioni di Poincar´e. Cambiando sistema di riferimento, xµ → x0µ = Λµ ν xν + aµ , abbiamo,

Z 0µ

0

d4 y 0 G(x0 , y 0 )j 0µ (y 0 ),

A (x ) = e dato che si ha, A0µ (x0 ) = Λµ ν Aν (x), segue facilmente,

j 0µ (y 0 ) = Λµ ν j ν (y),

d4 y 0 = d4 y,

Z ν

A (x) =

d4 y G(x0 , y 0 )j ν (y).

Confrontando con la (6.28) concludiamo allora che G deve essere invariante per trasformazioni di Poincar´e, cio`e

25

, ∀ Λµ ν ∈ SO(1, 3)c ,

G(Λx + a, Λy + a) = G(x, y),

∀ aµ ∈ R4 .

Scegliendo Λµ ν = δ µ ν , e aµ = −y µ si ottiene, G(x, y) = G(x − y, 0) ≡ G(x − y). 25 Come nel caso dell’equazione di Poisson la quantit`a G(x, y) va considerata non come un campo scalare in x e y, ma come una funzione invariante di x e y, con una dipendenza funzionale ben definita. Questa funzione deve essere la stessa in ogni sistema di riferimento, altrimenti due correnti con la stessa dipendenza funzionale in due diversi sistemi di riferimento, darebbero luogo a potenziali con dipendenze funzionali diverse, in contrasto con il principio di relativit`a einsteiniana. In altre parole, deve valere G(x0 , y 0 ) = G(x, y), e non G0 (x0 , y 0 ) = G(x, y).

167

Scegliendo poi aµ = 0 e Λµ ν generico, si trova che G(x) deve essere invariante per trasformazioni di Lorentz proprie

26

, ∀ Λµ ν ∈ SO(1, 3)c .

G(Λx) = G(x),

(6.29)

In particolare vediamo allora che la (6.28) pu`o essere scritta nella forma prevista dal metodo della funzione di Green, Z µ

d4 y G(x − y) j µ (y),

A (x) =

(6.30)

ovvero, in notazione compatta, Aµ = G ∗ j µ .

(6.31)

Sostituendo infine la (6.30) nella (6.25) si trova, Z µ 2A (x) = d4 y 2G(x − y) j µ (y) = j µ (x), che comporta per la funzione di Green l’equazione, 2G(x) = δ 4 (x).

(6.32)

La soluzione dell’equazione di Maxwell `e quindi ricondotta alla soluzione di questa equazione, compatibilmente con il vincolo (6.29). Tuttavia, si pu`o vedere che le condizioni (6.29) e (6.32) non determinano ancora la funzione di Green univocamente. Aggiungiamo a questo punto una richiesta fisica, concernente la propagazione causale del campo elettromagnetico: richiediamo che il potenziale Aµ (x) nel punto x non possa dipendere dai valori della corrente j µ (y) in punti y che sono temporalmente successivi a x, ovverosia, punti per cui x0 < y 0 . Questo vuol dire che deve essere G(x − y) = 0 per x0 < y 0 , ovvero, G(x) = 0,

∀ t < 0.

Vedremo che con questa richiesta aggiuntiva le (6.29) e (6.32) ammettono un’unica soluzione. La funzione di Green risultante viene chiamata “funzione di Green ritardata”, e viene indicata con Gret . 26

Tra un attimo spiegheremo il motivo per cui G non pu`o essere invariante sotto l’intero gruppo di Lorentz.

168

Per spiegare la nomenclatura osserviamo che in certe analisi teoriche si introduce anche la “funzione di Green avanzata”, definita da, Gadv (x) = 0,

∀ t > 0,

(6.33)

alla quale si pu`o associare la soluzione formale, Aµadv = Gadv ∗ j µ . Tuttavia, non rispettando la causalit`a questa soluzione non giocher`a nessun ruolo nella nostra trattazione. 6.2.1

La funzione di Green ritardata

La funzione di Green ritardata `e definita dalle condizioni, 2G(x) = δ 4 (x), G(Λx) = G(x),

(6.34) ∀ Λ ∈ SO(1, 3)c ,

G(x) = 0, ∀ t < 0.

(6.35) (6.36)

Prima di procedere alla soluzione di questo sistema di equazioni, dimostriamo che la soluzione, se esiste `e, unica. Unicit`a della funzione di Green. Per dimostrare l’unicit`a della funzione di Green `e sufficiente dimostrare che non esistono soluzioni dell’equazione delle onde – l’equazione omogenea associata – 2F = 0,

(6.37)

soddisfacenti (6.35) e (6.36). Determineremo prima tutte le soluzioni della (6.37) soddisfacenti la (6.35), ovvero F (Λx) = F (x), e alla fine imporremo la (6.36). Per eseguire questa analisi `e conveniente passare in trasformata di Fourier, F (x) → Fb(k). La Lorentz– invarianza di F (x) si traduce allora semplicemente nella Lorentz–invarianza di Fb(k), come funzione di k µ . Infatti, eseguendo il cambiamento di variabili x = Λy, d4 x = d4 y, si ha, Z Z 1 1 4 −i Λk·x d xe F (x) = d4 y e−i Λk·Λy F (Λy) (2π)2 (2π)2 Z 1 d4 y e−i k·y F (y) = Fb(k). = (2π)2

Fb(Λk) =

169

Dobbiamo dunque risolvere il sistema, k 2 Fb(k) = 0,

Fb(Λk) = Fb(k),

∀ Λ ∈ SO(1, 3)c .

In realt`a l’equazione delle onde `e stata risolta in tutta generalit`a in sezione 5.2, e possiamo quindi ricorrere ai risultati di quella sezione. Avevamo trovato che le soluzioni cadono in due classi, rispettivamente, FbI = δ(k 2 )f (k) N X b FII = C µ1 ···µn ∂µ1 · · · ∂µn δ 4 (k),

(6.38) Cν νµ3 ···µn = 0,

(6.39)

n=1

dove i tensori C µ1 ···µn sono completamente simmetrici. Si tratta allora di selezionare da ciascuna di queste classi le soluzioni Lorentz–invarianti. Per quanto riguarda le soluzioni di tipo I osserviamo che, per l’invarianza per rotazioni spaziali, f pu`o dipendere solo da k 0 = ±|~k|. Ma le uniche funzioni di k 0 Lorentz–invarianti sul cono luce, sono la costante e la funzione segno ε(k 0 ). Tenendo conto della condizione di realt`a Fb ∗ (k) = Fb(−k), si ottengono cos`ı le due soluzioni linearmente indipendenti, Fb1 = δ(k 2 ),

Fb2 = i ε(k 0 ) δ(k 2 ).

Per quanto riguarda invece le soluzioni di tipo II osserviamo che l’invarianza di Lorentz impone che i tensori completamente simmetrici C µ1 ···µn devono essere tensori Lorentz– invarianti. I tensori di rango dispari devono allora essere nulli, mentre quelli di rango pari devono essere proporzionali al prodotto completamente simmetrizzato di metriche di Minkowski. Deve essere, cio`e, C µ1 ···µn = an η (µ1 µ2 · · · η µn−1 µn ) , dove gli an sono costanti. Ma questi tensori devono essere anche a traccia nulla, vedi (6.39), Cν νµ3 ···µn =

(n + 2) an (µ3 µ4 η · · · η µn−1 µn ) = 0. n−1

Ne segue che deve essere an = 0 per n 6= 0. Per n = 0 otteniamo invece una terza soluzione indipendente, Fb3 = δ 4 (k). 170

Si noti che queste tre soluzioni si possono ottenere formalmente dalla (5.29), scegliendo rispettivamente ε(~k) = 1, i, ω δ 3 (~k). Le antitrasformate delle Fbi possono essere valutate analiticamente, e noi le riportiamo senza dimostrazione: µ ¶ 1 1 F1 = − P , π x2 F2 = −ε(t) δ(x2 ), 1 F3 = , (2π)2 dove “P ” indica la parte principale rispetto alla variabile x0 . Si vede che tutte e tre le soluzioni sono invarianti per SO(1, 3)c , come da costruzione, ma nessuna di esse soddisfa la condizione di causalit`a (6.36). La funzione di Green ritardata, se esiste, `e quidi unica. Determinazione della funzione di Green ritardata. Determiniamo ora la soluzione del sistema (6.34)–(6.36). Notiamo innanzitutto che l’invarianza per rotazioni spaziali, G(t, R ~x) = G(t, ~x),

∀ R ∈ SO(3),

implica che G pu`o dipendere da ~x solo attraverso la variabile r = |~x|, G = G(t, r). Poniamoci ora nella regione ~x 6= 0, t arbitrario. In questa regione si deve avere 2G = 0. Per ~x 6= 0 `e lecito usare coordinate polari, e scrivere il Laplaciano come nel problema 5.7. Sfruttando il fatto che G non dipende dagli angoli si ottiene allora, µ ¶ ¢ 1 2 1¡ 2 2 2G = ∂t − ∂r r G = ∂t − ∂r2 (rG) = 0, r r

(6.40)

che corrisponde all’equazione delle onde in una dimensione. Ricordando la forma della sua soluzione generale, vedi problema 5.8, abbiamo dunque, G(t, r) =

1 (f (t − r) + g(t + r)) , r

dove f e g sono funzioni arbitrarie di una variabile. Ma siccome G deve annullarsi ∀ t < 0 dobbiamo scegliere g = 0, e restiamo con, G=

1 f (t − r). r 171

Per determinare f imponiamo ora che G soddisfi l’equazione del kernel (6.34) “in tutto lo spazio”, ovvero, nel senso delle distribuzioni, ∂t2 G − ∇2 G = δ 3 (~x) δ(t).

(6.41)

Indicando la derivata della f rispetto al suo argomento con un “primo”, abbiamo intanto, ∂t2 G =

1 00 f (t − r). r

Per valutare invece il Laplaciano occorre procedere con un po’ di cautela, per via della singolarit`a in r = 0 del fattore 1/r. Possiamo comunque applicare la regola di Leibnitz per le derivate, se supponiamo che f (t − r) sia regolare in r = 0, propriet`a che verificheremo a posteriori, µ 2

∇ G=



21



r

µ ¶ ³ ´ 1 2 1 ~ ~ f (t − r) + ∇ f (t − r) + 2 ∇ · ∇ f (t − r) . r r

Per funzioni invarianti per rotazioni e regolari in r = 0, possiamo usare la forma del Laplaciano utilizzata in (6.40). Abbiamo quindi, ∇2 f (t − r) =

1 2 2 ∂r (rf (t − r)) = f 00 (t − r) − f 0 (t − r). r r

Ricordiamo poi che nel senso delle distribuzioni si ha, ~ 1 = − ~x , ∇ r r3

∇2

1 = −4π δ 3 (~x), r

e che ~ (t − r) = − ~x f 0 (t − r). ∇f r Si vede allora che le derivate prime di f si cancellano e rimane, ∇2 G = −4π δ 3 (~x) f (t) +

1 00 f (t − r). r

La (6.41) si riduce allora a, ¡

¢ ∂t2 − ∇2 G = 4πδ 3 (~x)f (t) = δ 3 (x) δ(t),

e quindi deve essere, f (t) =

1 δ(t). 4π

172

Concludiamo che la funzione di Green ritardata `e data da, Gret =

1 δ(t − r). 4πr

(6.42)

Questa espressione soddisfa la (6.36), ma non sembra soddisfare (6.35). In realt`a, ricordando l’identit`a, δ(x2 ) = δ(t2 − r2 ) =

1 [δ(t − r) + δ(t + r)] , 2r

possiamo riscrivere la (6.42) nella forma manifestamente Lorentz–invariante, Gret =

1 H(x0 ) δ(x2 ). 2π

(6.43)

Analogamente per la funzione di Green avanzata (6.33) si otterrebbe, 1 δ(t + r) 4πr 1 H(−x0 ) δ(x2 ). = 2π

Gadv =

(6.44) (6.45)

In definitiva abbiamo dunque ottenuto due funzioni di Green soddisfacenti (6.34) e (6.35), entrambi appartenenti ad S 0 , vedi problema 6.1. In particolare vale quindi, 2Gret = δ 4 (x), 2Gadv = δ 4 (x). A priori avremmo quindi potuto scegliere come funzione di Green qualsiasi combinazione del tipo, G = α Gret + (1 − α) Gadv ,

2G = δ 4 (x),

con α numero reale arbitrario, ma la condizione di causalit`a (6.36) seleziona il valore α = 1 ! D’ora in poi al posto di Gret scriveremo semplicemente G. Osserviamo inoltre che c’`e un semplice legame tra i kernel avanzati e ritardati, e il kernel antisimmetrico D introdotto nel paragrafo 5.2.1, vedi (5.43). Vale infatti, D = Gret − Gadv ,

(6.46)

da cui discende immediatamente l’equazione caratteristica del kernel antisimmetrico, 2D = 0, che lo identifica come “propagatore” delle onde elettromagnetiche libere. 173

6.2.2

Il potenziale vettore ritardato

Inserendo la (6.43) nella (6.30) otteniamo cos`ı il “potenziale ritardato” Aµ ≡ Aµret , 1 A (x) = 2π µ

Z d4 y H(x0 − y 0 ) δ((x − y)2 )j µ (y),

(6.47)

in forma covariante a vista. Usando invece la (6.42) possiamo integrare sulla coordinata y 0 e riscriverlo come, Z 1 1 d4 y A (t, ~x) = δ(t − y 0 − |~x − ~y |) j µ (y 0 , ~y ) 4π |~x − ~y | Z 1 1 = d3 y j µ (t − |~x − ~y |, ~y ). 4π |~x − ~y | µ

(6.48)

In seguito faremo uso sia della (6.47) che della (6.48); la prima scrittura ha il pregio di essere manifestamente Lorentz–invariante, la seconda quello di contenere un’integrazione in meno. Resta allora da imporre la condizione di gauge–fixing (6.26), che abbiamo lasciato in sospeso. La soluzione appena scritta, con i criteri imposti, ha il carattere di unicit`a. Per consistenza la condizione di Lorentz dovrebbe allora essere soddisfatta automaticamente. In realt`a questo `e quello che succede. Per farlo vedere `e sufficiente ricorrere alla (6.31) e usare le propriet`a della convoluzone del paragrafo 2.3.2, ∂µ Aµ = ∂µ (G ∗ j µ ) = G ∗ ∂µ j µ = 0, dove abbiamo sfruttato la conservazione della quadricorrente. Si noti che il potenziale Aµ = G ∗ j µ soddisfa la gauge di Lorentz indipendentemente dalla forma di G. Funzioni di Green e causalit` a. Analizziamo ora brevemente la struttura causale della soluzione (6.47). Abbiamo derivato questa formula imponendo la “condizione minimale” che la funzione di Green si annulli per tempi negativi, assicurando cos`ı che eventi futuri non possano influenzare eventi passati. D’altra parte una semplice richiesta di questo tipo `e in palese conflitto con la Relativit`a Ristretta, perch´e in generale l’ordinamento temporale tra due eventi non viene preservato da una trasformazione di Lorentz. Per preservare l’ordinamento temporale bisogna imporre una condizione ulteriore, cio`e, che due eventi possano influenzarsi solo se sono a distanza di tipo tempo o nullo. Infatti,

174

secondo la causalit`a relativistica un evento y pu`o influenzare un evento x, solo se valgono le due condizioni, (x − y)2 ≥ 0,

x0 ≥ y 0 ,

che definiscono il cone luce futuro di y – insieme che sappiamo essere invariante sotto trasformazioni di Lorentz proprie, vedi paragrafo 5.3.3. L’evento y pu`o quindi influenzare l’evento x, solo se x appartiene al cono luce futuro di y. Corrispondentemente una generica funzione di Green causale e relativistica deve godere delle propriet`a minimali, G(x) = 0,

∀ t < 0.

G(x) = 0,

∀ x2 < 0.

La funzione di Green (6.43) dell’equazione di Maxwell non solo possiede queste propriet`a, ma `e anche supportata interamente sul bordo del cono luce. Come conseguenza nella (6.47) il potenziale vettore in un punto x `e causalmente connesso solo con punti y della corrente che stanno a distanze di tipo luce da x, e che appartengono al passato di x. Concludiamo che nel campo elettromagnetico l’informazione si propaga dalle particelle cariche al punto di osservazione con la velocit`a della luce, e non viceversa. Vedremo che sar`a proprio questa asimmetria per inversione temporale, imposta dalla causalit`a, a dar luogo – in ultima analisi – al fenomeno dell’irraggiamento, ovvero, dell’emissione di radiazione da parte di particelle cariche accelerate. Nel paragrafo 6.4.3 vedremo, infatti, che per via di questa asimmetria le particelle accelerate emettono energia – e non la assorbono. Il ritardo. Concludiamo questo paragrafo con un ulteriore commento sulla struttura relativistica della (6.48), confrontandola con la soluzione (6.13) dell’equazione di Poisson. Riportiamo la (6.13) nell’interpretazione dell’Elettrostatica, “accendendo” il tempo, 1 A (t, ~x) = 4π 0

Z d3 y

1 j 0 (t, ~y ). |~x − ~y |

(6.49)

Per confrontare questa espressione con la (6.48) riscriviamo anche quest’ultima, reinserendo le potenze della velocit`a della luce. Risulta, 1 A (t, ~x) = 4π µ

Z

µ ¶ 1 |~x − ~y | µ dy j t− , ~y . |~x − ~y | c 3

175

y| Vediamo che l’unica differenza tra le due formule `e la comparsa del “ritardo” − |~x−~ , nelc

l’argomento temporale della corrente. Questo termine corrisponde esattamente al tempo che la luce impiega per passare dal punto ~y in cui `e situata la carica, al punto di osservazione ~x, dove si valuta il campo. Il campo all’istante t nel punto ~x dipende quindi dal valore della corrente nel punto ~y , all’istante “ritardato” t0 = t −

|~ x−~ y| . c

Nel potenziale

elettrostatico (6.49) si suppone, invece, un’interazione non locale a distanza, e il ritardo viene trascurato. 6.2.3

Validit` a della soluzione e trasformata di Fourier

In questo paragrafo discuteremo brevemente i limiti di validit`a della soluzione formale (6.47), o alternativamente della (6.31), date le singolarit`a presenti necessariamente in una corrente j µ di particelle puntiformi. Dato che G ∈ S 0 , la soluzione (6.31), Aµ = G ∗ j µ ,

(6.50)

`e in effetti ben definita in S 0 , purch´e j µ stia in S, come supposto in (6.27). Ma in realt`a sappiamo che le correnti fisiche non stanno in S, ma in S 0 , e per di pi` u questa volta esse non sono nemmeno a supporto a compatto – come succedeva invece nel caso dell’equazione di Poisson – semplicemente perch´e la corrente j µ in generale `e diversa da zero per qualsiasi −∞ < t < +∞ ! Non possiamo quindi pi` u applicare il teorema di Paley–Wiener, come in sezione 6.1. Ciononostante, come in quel caso possiamo cercare di dare un senso alla (6.50), passando in trasformata di Fourier. Senza dimostrazione riportiamo le formule per le trasformate di Fourier in S 0 dei kernel ritardati e avanzati, ¶ µ µ ¶ 1 1 0 2 bret (k) = − P + i π ε(k ) δ(k ) G (2π)2 k2 µ µ ¶ ¶ 1 1 0 2 badv (k) = − G P − i π ε(k ) δ(k ) . (2π)2 k2

(6.51) (6.52)

Si noti, comunque, la compatibilit`a di queste formule con la trasformata di Fourier dell’equazione del kernel (6.32), e con le (5.42), (6.46). A questo punto possiamo eseguire esplicitamente la trasformata di Fourier della (6.50), µ µ ¶ ¶ 1 µ 2 b µ 0 2 b b A (k) = (2π) Gret (k) j (k) = − P + i π ε(k ) δ(k ) b j µ (k). (6.53) k2 176

Come anticipato sopra, la trasformata della corrente, b j µ (k), in generale non appartiene ad OM , e quindi non `e garantito che il prodotto a secondo membro sia ben definito. Illustriamo la situazione, considerando la corrente di una particella carica in moto rettilineo uniforme, y µ (λ) = uµ λ,

Z µ

j (x) = e u

µ

dλ δ 4 (x − u λ).

La sua trasformata di Fourier `e facile da valutare, e uµ b j µ (k) = (2π)2

Z

Z 4

d xe

−ik·x

e uµ dλ δ (x − u λ) = (2π)2 4

Z dλ e−ik·u λ =

e uµ δ(u · k), 2π

e come si vede, essa non appartiene a OM , bens`ı a S 0 . Ciononostante, in certi casi il prodotto formale (6.53), ovvero l’espressione, µ µ ¶ ¶ e uµ 1 µ 0 2 b A (k) = − P + i π ε(k ) δ(k ) δ(u · k), 2π k2

(6.54)

possono essere comunque ben definiti in S 0 . Per vedere quando questo succede consideriamo separatamente i casi di particelle massive, e particelle prive di massa. a) Traiettorie di tipo tempo. Per una particella massiva la traiettoria `e di tempo, e possiamo porci nel suo sistema di riferimento a riposo. In questo sistema abbiamo uµ = (1, 0, 0, 0) e δ(u · k) = δ(k 0 ). Il secondo termine del prodotto (6.54) `e allora nullo, in quanto, ε(k 0 ) δ(k 2 ) δ(u · k) =

´ 1 ³ 0 ~ δ(k − |k|) − δ(k 0 + |~k|) δ(k 0 ) = 0. 2|~k|

(6.55)

La (6.54) si riduce allora a, µ bµ

A (k) = −P

1 k2



e uµ e uµ δ(k 0 ) = δ(k 0 ), 2 ~ 2π 2π|k|

che appartiene effettivamente a S 0 . In realt`a in questo caso `e anche immediato determinare bµ (k) esplicitamente – si veda la (6.17) – per ottenere il l’antitrasformata di Fourier di A noto potenziale coulombiano, Aµ (x) =

e uµ . 4π|~x|

(6.56)

Similmente si pu`o vedere che il prodotto (6.53) definisce una distribuzione temperata, se la corrente j µ (x) corrisponde a un’arbitraria linea d’universo di tipo tempo. E in questi casi vedremo esplicitamente che anche le rappresentazioni integrali (6.47) e (6.48) sono sempre 177

ben definite – motivo per cui d’ora in poi ci serviremo sempre di queste rappresentazioni esplicite. b) Traiettorie di tipo luce. Per una particella carica priva di massa la quadrivelocit`a soddisfa u2 = 0, e possiamo metterci nel sistema di riferimento in cui uµ = (1, 0, 0, 1), sicch´e δ(u · k) = δ(k 0 − k 3 ). In questo caso avremmo, al posto di (6.55), ε(k 0 ) δ(k 2 ) δ(u · k) = ε(k 0 ) δ((k 1 )2 + (k 2 )2 ) δ(k 0 − k 3 ). A questa espressione formale si pu`o associare un elemento di S 0 , ponendo, δ((k 1 )2 + (k 2 )2 ) = π δ(k 1 ) δ(k 2 ). Questa identificazione emerge se si applica il primo membro a una funzione di test di p S(R2 ). Usando coordinate polari bidimensionali (ϑ, ρ = (k 1 )2 + (k 2 )2 ), si ottiene infatti, Z Z 2π Z ∞ 2 1 2 2 2 1 2 d k δ((k ) + (k ) ) ϕ(k , k ) = dϑ ρ dρ δ(ρ2 ) ϕ(ρ, ϑ) 0 0 Z Z ∞ 1 2π dϑ dρ2 δ(ρ2 ) ϕ(ρ, ϑ) = π ϕ(0). = 2 0 0 La (6.54) diventerebbe allora, µ ¶ 1 e uµ µ 2 3 1 2 b A (k) = − i π ε(k ) δ(k ) δ(k ) δ(k 0 − k 3 ), 2π (k 1 )2 + (k 2 )2

(6.57)

che non appartiene a S 0 . Infatti, mentre il secondo addendo sta in S 0 , la funzione, (k 1 )2

1 , + (k 2 )2

non `e localmente integrabile in R4 , e non ammette nessuna regolarizzazione in S 0 . Per una particella priva di massa il prodotto (6.53) non costituisce, dunque, una distribuzione. In questo caso questa formula, e la (6.47), sono prive di senso e devono essere abbandonate – insieme al metodo della funzione di Green. Nondimeno vedremo che le (6.25), (6.26) ammettono soluzioni ben definite nel senso delle distribuzioni, anche per particelle prive di massa, e le determineremo esplicitamente in sezione 6.3.2 seguendo una strada alternativa.

6.3

Campo di una particella in moto rettilineo uniforme

Come prima applicazione della formula (6.47), in questa sezione calcoleremo il campo elettromagnetico creato da una particella carica in moto rettilineo uniforme. Tratteremo 178

separatamente i casi di particelle massive e particelle prive di massa. Nel primo caso il campo potrebbe essere calcolato anche attraverso una trasformazione di Lorentz dal sistema a riposo della particella, dove, ~ = e ~x , E 4π r3

~ = 0, B

al sistema di riferimento del laboratorio, vedi problema 6.3. Tuttavia, questa procedura romperebbe l’invarianza di Lorentz manifesta. Nel secondo caso – per di pi` u – questa procedura non sarebbe nemmeno applicabile, perch´e non esiste nessun sistema di riferimento in cui una particella di massa nulla `e a riposo. Nel paragrafo 6.3.2 vedremo comunque che il campo di una particella priva di massa pu`o essere dedotto da quello di una particella massiva, attraverso un’opportuna procedura di limite nel senso delle distribuzioni, superando cos`ı le difficolt`a menzionate alle fine della sezione precedente. 6.3.1

Campo di una particella massiva

Secondo la (6.47) come prima cosa dobbiamo esplicitare la forma della corrente j µ (y) associata a una particella in moto rettilineo uniforme. La linea di universo di una particella con quadrivelocit`a costante si scrive, y µ (s) = y µ (0) + uµ s,

u2 = 1,

e se scegliamo l’origine del sistema di riferimento in modo tale che a t = 0 la particella passi per l’origine, abbiamo pi` u semplicemente, y µ (s) = uµ s. Per la quadricorrente si ottiene allora, Z Z µ µ 4 µ j (y) = e ds u δ (y − y(s)) = e u ds δ 4 (y − u s). Sostituendo nella (6.47) otteniamo allora, Z Z e µ 4 µ d y ds H(x0 − y 0 ) δ((x − y)2 ) δ 4 (y − us) u A (x) = 2π Z e µ = u ds H(x0 − su0 ) δ((x − us)2 ) 2π Z e µ = u ds H(x0 − su0 ) δ(f (s)). 2π 179

(6.58)

(6.59)

Abbiamo definito la funzione di s, f (s) ≡ (x − us)2 = x2 − 2 s (ux) + s2 ,

(u x) ≡ uµ xµ ,

sottintendendo la dipendenza da xµ e uµ . Per valutare l’integrale della (6.59) dobbiamo esplicitare la distribuzione δ(f (s)) in base alla (2.37), e quindi dobbiamo preventivamente individuare gli zeri della f . Essendo quadratica f (s) ha due zeri, s± = (u x) ∓

p

(ux)2 − x2 ,

f (s± ) = 0,

(6.60)

entrambi reali. La quantit`a scalare (ux)2 − x2 `e, infatti, sempre maggiore o uguale a zero. Per rendercene conto possiamo sfruttare l’invarianza di Lorentz e valutarla nel sistema di riferimento in cui la particella `e a riposo, dove si ha uµ = (1, ~0). Si ottiene allora, (ux)2 − x2 = (x0 )2 − ((x0 )2 − |~x|2 ) = |~x|2 ≥ 0.

(6.61)

Secondo la (2.37) abbiamo allora, δ(f (s)) =

δ(s − s+ ) δ(s − s− ) + . |f 0 (s+ )| |f 0 (s− )|

(6.62)

Essendo, f 0 (s) = 2(s − ux), abbiamo inoltre, |f 0 (s± )| = 2

p (ux)2 − x2 .

Inserendo questi elementi nella (6.59) si ottiene allora, Z ¡ ¢ e uµ µ p A (x) = ds H(x0 − s+ u0 ) δ(s − s+ ) + H(x0 − s− u0 ) δ(s − s− ) . 4π (ux)2 − x2 Per valutare l’integrale rimanente dobbiamo studiare i segni di x0 −s± u0 . Per farlo usiamo argomenti di covarianza. Se definiamo i quadrivettori, V±µ = xµ − s± uµ , per costruzione questi vettori appartengono al cono luce, V±2 = 0. Il segno delle componenti temporali V±0 = x0 − s± u0 `e allora un invariante di Lorentz, e possiamo determinarlo nel riferimento a riposo della particella. In questo riferimento abbiamo, vedi (6.60) e (6.61), s± = x0 ∓ |~x|



V±0 = x0 − s± u0 = ±|~x|. 180

Concludiamo che in qualsiasi riferimento vale, x0 − s+ u0 > 0,

x0 − s− u0 < 0.

Di conseguenza, H(x0 − s+ u0 ) = 1,

H(x0 − s− u0 ) = 0.

Si ottiene quindi, Aµ (x) =

e uµ p , 4π (ux)2 − x2

(6.63)

formula manifestamente Lorentz–invariante. Vediamo in particolare che per la particella statica, uµ = (1, 0, 0, 0), riotteniamo il noto potenziale coulombiano, vedi anche (6.56), A0 =

e , 4π|~x|

~ = 0. A

(6.64)

Infine possiamo calcolare il campo elettromagnetico. Dato che si ha, e xµ − uµ (ux) ν u , ∂ A = 4π ((ux)2 − x2 )3/2 µ

ν

(6.65)

risulta, F µν = ∂ µ Aν − ∂ ν Aµ =

e x µ uν − x ν uµ . 4π ((ux)2 − x2 )3/2

(6.66)

Contraendo invece nella (6.65) µ con ν, si verifica che il potenziale soddisfa la gauge di Lorentz ∂µ Aµ = 0, come da costruzione. ~ e B. ~ Partendo dalla (6.66) analizzeremo ora le propriet`a generali dei campi I campi E elettrico e magnetico prodotti da una particella in moto rettilineo uniforme, confrontandoli in particolare con i campi di una particella non relativistica, v ¿ 1. Analizzeremo poi questi campi anche nel regime opposto, quello ultrarelativistico, corrispondente a una particella che si muove con velocit`a prossima a quella della luce. ~ eB ~ a partire dalla (6.66), Cominciamo con il calcolo di E E i = F i0 =

e x i u0 − x 0 ui e u0 xi − v i t = . 4π ((ux)2 − x2 )3/2 4π ((ux)2 − x2 )3/2

1 1 e kij xi uj − xj ui e u0 kij v i xj B k = − εkij F ij = − ε = ε 2 2 4π ((ux)2 − x2 )3/2 4π ((ux)2 − x2 )3/2 e u0 kij v i (xj − v j t) ε = εkij v i E j . (6.67) = 4π ((ux)2 − x2 )3/2 181

Abbiamo, cio`e, ripristinando la velocit`a della luce, ~ = ~v × E. ~ B c

(6.68)

In ogni punto il campo magnetico `e dunque una semplice funzione del campo elettrico, ed `e quindi sufficiente analizzare quest’ultimo. In particolare vediamo che rispetto al campo elettrico il campo magnetico `e soppresso di un fattore v/c, in accordo con il fatto che il secondo rappresenta un effetto dinamico. Per analizzare la forma del campo elettrico `e conveniente introdurre il vettore, ~ = ~x − ~v t, R congiungente in ogni istante t il punto di osservazione ~x con la posizione ~y (t) = ~v t della particella. Con semplice algebra si trova allora, (ux)2 − x2 = e quindi,

~ 2 − v 2 R2 R2 + (~v · R) , 1 − v2

~ (1 − v 2 )R ~ = e E . ~ 2 − v 2 R2 )3/2 4π (R2 + (~v · R)

(6.69)

~ il campo elettrico si pu`o scrivere come, Se introduciamo infine l’angolo ϑ tra ~v e R, ~ = E

(1 − v 2 ) ~ nr , E (1 − v 2 sen2 ϑ)3/2

(6.70)

dove abbiamo introdotto il campo coulombiano non relativistico, ~ ~ nr = e R . E 4π R3 Analizziamo ora le propriet`a del campo elettrico ottenuto. Intanto vediamo che per ~ decade come 1/r2 , come il campo coulombiano non ogni t fissato, a grandi distanze E relativistico, e quindi abbiamo l’andamento asintotico, F µν ∼

1 , r2

per r → ∞.

(6.71)

~ `e ancora un campo centrale, cio`e, `e diretto lungo la retta passante per la posizione Inoltre E della particella e il punto di osservazione. Tuttavia, questo campo non `e pi` u a simmetria sferica come il campo coulombiano non relativistico, perch´e il suo modulo ora dipende 182

~ rispettivamente ortogonale (ϑ = π/2) e parallelo (ϑ = 0, π) dalla direzione. Infatti, per R a ~v , la (6.70) d`a per i corrispondenti moduli del campo elettrico, 1 Enr > Enr , 1 − v2 = (1 − v 2 ) Enr < Enr .

E⊥ = √

(6.72)

Ek

(6.73)

Lungo la direzione del moto il campo risulta quindi schiacciato, in entrambi i versi, mentre lungo le direzioni ortogonali al moto il campo risulta potenziato. In particolare, per velocit`a che si approssimano alla velocit`a della luce il primo svanisce, mentre il secondo va a infinito. Difatti per velocit`a molto elevate il campo elettromagnetico `e praticamente nullo in tutte le direzioni, tranne per valori di ϑ molti vicini a π/2. Vista la (6.68), risultati analoghi valgono per il modulo del campo magnetico. Dato ~ `e radiale, questa formula ci dice inoltre che le linee di campo di B ~ sono circonferenze che E ortogonali alla traiettoria della particella, e concentriche con essa. 6.3.2

Campo di una particella di massa nulla

Abbiamo dedotto il campo (6.66) nell’ipotesi che la velocit`a della particella sia costante, ma minore di quella della luce. In questo paragrafo affrontiamo il problema del campo elettromagnetico generato da una particella carica di massa nulla, che viaggia dunque con la velocit`a della luce. Per le peculiarit`a dei campi di una particella ultrarelativistica, appena messe in evidenza, ci aspettiamo campi con singolarit`a molto pronunciate, ai quali si potr`a dare senso solo nello spazio delle distribuzioni. Per una particella che viaggia con la velocit`a della luce il tempo proprio non `e definito, e dobbiamo parametrizzare la sua linea di universo con un parametro λ generico. Se introduciamo il quadrimomento pµ della particella possiamo parametrizzarla secondo, y µ (λ) = pµ λ,

p2 = 0,

p0 = |~p| > 0,

dove di nuovo abbiamo supposto che per t = 0 la particella passi per l’origine. La direzione del moto `e allora, ~n =

p~ , |~p|

183

e la traiettoria tridimensionale `e data da ~y (t) = ~n t. Per quello che segue `e conveniente definire anche il vettore nullo, nµ = (1, ~n) =

pµ , p0

n2 = 0.

La quadricorrente della particella `e comunque data da, Z µ

J (x) = e p

µ

δ 4 (x − λp) dλ = e nµ δ 3 (~x − ~n t),

e il sistema di equazioni da risolvere `e, ∂µ F µν = J ν ,

∂[µ Fνρ] = 0.

(6.74)

Una procedura di limite. Vogliamo ora derivare la soluzione di questo sistema dai risultati del paragrafo precedente, con un’opportuna procedura di limite. Ponendo nella (6.58) ~v = v ~n e ricordando le (2.40), (2.41) per una particella singola, si vede intanto che abbiamo il limite in S 0 (R4 ), S 0 − lim j µ = J µ . v→1

Siccome il tensore F µν definito in (6.66) soddisfa per costruzione, ∂µ F µν = j ν ,

∂[µ Fνρ] = 0,

e siccome le derivate costituiscono operazioni continue in S 0 , se esiste il limite di F µν per v → 1 nel senso delle distribuzioni, allora il tensore, F µν ≡ S 0 − lim F µν ,

(6.75)

v→1

soddisfa automaticamente le (6.74). Insistiamo sul fatto che questa strategia ha senso solo se i limiti di cui sopra vengono eseguiti nel senso delle distribuzioni: si noti in particolare che il limite puntuale di F µν `e nullo quasi ovunque, vedi (6.69). Affrontiamo ora la determinazione del limite (6.75), partendo non direttamente dalla (6.66) ma dall’espressione del potenziale (6.63), che appare pi` u semplice. Se questo potenziale ammettesse limite nel senso delle distribuzioni, potremmo infatti scrivere, ´ ³ ´ ³ S 0 − lim F µν = ∂ µ S 0 − lim Aν − ∂ ν S 0 − lim Aµ . v→1

v→1

184

v→1

Ora, eseguendo il limite puntuale della (6.63) si ottiene in effetti il risultato finito, lim Aµ (x) =

v→1

e nµ , 4π |(n x)|

(n x) = t − ~n · ~x,

ma questa espressione non costituisce una distribuzione! Vedremo tra poco che in realt`a il limite di Aµ nel senso delle distribuzioni non esiste – in accordo con il fatto che l’espressione (6.57) non costituisce una distribuzione. Sorge allora la domanda se F µν ammette effettivamente limite in S 0 , oppure no. La risposta pu`o essere ancora affermativa se la parte di Aµ che “diverge” per v → 1 in S 0 , in qualche modo non contribuisce a F µν . A questo proposito ricordiamo in effetti che il potenziale `e definito solo modulo una trasformazione di gauge. Affinch´e F µν ammetta un limite ben definito `e allora sufficiente che la parte divergente del potenziale possa essere eliminata con una trasformazione di gauge. Consideriamo, per esempio, una trasformazione di gauge con parametro, ¯ ¯ p e ¯ ¯ 2 2 Λ= ln ¯(ux) − (ux) − x ¯ . 4π

(6.76)

Con un semplice calcolo si trova che il potenziale trasformato, del tutto equivalente a (6.63) ma non pi` u soddisfacente la gauge di Lorentz, `e dato da, ! Ã xµ e (ux) eµ = Aµ + ∂ µ Λ = eν − ∂ ν A eµ , A 1+ p , F µν = ∂ µ A 2 2 2 4π x (ux) − x

(6.77)

dove con 1/x2 intendiamo la sua parte principale. Grazie al limite puntuale, lim p

v→1

(ux) (ux)2 − x2

= ε(nx),

dove ε(·) indica la distribuzione segno, non `e difficile vedere che il limite distribuzionale del potenziale trasformato ora `e ben definito, e che coincide semplicemente con il suo limite puntuale, eµ = Aµ ≡ S 0 − lim A v→1

e xµ H(n x). 2π x2

(6.78)

eµ ammette limite per v → 1, mentre nello stesso limite il parametro di gauge Λ Dato che A diverge, vedi (6.76), risulta ora anche chiaro perch´e (6.63) non poteva ammettere limite. Usando le (6.77), (6.78), possiamo ora determinare il campo elettromagnetico creato da una particella carica di massa nulla, in moto in direzione ~n, µ ν ν µ eµ ) = ∂ µ Aν − ∂ ν Aµ = e n x − n x δ(n x). eν − ∂ ν A F µν = S 0 − lim F µν = S 0 − lim (∂ µ A v→1 v→1 2π x2

185

Per i campi elettrico e magnetico si ottiene allora facilmente, e ~x − ~n t E~ = − δ(n x), 2π x2

~ B = ~n × E,

~n · E = 0.

(6.79)

In particolare per i “moduli” vale E = B. Se vede che in ogni istante i campi sono diversi da zero solo sul piano passante per la posizione della particella in quell’istante, e perpendicolare alla sua velocit`a. Per esempio, se la particella si muove lungo l’asse z si ha, e (x, y, 0) δ(z − t), + y2) e B~ = (−y, x, 0) δ(z − t), 2 2π(x + y 2 ) E~ =

(6.80)

2π(x2

(6.81)

e all’istante t i campi sono non nulli solo sul piano z = t, dove sono “molto intensi”, cio`e, proporzionali alla δ di Dirac. Ricordiamo poi che per costruzione questi campi soddisfano le equazioni di Maxwell. Si verifica per esempio facilmente che vale, vedi problema 6.4, ~ · E~ = e δ(x) δ(y) δ(z − t) = j 0 (x), ∇

~ · B~ = 0. ∇

(6.82)

Infine, se si vuole nuovamente ottenere un potenziale nella gauge di Lorentz, `e sufficiente eseguire un’altra trasformazione di gauge, Aeµ = Aµ − ∂ µ

³ e ¯ 2 ¯´ e H(n x) ln ¯x ¯ = − ln |x2 | δ(n x) nµ , 4π 4π

∂µ Aeµ = 0.

Shock waves. Campi del tipo (6.79) vengono chiamati “shock waves”, perch´e in ogni istante il campo `e diverso da zero solo su un piano, che avanza con la velocit`a della luce. Succede allora che una carica di prova avverte un effetto solo nell’istante in cui questo piano la colpisce, subendo una variazione istantanea, ma finita, della propria quantit`a di moto. Supponiamo, per esempio, che il piano d’onda della particella colpisca all’istante t = 0 una particella di carica e∗ non relativistica, v ¿ 1, nella posizione (x, y, 0) ≡ ~b. In questo caso nell’equazione di Lorentz, d~p = e∗ (E + ~v × B) dt il campo magnetico `e trascurabile. Inserendo in questa formula la (6.80), e integrando tra un instante precedente e uno successivo all’urto, si trova che alla particella viene 186

comunicata la quantit`a di moto, Z

t

∆~p = −t

d~p dt = e∗ dt

Z

t

Z E~ dt = e∗

−t

t −t

e∗ e ~b e∗ e ~b e ~b δ(z(t) − t) dt = ' . 2π b2 2π b2 (1 − vz ) 2π b2 c

Nel risultato finale abbiamo ripristinato la velocit`a della luce, per evidenziare il fatto che si tratta di un effetto relativistico. L’urto provoca quindi un “kick” di allontanamento se le cariche sono dello stesso segno, e un kick di avvicinamento se sono di segno opposto. Osserviamo, comunque, che in Elettrodinamica il fenomeno delle shock waves costituisce solo un’estrapolazione matematica – e non una situazione fisicamente realizzabile – perch´e in natura non esistono particelle cariche prive di massa. Al contrario, risolvendo le equazione di Einstein si pu`o vedere che il campo gravitazionale generato da una particella che viaggia con la velocit`a della luce, `e ancora di tipo shock wave

27

. Ma questa volta le

soluzioni hanno valenza fisica, perch´e qualsiasi particella senza massa – come il fotone – essendo dotata di energia `e gravitazionalmente “carica”, e quindi crea un campo gravitazionale di questo tipo. In questo caso l’estrapolazione matematica descrive, dunque, una situazione realizzata in natura.

6.4

Campo di una particella in moto arbitrario

Come seconda applicazione importante della (6.8), determiniamo il campo elettromagnetico creato da una particella che percorre un’arbitraria traiettoria di tipo tempo. Rispetto al moto rettilineo uniforme la particella possiede dunque un’accelerazione generalmente non nulla, e vedremo che il campo generato apparir`a qualitativamente molto diverso. Le peculiarit`a distintive che emergeranno rispetto al moto rettilineo uniforme si possono riassumere come segue. Il campo di tipo coulombiano (6.66) verr`a deformato, ma manterr`a il suo andamento a grandi distanze, ovvero 1/r2 . In aggiunta comparir`a un campo nuovo, dovuto all’accelerazione della particella, che a grandi distanze decadr`a pi` u debolmente, ovvero come 1/r, e che sar`a quindi dominante rispetto al primo. Vedremo poi che sar`a proprio questo andamento asintotico pi` u intenso ad essere responsabile del fenomeno dell’irraggiamento, del quale ci occuperemo in dettaglio nel prossimo capitolo: gli artefici dell’irraggiamento sono dunque le cariche accelerate. 27

P. Aichelburg e R. Sexl, Gen. Rel. Grav. 2 (1971) 303).

187

6.4.1

Condizioni asintotiche.

Cominciamo con qualche considerazione di carattere generale, sulle traiettorie delle particelle cariche che prenderemo in considerazione. Riferendoci a una singola particella ricordiamo che possiamo parametrizzare la sua linea di universo con il tempo proprio, y µ (s), ma anche con il tempo t, t ≡ y 0 (s)

−→

s(t)

−→

y µ (s(t)).

Con un abuso di linguaggio, in questo secondo caso indicheremo la linea di universo, per semplicit`a, di nuovo con y µ (t) ≡ (t, ~y (t)). Ricordiamo poi che, a parte una costante additiva, la relazione esplicita tra i due parametri `e, Z tp s(t) = 1 − v 2 (t0 ) dt0 ,

~v (t) ≡

0

d~y . dt

(6.83)

Dato che in natura non esistono particelle cariche di massa nulla, prenderemo in considerazione solo particelle massive, per cui ad ogni istante finito si ha v < 1. Per t → ±∞, in linea di principio pu`o succedere che v tende a 1, come per esempio nel caso di una particella in un campo elettrico costante e uniforme, vedi problema 2.7. Difatti imporremo una condizione leggermente pi` u forte, cio`e, che esista una velocit`a vM tale che, v(t) ≤ vM < 1,

∀ t.

(6.84)

Sotto questa condizione si ha, q

p

1 − v 2 (t) ≥

2 1 − vM ,

e la (6.83) implica allora che, lim s(t) = ±∞,

t→±∞

(6.85)

Ci`o assicura che i parametri s e t possono essere usati equivalentemente, per tutta l’evoluzione temporale. Difatti, per i moti realizzati in natura la condizione (6.84) `e sempre soddisfatta, come ora illustreremo. Le traiettorie che si riscontrano sperimentalmente sono essenzialmente di due tipi – moti limitati e moti illimitati – e analizzeremo ora separatamente questi due casi.

188

Moti illimitati. Per questi moti per definizione la quadrivelocit`a della particella ammette limiti finiti per t → ±∞, lim uµ = uµ± .

t→±∞

Questa ipotesi `e equivalente ad assumere che le velocit`a ordinarie ammettano limiti ~v± , con v± < 1. Fisicamente queste condizioni sono motivate dal fatto che non esistono campi di forza con un’estensione spaziale illimitata. All’infinito l’accelerazione deve quindi essere ` allora ovvio che esiste un valore nulla, e la velocit`a tendere a un vettore costante. E vM , per cui vale la (6.84). Esempi tipici di moti illimitati sono le traiettorie aperte di un esperimento di scattering. Si pu`o comunque vedere che anche per campi (costanti e uniformi) che si estendono fino all’infinito, per cui le velocit`a limite eguagliano la velocit`a della luce, si hanno le relazioni asintotiche, vedi problema 2.7, s(t) ∼ ± ln |t|. Anche in questo caso valgono quindi le (6.85). Moti limitati. Per questi moti sono soddisfatti i vincoli, v(t) ≤ vM < 1,

|~y (t)| ≤ L,

∀ t.

Questa categoria riguarda particelle confinate a una regione limitata dello spazio, come per esempio un elettrone in un’antenna, oppure una particella carica in un ciclotrone. Nel primo caso la particella `e sottoposta a una forza “costante” oscillante, ma contemporaneamente dissipa energia per effetto Joule e per irraggiamento. Il risultato `e che la sua energia resta limitata, e quindi la sua velocit`a strettamente minore di quella della luce. Nel caso del ciclotrone, durante alcuni tratti del ciclo, oltre al campo magnetico sono presenti anche campi elettrici acceleranti, che tendono a fare aumentare l’energia della particella. Tuttavia, a regime questo aumento `e completamente compensato dalla perdita di energia per irraggiamento e, come vedremo, esiste una velocit`a massima minore della velocit`a della luce – seppure spesso molto vicina ad essa. Infine notiamo che, dato che in natura tutti i campi acceleranti F µν hanno intensit`a limitata, la (6.84) assicura, per di pi` u, che l’accelerazione ordinaria ~a resta limitata, vedi problema 2.10. Ricordando la relazione tra ~a e wµ si vede allora che anche la quadriaccelerazione di una particella carica `e sempre limitata, sia per i moti limitati che per quelli 189

illimitati. In seguito tutte le traiettorie considerate saranno supposte appartenere a una di queste due categorie. 6.4.2

I campi di Lienard–Wiechert

Per determinare il campo elettromagnetico creato da una particella in moto arbitrario, procediamo formalmente come nel caso di una particella in moto rettilineo uniforme. Riprendiamo la forma generale della corrente, Z µ

j (y) = e

ds uµ (s) δ 4 (y − y(s)),

e la inseriamo nella (6.30), Z Z e 4 A (x) = d y ds uµ (s) H(x0 − y 0 ) δ((x − y)2 ) δ 4 (y − y(s)) 2π Z e ds uµ (s) H(x0 − y 0 (s)) δ((x − y(s))2 ) = 2π Z e ds uµ (s) H(x0 − y 0 (s)) δ(f (s)). = 2π µ

(6.86)

Abbiamo definito la funzione, f (s) = (x − y(s))2 = (x0 − y 0 (s))2 − |~x − ~y (s)|2 , in cui sottintendiamo la dipendenza dal punto di osservazione xµ = (x0 , ~x), che `e fissato. Come prima, per valutare δ(f (s)) dobbiamo individuare gli zeri della f . Dimostreremo ora che questa funzione ha esattamente due zeri s± (x), soddisfacenti, x0 − y 0 (s+ ) > 0,

x0 − y 0 (s− ) < 0.

(6.87)

Per fare questo sfrutteremo le propriet`a generali delle traiettorie di tempo considerate, discusse nel paragrafo precedente. Determinazione degli zeri di f (s). Incominciamo con l’osservare che si hanno i limiti, lim f (s) = +∞.

s→±∞

Per i moti limitati questo `e ovvio, perch´e per s → ±∞ si ha, y 0 (s) = t(s) → ±∞, 190

(6.88)

mentre ~y (s) resta limitata. Per i moti illimitati, invece, per s → ±∞ le quadrivelocit`a tendono a limiti uµ± ben definiti, e quindi, y µ (s) → uµ± s



f (s) → x2 − 2 (xu± ) s + s2 → +∞.

Dai limiti (6.88) segue che f (s) ha almeno un estremale – in particolare almeno un minimo – e quindi la sua derivata almeno uno zero. Scegliamo un estremale qualsiasi, s = a. Calcolando la derivata, f 0 (s) = −2(xµ − y µ (s)) uµ (s),

(6.89)

si deduce che, f 0 (a) = −2(xµ − y µ (a)) uµ (a) = 0. Ne segue che

28

, f (a) < 0.

Per provare questo sfruttiamo il fatto che le quantit`a f (s) e f 0 (s) sono scalari per trasformazioni di Lorentz, quindi possiamo calcolarle in un sistema di riferimento arbitrario. Scegliamo il sistema di riferimento in cui per s = a la particella `e a riposo, uµ (a) = (1, 0, 0, 0). Allora abbiamo, 0 = f 0 (a) = −2(x0 − y 0 (a))



f (a) = −|~x − ~y (a)|2 < 0.

Tutti i minimi e massimi di f (s) si trovano dunque nel semipiano inferiore. Questa informazione, assieme al fatto che per s → ±∞ f va a +∞, implica che per ogni xµ fissato f possiede esattamente due zeri s± , f (s± ) = 0,

s+ < s− .

In s+ f passa da valori positivi a valori negativi, e in s− da valori negativi a valori positivi. Di conseguenza abbiamo, f 0 (s+ ) < 0,

f 0 (s− ) > 0.

Valutando queste disuguaglianze tramite la (6.89) nei riferimenti in cui la particella `e a riposo, rispettivamente agli istanti s+ e s− , si ottengono le relazioni (6.87) in questi 28

In tutta questa analisi `e sottointeso che x non appartenga alla linea di universo della particella, cio`e, x 6= y µ (s), ∀ s. Nei punti x appartenenti alla linea di universo il potenziale vettore diverge. µ

191

µ riferimenti. Ma dato che i vettori xµ − y± (s) appartengono al cono luce, il segno di 0 x0 − y ± (s) `e un invariante relativistico. Concludiamo quindi che le disuguaglianze (6.87)

valgono in qualsiasi sistema di riferimento, c.v.d. Il quadripotenziale di Lienard–Wiechert. A questo punto possiamo valutare l’integrando della (6.86), usando la (2.37), µ

¶ δ(s − s+ ) δ(s − s− ) H(x − y (s)) δ(f (s)) = H(x − y (s)) + |f 0 (s+ )| |f 0 (s− )| δ(s − s+ ) δ(s − s− ) = H(x0 − y 0 (s+ )) 0 + H(x0 − y 0 (s− )) 0 |f (s+ )| |f (s− )| δ(s − s+ ) δ(s − s+ ) = = . 0 |f (s+ )| 2(x − y(s+ ))u(s+ ) 0

0

0

0

Sostituendo nella (6.86) si ottiene il quadripotenziale di Lienard–Wiechert, ¯ ¯ e uµ (s) µ ¯ A (x) = , 4π (x − y(s))u(s) ¯s=s+ (x)

(6.90)

dove la funzione s+ (x) `e determinata in modo univoco dalle relazioni, (x − y(s))2 = 0,

x0 − y 0 (s) > 0,

(6.91)

equivalenti a, x0 − y 0 (s) = |~x − ~y (s)|.

(6.92)

Il tempo ritardato. Per renderci conto del significato della posizione y µ (s+ ) della particella al tempo proprio s+ , `e pi` u conveniente parametrizzare la sua linea di universo con il tempo, t0 = y 0 (s),

y µ (t0 ) = (t0 , ~y (t0 )),

~v (t0 ) =

d~y (t0 ) , dt0

uµ (t0 ) = p

1 1−

v(t0 )2

(1, ~v (t0 )).

Questo permette di riscrivere il potenziale di Lienard–Wiechert come, Aµ (x) =

=

e uµ (t0 ) 4π (x − y(t0 )) u(t0 ) e (1, ~v (t0 )) 4π t − t0 − (~x − ~y (t0 )) · ~v (t0 ) ³

=

0

1, ~v(tc )

´

e , 4π |~x − ~y (t0 )| − (~x − ~y (t0 )) · ~v(t0 ) c

192

(6.93)

dove il “tempo ritardato” t0 (t, ~x) `e determinato dalla (6.92), t − t0 =

1 |~x − ~y (t0 )|. c

(6.94)

Nelle formule finali abbiamo reinserito la velocit`a della luce, per evidenziare le correzioni relativistiche; per il caso statico si veda la (6.64). Come si vede, il potenziale nel punto xµ = (t, ~x) non dipende dalle variabili cinematiche della particella all’istante t, bens`ı dai valori di posizione e velocit`a all’istante ritardato t0 . Dalla (6.94) si vede che questo istante `e determinato in modo tale che l’evento (t0 , ~y (t0 )) sia connesso attraverso un segnale di tipo luce “futuro”, al punto d’osservazione xµ . La presenza del ritardo comporta nella (6.93) correzioni relativistiche implicite, in quanto t0 = t − o(1/c). Pi` u precisamente, eseguendo lo sviluppo non relativistico della (6.94) si ottiene, |~x − ~y (t)| (~x − ~y (t)) · ~v (t) − +o t (t, ~x) = t − c c2 0

µ

1 c3

¶ .

(6.95)

Al denominatore della (6.93) compare poi una correzione relativistica esplicita, per la presenza del termine proporzionale a v(t0 )/c. I campi di Lienard–Wiechert. Passiamo ora al calcolo del campo elettromagnetico F µν = ∂ µ Aν − ∂ ν Aµ . In seguito per semplicit`a con “s” indicheremo la funzione di x s+ (x). Introduciamo oltre alla quadriaccelerazione wµ = duµ /ds, il quadrivettore dipendente da x, Lµ (x) ≡ xµ − y µ (s),

(6.96)

dove bisogna tenere presente che la dipendenza da x avviene anche attraverso s. Allora il sistema (6.91) pu`o essere riscritto come, Lα Lα = 0,

L0 = |~x − ~y (s)|.

Per il potenziale e il campo elettromagnetico si ottiene allora, ¶ µ e 1 e uµ 1 µν µ ν µ ν µ , F = ∂ u − ∂ (uL) u − (µ ↔ ν) . A = 4π (uL) 4π (uL) (uL)2

(6.97)

(6.98)

Per determinare le derivate rimanenti dobbiamo valutare le derivate parziali di s ≡ s(x) rispetto a xµ . A questo scopo `e sufficiente derivare la (6.97) rispetto a xµ , µ ¶ ∂s dyα ∂s α α α 0 = L ∂µ Lα = L ∂µ (xα − yα (s)) = L ηαµ − µ = Lµ − (uL) µ , ∂x ds ∂x 193

che d`a, ∂s Lµ = . µ ∂x (uL) Possiamo ora calcolare le derivate che compaiono in F µν , ∂s duν Lµ wν = , ∂xµ ds (uL) ∂s dyν L µ uν = ηµν − µ = ηµν − , ∂x ds (uL)

∂ µ uν = ∂µ Lν e quindi,

∂µ (uL) = (∂µ uν )Lν + uν ∂µ Lν ¶ µ 1 Lµ uν ν = Lµ (wL) + u ηµν − (uL) (uL) 1 = ((wL) − 1)Lµ + uµ . (uL) Sostituendo queste espressioni nella (6.98) si ottiene infine un’espressione covariante a vista, per il campo elettromagnetico prodotto da una particella carica in moto arbitrario, ³ ´ e µ ν µ ν ν L u + L [(uL) w − (wL) u ] − (µ ↔ ν) . (6.99) F µν = 4π(uL)3 Campi di velocit` a e campi di accelerazione. Come prima cosa vogliamo analizzare il comportamento della (6.99) a grandi distanze dalla particella. A questo scopo `e conveniente suddividere i termini che compaiono in F µν in due classi, in base alla loro dipendenza dalla variabile, R ≡ L0 = |~x − ~y (s)|, ` anche conveniente definire il versore nullo, vedi (6.97). E mµ ≡

Lµ , R

mµ mµ = 0,

con componenti, m0 = 1,

m ~ =

~x − ~y (s) , |~x − ~y (s)|

|m| ~ = 1.

Scrivendo Lµ = R mµ possiamo allora riscrivere il campo (6.99) come somma di due contributi, il “campo di velocit`a” Fvµν , e il “campo di accelerazione” Faµν , F µν = Fvµν + Faµν , e Fvµν = (mµ uν − mν uµ ) , 3 2 4π(um) R ³ ´ e µ ν ν Faµν = m [(um) w − (wm) u )] − (µ ↔ ν) . 4π(um)3 R 194

(6.100) (6.101) (6.102)

In Faµν abbiamo incluso i termini proporzionali a 1/R, e in Fvµν i termini proporzionali a 1/R2 . Come si vede il primo risulta proporzionale alla quadriaccelerazione, mentre il secondo ne `e indipendente. Analizziamo ora gli andamenti di questi campi a grandi distanze dalla particella. Per fare questo supponiamo che la particella si muova in una regione limitata dello spazio, |~y | ≤ D, e consideriamo il campo in un punto ~x lontano da questa regione, r ≡ |~x| À D. Allora abbiamo le identificazioni asintotiche, R = |~x − ~y | ≈ r,

m ~ =

~x − ~y ~x ≈ ≡ ~n. |~x − ~y | r

(6.103)

Siccome per qualsiasi valore di r i vettori uµ , wµ e mµ sono limitati, vediamo che a grandi distanze dalla particella il campo di accelerazione decade come, 1 Faµν ∼ , r

(6.104)

mentre il campo di velocit`a decade come, Fvµν ∼

1 . r2

(6.105)

In particolare vediamo che a grandi distanze il campo di accelerazione domina sul campo di velocit`a, e quindi il campo totale decade come, 1 F µν ∼ , r in contrapposizione con l’andamento del campo del moto rettilineo uniforme, vedi (6.71). Consideriamo ora pi` u da vicino il campo di velocit`a, riscrivendolo come, Fvµν =

e (Lµ uν − Lν uµ ) . 4π(uL)3

(6.106)

` facile vedere che per un moto rettilineo uniforme questo campo si riduce in realt`a alla E (6.66). Infatti, se y µ (s) = uµ s, si ha Lµ = xµ − uµ s, e quindi, Lµ uν − Lν uµ = xµ uν − xν uµ , (uL) = uµ (xµ − uµ s) = (ux) − s+ (x) = 195

p

(ux)2 − x2 ,

vedi (6.60). Il campo Fvµν rappresenta quindi una deformazione del campo elettromagnetico di una particella in moto rettilineo uniforme, ed eredita in particolare il suo andamento asintotico 1/r2 . Per questo motivo Fvµν viene anche chiamato “campo coulombiano”. Un effetto genuinamente nuovo `e invece rappresentato dalla comparsa del campo di accelerazione Faµν – causato appunto dall’accelerazione della particella – che a grandi distanze soppianta il campo di velocit`a. Nel prossimo paragrafo vedremo che `e proprio questo campo a causare il fenomeno dell’irraggiamento. ~ e B. ~ Esplicitiamo ora i campi elettrico e magnetico corrispondenti alla I campi E (6.99). Usando le (6.100)–(6.102), questi campi possono a loro volta essere suddivisi in campi di velocit`a, indipendenti dall’accelerazione e proporzionali a 1/R2 , e in campi di accelerazione, lineari nell’accelerazione e proporzionali a 1/R, ~ = E ~v + E ~ a, E ~ = B ~v + B ~ a. B Esplicitiamo prima la quadriaccelerazione in termini dell’accelerazione spaziale ~a = d~v /dt0 , wµ =

~a · ~v 1 uµ + (0, ~a). 2 3/2 (1 − v ) (1 − v 2 )

Si vede allora che il termine proporzionale a uµ si cancella, quando wµ viene inserito in [(um) wν − (wm) uν ]. Usando anche che, (um) = √

1 (1 − ~v · m), ~ 1 − v2

con calcoli elementari dalle (6.101), (6.102) si trova allora, ripristinando la velocit`a della luce, ~v E

³ ´¡ ¢ v2 ~v 1 − m ~ − 2 c c e = , ¡ ¢3 2 ~ v · m ~ 4πR 1− c

~a E

£¡ ¢ ¤ ~ × m ~ − ~vc × ~a e m = , ¡ ¢ ~ 3 4πc2 R 1 − ~v·m

~v = m ~v, B ~ ×E

~a = m ~ a, B ~ ×E

(6.107)

(6.108)

c

che sono i campi di Lienard–Wiechert. Si badi che le quantit`a cinematiche ~y , ~v e ~a che compaiono in queste formule sono valutate all’istante ritardato t0 (x), definito dalla (6.94). 196

Vediamo che in ogni punto i campi elettrico e magnetico sono ortogonali tra di loro, in quanto si ha, ~ =m ~ B ~ × E. ~ v si vede poi che si pu`o anche scrivere, Data l’espressione particolare di E ~ v = ~v × E ~v. B c Il campo magnetico di velocit`a `e quindi soppresso di un fattore v/c rispetto al campo elettrico di velocit`a, come nel caso del moto rettilineo uniforme, vedi (6.68). Viceversa, i campi elettrico e magnetico di accelerazione sono invece uguali in modulo, in quanto si ha, ~ a = 0, m ~ ·E

~a = m ~ a, B ~ ×E

~ a | = |E ~ a |, |B

(6.109)

relazioni che sfrutteremo nel prossimo paragrafo. ~ v , i campi E ~a e B ~ a portano Facciamo infine notare che rispetto al campo di velocit`a E un prefattore 1/c2 . I campi di accelerazione rappresentano quindi degli effetti prettamente relativistici ! Andamenti asintotici in generale. Concludiamo questo paragrafo con una generalizzazione importante. Grazie al fatto che la (6.47) `e lineare nella corrente, gli andamenti asintotici del campo (6.99) derivati sopra si estendono, infatti, automaticamente al campo elettromagnetico generato da un arbitrario sistema di cariche puntiformi. In particolare il campo si scriver`a ancora come, F µν = Fvµν + Faµν ,

(6.110)

dove a grandi distanze, Fvµν ∼

1 , r2

1 Faµν ∼ . r

(6.111)

Per il campo totale si avr`a quindi di nuovo, 1 F µν ∼ . r

(6.112)

A livello asintotico si possono generalizzare anche le (6.109), ricordando che per grandi r si ha l’identificazione, vedi (6.103), m ~ ≈ ~n, 197

dove il versore radiale ~n `e indipendente dalle traiettorie delle particelle. Per un sistema arbitrario di particelle dalle (6.109) – per linearit`a – si ottengono allora le relazioni asintotiche, ~ a = 0, ~n · E

~ a = ~n × E ~ a, B

~ a | = |E ~ a |, |B

per r → ∞.

(6.113)

Ancora, siccome anche le correnti “macroscopiche” – come quelle corrispondenti agli elettroni in un’antenna o in un circuito elettrico – possono essere pensate come sovrapposizioni delle correnti elementari delle cariche costituenti, gli andamenti asintotici (6.113) valgono anche per i campi generati da tali correnti. 6.4.3

Emissione di radiazione da cariche accelerate

Ora che abbiamo un’espressione per il campo elettromagnetico prodotto da una particella carica in moto arbitrario, possiamo chiederci sotto quali condizioni una particella cede o assorbe energia o, pi` u in generale, quadrimomento, attraverso questo campo. Non siamo quindi interessati al quadrimomento che le particelle cedono al campo, ma piuttosto al quadrimomento che il sistema campo + particelle cede all’“ambiente” – che `e quello che viene rivelato sperimentalmente. Con un abuso di linguaggio, che adotteremo anche noi, si parla comunque di “quadrimomento emesso dalle particelle”. Formula fondamentale per l’emissione di quadrimomento. Consideriamo dunque un generico sistema di particelle cariche interagenti con il campo elettromagnetico. Come abbiamo visto, il trasporto di quadrimomento di un tale sistema `e quantificato dal tensore energia–impulso del solo campo elettromagnetico, vedi paragrafo 2.4.3, µν Tem = F µ α F αν +

1 µν αβ η F Fαβ . 4

In particolare, se consideriamo “positivo” il quadrimomento emesso – come d’ora in poi faremo sempre – il quadrimomento emesso nell’unit`a di tempo da una superficie chiusa Γ `e dato da, vedi (2.81), dP µ = dt

Z Γ

µi dΣi . Tem

(6.114)

Tuttavia, il quadrimomento che pu`o essere considerato definitivamente ceduto dal sistema all’ambiente, `e solo quello che successivamente non viene riassorbito. Il quadrimomento 198

in questione `e quindi quello che riesce a raggiungere l’infinito spaziale

29

. Questo vuol

dire che nell’integrale in (6.114) dobbiamo scegliere per Γ una sfera di raggio r, e poi fare ~ = ~n r2 dΩ, tendere r all’infinito. Scrivendo l’elemento di superficie della sfera come dΣ dove dΩ `e l’angolo solido, per il quadrimomento emesso nell’unit`a di tempo otteniamo allora, dP µ = r2 dt

Z µi i Tem n dΩ,

r → ∞.

(6.115)

Da questa espressione possiamo infine selezionare il quadrimomento emesso nell’unit`a di tempo e nell’unit`a di angolo solido, in direzione ~n, ¡ µi i ¢ d2 P µ = r2 Tem n , dt dΩ

r → ∞,

(6.116)

dove d’ora in poi il limite per r → ∞ sar`a sempre sottinteso. La (6.116) costituisce la formula fondamentale per l’analisi di tutti i fenomeni di irraggiamento. Si vede allora in µi particolare che, per valutare il quadrimomento emesso, `e sufficiente selezionare da Tem i µν contributi che vanno come 1/r2 ovverosia, dato che Tem `e proporzionale a (F µν )2 , da F µν

quelli che vanno come 1/r. Ma visti gli andamenti asintotici (6.111), questo significa che al membro di destra della (6.116) contribuisce solo il campo di accelerazione. La doppia conclusione di questa analisi – completamente generale – `e che al quadrimomento emesso da un sistema di cariche contribuisce solo il campo di accelerazione, e che per determinare il primo `e sufficiente valutare il secondo a grandi distanze dalle cariche. Emissione di energia. Consideriamo ora pi` u in dettaglio l’emissione di energia. Per l’energia P 0 ≡ ε emessa nell’unit`a di tempo e nell’unit`a di angolo solido, ovverosia, per la potenza W = dε/dt emessa nell’unit`a di angolo solido, la componente zero della (6.116) 0i fornisce, si ricordi che Tem = S i,

dW d2 ε ~ · ~n). = = r2 (S dΩ dt dΩ

(6.117)

Ma per quanto concluso sopra, al vettore di Poynting contribuiscono solo i campi di accelerazione, ~=E ~ ×B ~ S



29

~a × B ~ a, E

A livello quantistico questo significa che consideriamo “emessi” solo quei fotoni che riescono a raggiungere l’infinto, e non vengono successivamente risassorbiti dalle particelle.

199

e questi ultimi vanno inoltre valutati a grandi distanze. Possiamo allora usare le relazioni asintotiche (6.113), per derivare la semplice formula, ~=E ~a × B ~a = E ~ a × (~n × E ~ a ) = ~n |E ~ a |2 . S

(6.118)

~ ha la stessa direzione e lo stesso verso di ~n, e ne segue che il flusso Risulta, quindi, che S di energia `e sempre radiale uscente, verso l’infinito: l’energia viene quindi sempre emessa dalle particelle, e mai assorbita ! Questa circostanza `e una conseguenza diretta del fatto che abbiamo utilizzato il kernel ritardato Gret ; se avessimo usato il kernel avanzato Gadv , il flusso di energia sarebbe stato invece sempre entrante dall’infinito. Se inseriamo la (6.118) nella (6.117) vediamo che la potenza emessa dipende in modo semplice dal modulo del campo elettrico di accelerazione, valutato a grandi distanze dalla particella, dW ~ a |2 , = c r 2 |E dΩ

(6.119)

~ a decade come 1/r, dove abbiamo ripristinato la velocit`a della luce. Grazie al fatto che E ~ a | = |E ~ a | abbiamo, la potenza emessa sar`a in particolare sempre finita. Inoltre, siccome |B W =0



Faµν = 0.

La presenza o assenza di energia emessa costituisce quindi un fenomeno Lorentz invariante, cio`e, indipendente dal sistema di riferimento. In presenza di una singola particella abbiamo inoltre, vedi la (6.102) e il problema 6.2, Faµν = 0



wµ = 0.

La presenza o assenza di energia emessa `e quindi legata inscindibilmente all’accelerazione della particella. Il campo di accelerazione come campo di radiazione. Possiamo infine cercare di mettere in relazione il campo di accelerazione Faµν , con i “campi di radiazione” – le soluzioni dell’equazione di Maxwell nel vuoto, che abbiamo studiato nel capitolo precedente. A questo proposito notiamo che nel complemento della linea di universo, il campo totale (6.100) soddisfa evidentemente le equazioni di un campo di radiazione, ∂µ F µν = 0 = ∂[µ Fνρ] . 200

Ma dato che F µν = Fvµν + Faµν , e che Fvµν decade come 1/r2 , ne segue che Faµν (che di per s`e decade solo come 1/r) soddisfa queste equazioni asintoticamente, vale a dire modulo termini 1/r2 ,

µ ∂µ Faµν

=o

1 r2



µ ,

∂[µ Fa νρ] = o

1 r2

¶ .

Ci aspettiamo allora che a grandi distanze dalla particella il campo di accelerazione si comporti come un campo di radiazione, e che risulti in particolare sovrapposizone di onde piane. Dalla formula del vettore di Poynting (6.118) – formalmente identico a quello delle onde piane (5.76) – si desume allora che le onde che compongono Faµν si propagano necessariamente lungo la direzione radiale uscente. Siamo quindi portati a concludere che l’energia emessa (6.119) viaggia asintoticamente a cavallo di un campo di radiazione, che `e composto da onde elettromagnetiche che si propagano in direzione radiale. Nel prossimo capitolo renderemo questa affermazione precisa, analizzando in dettaglio le propriet`a asintotiche di un generico campo di accelerazione Faµν . Per le caratteristiche appena descritte, il campo di accelerazione viene spesso anche chiamato semplicemente “campo di radiazione”. In conclusione, una carica accelerata cede energia e quantit`a di moto attraverso il suo campo di radiazione, liberando onde elettromagnetiche che le trasportano fino all’infinito. 6.4.4

Limite non relativistico e formula di Larmor

Per illustrare il significato delle formule del paragrafo precedente determiniamo la potenza totale emessa da una particella carica accelerata in tutte le direzioni, Z W=

dW dΩ, dΩ

(6.120)

nel limite non relativistico. Per essere precisi, vogliamo valutare questa potenza all’ordine pi` u basso in 1/c che, come vedremo, corrisponde a W ∼ 1/c3 . Data la (6.119) si tratta dunque di valutare il campo elettrico di accelerazione all’ordine pi` u basso in 1/c. Siccome questo campo porta un prefattore 1/c2 , nella (6.108) possiamo allora trascurare i fattori v/c, ottenendo, ~a = E

e m ~ × (m ~ × ~a), 4πR c2 201

~ a |2 = |E

e2 | m ~ × ~a|2 . 16 π 2 R2 c4

(6.121)

La validit`a di questa approssimazione richiede dunque in particolare che la particella si muova con velocit`a piccola rispetto alla velocit`a della luce, v ¿ c, come c’era da aspettarsi. Per determinare la distribuzione angolare della potenza emessa ~ a asintoticamente, a grandi distanze dalla particella, (6.119) dobbiamo inoltre valutare E per cui secondo le (6.103) si ha R → r e m ~ → ~n. La (6.119) diventa allora, dW e2 = |~n × ~a|2 . 2 3 dΩ 16 π c

(6.122)

La potenza emessa nell’unit`a di angolo solido `e quindi quadratica nell’accelerazione della particella, ma esibisce anche una dipendenza esplicita dalla direzione ~n in cui si osserva la radiazione. Il ritardo asintotico. Prima di poter determinare la potenza totale integrando la (6.122) sull’angolo solido, occorre fare una precisazione sull’interpretazione di questa formula in relazione alla propagazione causale della radiazione. Questa formula d`a, infatti, l’energia emessa dalla particella nell’unit`a di tempo e nell’unit`a di angolo solido in direzione ~n – rivelata all’istante t a una distanza r molto grande dalla particella, e il membro di sinstra della (6.122) andrebbe quindi scritto meglio come

dW dΩ

(t, r, ~n). L’accelerazione che

compare al membro di destra della formula `e, invece, valutata all’istante ritardato t0 (t, ~x), determinato dalla relazione (6.94), t − t0 =

1 |~x − ~y (t0 )|. c

(6.123)

Anche questa relazione va valutata asintoticamente, per punti di osservazione ~x molto lontani dalla traiettoria della particella. Supponiamo allora che la particella sia confinata alla sfera SD , di raggio D e centro nell’origine: |~y (t)| < D, ∀ t, e scegliamo r = |~x| À D. Ricordando che ~n = ~x/r abbiamo allora lo sviluppo, r ¯ ¯ 0 ¯ 0 2 0 ¯ ~ y (t ) 0 ¯ = r 1 − 2 ~n · ~y (t ) + y (t ) |~x − ~y (t )| = r ¯¯~n − r ¯ r r2 µ µ ¶¶ µ ¶ ~n · ~y (t0 ) 1 1 0 = r 1− +o 2 = r − ~n · ~y (t ) + o , r r r

(6.124)

e si ottiene per la versione asintotica della (6.123), t0 = t −

~n · ~y (t0 ) r ~n · ~y (t0 ) + ≡T+ . c c c 202

(6.125)

La (6.122) si scrive quindi pi` u precisamente, dW e2 2 (t, r, ~n) = |~n × ~a(t0 )| , 2 3 dΩ 16 π c

(6.126)

dove la funzione t0 = t0 (t, ~x) `e definita dalla relazione implicita (6.125). Vediamo che il tempo ritardato (6.125) `e composto da un termine “macroscopico”, T = t − rc , e da un contributo “microscopico”, ~n · ~y (t0 )/c. Il primo rappresenta l’istante (ritardato) in cui la radiazione deve lasciare il centro di SD , per giungere all’istante t nel punto di rivelazione ~x. Questo istante `e indipendente dal moto della particella e dalla direzione di osservazione ~n. Il termine microscopico rappresenta invece un ritardo aggiuntivo causato dal moto ~y (t) della particella all’interno di SD , e dipende da ~n. Siccome questo termine `e inoltre soppresso di un fattore 1/c, nel limite non relativistico esso potr`a essere trascurato, vedi sotto. Il membro di destra della (6.126) esibisce quindi una dipendenza esplicita da ~n, e una implicita attraverso t0 . Di conseguenza l’integrale sugli angoli nella (6.120) in generale non pu`o essere eseguito analiticamente. Possiamo comunque risolvere iterativamente la (6.125) attraverso uno sviluppo non relativistico in potenze di 1/c, µ ¶ 1 ~n · ~y (T ) (~n · ~y (T ))(~n · ~v (T )) 0 + + 3 . t =T+ 2 c c c che porta a, ~n · ~y (T ) ˙ ~a(T ) + ~a(t ) = ~a(T ) + c 0

µ

1 c2

¶ .

(6.127)

Tuttavia, dato che la (6.126) `e stata ottenuta trascurando nella (6.108) i fattori v/c, per consistenza anche nella (6.127) dobbiamo omettere i termini di ordine 1/c, e tenere quindi solo il contributo di ordine zero ~a(T ), che equivale a porre t0 = T . In questo limite si trascura quindi, in particolare, il ritardo microscopico. In conclusione, nel limite non relativistico la radiazione che viene rivelata a un istante t a una distanza r dalla particella, viene considerata emessa dalla particella all’istante ritardato T = t − rc , e quindi l’energia emessa corrisponente (6.126) deve dipendere dal valore dell’accelerazione ~a(T ) allo stesso istante. Nello sviluppo (6.127) i termini di ordine 1/c e successivi rappresentano, invece, correzioni relativistiche di ordine superiore. Per una trattazione sistematica degli sviluppi non 203

relativistici rimandiamo alla sezione 7.3, dove faremo in particolare vedere che, affinch`e il ritardo microscopico possa essere trascurato, `e necessario che le particelle si muovano con velocit`a piccole rispetto alla velocit`a della luce. Formula di Larmor. Nell’approssimazione non relativistica l’accelerazione ~a(T ) ≡ ~a nella (6.126) risulta indipendente dagli angoli, e la potenza totale (6.120) pu`o allora essere valutata esplicitamente. Per fare questo `e sufficiente scegliere come asse z la direzione di ~a, e usare le relazioni, |~n × ~a|2 = | ~a |2 sen2 ϑ, Risulta allora, e2 | ~a |2 W= 16 π 2 c3

Z

dΩ = senϑ dϑ dϕ. Z



π

dϕ 0

sen3 ϑ dϑ.

0

Svolgendo gli integrali si ottiene una formula semplice per la potenza totale emessa da una particella non relativistica, con carica e e accelerazione ~a, W=

e2 | ~a |2 , 6π c3

(6.128)

che `e la nota formula di Larmor (1897). Insistiamo sul fatto che in questa formula la potenza W(t, r) rivelata a un istante t a una distanza r dalla particella, coinvolge al membro di destra l’accelerazione valutata all’istante t − rc . Proprio perch´e la radiazione si propaga con velocit`a c, la formula pu`o allora anche essere interpretata dicendo che, se a un dato istante la particella possiede l’accelerazione ~a, in quell’istante essa emette la potenza e2 |~a|2 /6πc3 . Torneremo su questo punto in sezione 9.1, dove discuteremo la generalizzazione relativistica della (6.128). Le conseguenze fenomenologiche della formula di Larmor saranno invece analizzate nel prossimo capitolo, dove la rideriveremo nell’ambito di un approccio pi` u sistematico.

6.5

Problemi

6.1 Si dimostri che la funzione di Green ritardata (6.43) definisce una distribuzione in S 0 (R4 ). 6.2 Si dimostri che il campo Faµν asintotico dato in (6.102) `e nullo in ogni direzione ~n, se e solo se wµ = 0. [Sugg.: pu`o essere utile usare il sistema a riposo istantaneo.] 204

6.3 Si consideri una particella di carica e che si muove con velocit`a v costante lungo l’asse z, nel sistema di riferimento del laboratorio K. Si consideri che nel sistema di riferimento K 0 , dove la particella `e a riposo in ~x 0 = 0, il quadripotenziale vale, A0µ (x0 ) =

e (1, 0, 0, 0). 4π|~x 0 |

a) Si determini la trasformazione di Lorentz Λµ ν che connette un evento in K con l’evento corrispondente in K 0 . b) Si determini il potenziale Aµ (x) in K sfruttando il fatto che esso `e un quadrivettore, e si confronti il risultato con la (6.63). 6.4 Si verifichi che i campi elettrico e magnetico di una particella priva di massa soddisfano le equazioni (6.82), dimostrando in particolare che in due dimensioni vale l’identit`a distribuzionale,

dove ~x ≡ (x, y) e r =

~ · ~x = 2π δ 2 (~x), ∇ r2

p

x2 + y 2 .

Se ne deduca che la funzione di Green del laplaciano bidimensionale `e data dal logaritmo,

µ ∇

2

1 ln r 2π



µ =

(∂x2

+

∂y2 )

p 1 ln x2 + y 2 2π

205

¶ = δ 2 (~x).

7

Irraggiamento

Con “irraggiamento” si intende genericamente il fenomeno dell’emissione di radiazione da parte di un generico sistema carico. Nel capitolo precedente abbiamo derivato un’espressione esatta per il campo elettromagnetico generato da una particella carica in moto arbitrario. Abbiamo visto che se la particella `e accelerata, allora essa genera un campo di accelerazione che a grandi distanze decade come 1/r e che trasporta energia e quantit`a di moto. Abbiamo anche constatato che l’analisi quantitativa della radiazione, e in particolare la determinazione del quadrimomento emesso, in realt`a non richiedono la conoscenza dei campi di Lienard–Wiechert esatti, ma solo della loro forma asintotica. Nel presente capitolo vogliamo eseguire un’analisi sistematica della radiazione emessa da un arbitrario sistema carico, rappresentato da una quadricorrente j µ generica. Siccome a livello microscopico qualsiasi sistema carico pu`o essere pensato come composto da un insieme di particelle cariche puntiformi, il suo campo a grandi distanze decade ancora come 1/r, e per analizzare la radiazione emessa `e di nuovo sufficiente determinare il suo andamanto asintotico. Uno degli scopi principali di questo capitolo sar`a in particolare la determinazione del quadrimomento emesso dal sistema nell’unit`a di tempo, vedi (6.116), ¡ µi i ¢ d2 P µ = r2 Tem n . dt dΩ

(7.1)

Siccome al membro di destra di questa formula contribuiscono solo i campi F µν che a grandi distanze decadono come 1/r, per valutare il quadrimomento emesso `e allora sufficiente selezionare anche dal quadripotenziale Aµ di (6.48) i contributi che vanno come 1/r. La prossima sezione sar`a dunque dedicata a un’analisi sistematica del quadripotenziale a grandi distanze dal sistema carico, ovvero nella “zona della onde”. Decomposizione spettrale della corrente. Concludiamo questa premessa con una specificazione sulla natura delle correnti che considereremo. In primo luogo queste dovranno certamente essere conservate, ∂µ j µ = 0. Le correnti che compaiono nella realt`a fisica si suddividono poi naturalmente in due categoria a seconda della loro dipendenza dal tempo, correnti aperiodiche e correnti periodiche. Nel primo caso la corrente ammette una trasformata di Fourier nella sola variabile temporale, ovvero, ammette la “decomposizione

206

spettrale”, 1 j (t, ~x) = √ 2π µ

Z



dω eiωt j µ (ω, ~x),

(7.2)

−∞

dove la trasformata j µ (ω, ~x) rappresenta il “peso continuo” con cui la frequenza ω compare nella corrente. Siccome la corrente `e reale questi pesi devono soddisfare la condizione di realt`a, j µ∗ (ω, ~x) = j µ (−ω, ~x), a causa della quale in seguito le frequenze saranno considerate sempre positive. Esempi di processi che corrispondono a correnti aperiodiche sono gli urti elastici tra particelle cariche, o il passaggio di una particella carica attraverso una zona limitata con un campo elettromagnetico non nullo. Se la corrente `e invece periodica nel tempo con periodo T – come la corrente macroscopica in un’antenna, o quella dovuta a una particella carica in un ciclotrone – allora la decomposizione (7.2) viene sostituita dalla serie di Fourier ∞ X

µ

j (t, ~x) =

µ eiN ω0 t jN (~x),

30

,

µ∗ µ jN (~x) = j−N (~x),

(7.3)

N =−∞

dove ω0 =

2π T

µ `e la frequenza fondamentale. In questo caso jN (~x) rappresenta il “peso

discreto” con cui la frequenza, ωN = N ω 0 , compare nella corrente. In seguito considereremo anche “sorgenti monocromatiche” corrispondenti a correnti con frequenza fissata, del tipo, j µ (t, ~x) = eiωt j µ (ω, ~x) + c.c.

(7.4)

Qualsiasi sorgente potr`a quindi essere pensata come sovrapposizione – discreta o continua – di sorgenti monocromatiche. La denominazione “frequenza” per la variabile duale ω 30

In realt`a la (7.3) pu`o essere riguardata come un caso particolare della (7.2), se si pone, µ

j (ω, ~x) =





∞ X N =−∞

207

µ δ(ω − ωN )jN (~x).

deriva dal fatto che, come vedremo, una sorgente monocromatica genera un campo elettromagnetico che nella zona delle onde assume la forma di un’onda piana monocromatica, con la stessa frequenza ω della sorgente.

7.1

Il campo elettromagnetico nella zona delle onde

In questa sezione considereremo una generica corrente a supporto spaziale compatto. Scegliendo opportunamente l’origine spaziale del sistema di riferimento, il suo supporto spaziale sar`a allora contenuto in una palla di raggio R e avremo, j µ (t, ~x) = 0,

per |~x| > R,

∀ t.

La limitazione a correnti siffatte trova la sua motivazione fisica nel fatto che le distribuzioni di carica realizzabili in natura sono necessariamente confinate a una regione limitata. Il potenziale nella zona delle onde. Definiamo come “zona delle onde” la regione lontana dalle cariche, ovvero la regione spaziale

31

,

|~x| ≡ r À R.

(7.6)

Per i motivi detti valutiamo ora il quadripotenziale esatto (6.48), 1 A (x) = 4π µ

Z d3 y

1 j µ (t − |~x − ~y |, ~y ), |~x − ~y |

(7.7)

nella zona delle onde, arrestandoci ai termini di ordine 1/r. Siccome la corrente nell’integrando `e nulla per |~y | > R, l’integrale in d3 y pu`o essere ristretto ai valori di ~y per cui |~y | ≤ R. In base alla (7.6) abbiamo allora, |~x| À |~y |. 31

Come “zona delle onde” si definisce spesso la regione degli r che oltre alla (7.6) soddisfano anche, r À λ,



R2 , λ

(7.5)

dove λ = 2π/ω `e la lunghezza d’onda, e ω indica la generica frequenza presente nella corrente (7.2). Se r soddisfa queste relazioni ulteriori, allora le formule (7.9) e (7.10) mantengono la loro validit`a anche per valori finiti di r, e non solo asintoticamente. Per esempio, per arrivare alla (7.9) nell’argomento temporale della corrente in (7.7) abbiamo trascurato un termine o(y 2 /r), vedi (7.8), che nello sviluppo della corrente darebbe luogo a un contributo del tipo (y 2 /r)∂0 j µ . Considerando la componente monocromatica (7.4) schematicamente si ha ∂0 j µ ' iωj µ , e quindi questo termine `e trascurabile se ωy 2 /r < ωR2 /r ¿ 1, che equivale alla seconda condizione in (7.5).

208

Introducendo il versore radiale ~n = ~x/r abbiamo allora gli sviluppi, vedi (6.124), r µ ¶ ~n · ~y y 2 1 |~x − ~y | = r 1 − 2 + 2 = r − ~n · ~y + o , r r r µ ¶ 1 1 1 = +o 2 . |~x − ~y | r r Inserendo queste espansioni in (7.7) si ottiene il potenziale nella zona delle onde, µ ¶ Z 1 1 µ 3 µ A (x) = d y j (t − r + ~n · ~y , ~y ) + o . 4πr r2

(7.8)

(7.9)

In seguito trascureremo i termini di ordine 1/r2 , in quanto siamo interessati solo al termine leading – che `e di ordine 1/r come anticipato. Si noti in particolare che l’integrale che moltiplica il fattore 1/4πr dipende, oltre che da ~x, anche dal tempo. Di conseguenza il potenziale (7.9) dar`a luogo a un campo F µν che a grandi distanze decade ancora come 1/r, vedi sotto, corrispondente appunto a un campo di accelerazione. Per confronto ricordiamo che anche il potenziale coulombiano statico `e proporzionale a 1/r, ma che in quel caso il coefficiente di proporzionalit`a `e indipendente dal tempo e il campo corrispondente decade allora come 1/r2 , e non come 1/r. Notiamo poi nella (7.9) la comparsa del tempo ritardato “macroscopico” T = t − r, che tiene conto del tempo che il campo elettromagnetico impiega per raggiungere il punto di osservazione, a partire dal centro della palla contenente le cariche. Il termine ~n · ~y tiene invece conto del ritardo “microscopico” delle cariche individuali, a seconda della loro posizione all’interno della palla. Le relazioni delle onde. Le propriet`a principali del campo elettromagnetico nella zona della onde, derivato dal potenziale (7.9), seguono dalle relazioni delle onde (5.63), ∂µ Aν = nµ A˙ ν ,

nµ A˙ µ = 0,

nµ nµ = 0,

(7.10)

relazioni che ora dimostreremo essere valide anche per il potenziale (7.9), modulo termini di ordine 1/r2 . Cominciamo definendo il “quadrivettore” nullo nµ = (n0 , ~n) con componenti, n0 = 1,

~n =

~x , r

n2 = 0.

Calcoliamo poi le derivate rispetto a t e xi dell’integrando della (7.9) 1 µ j (t − r + ~n · ~y , ~y ), r 209

tralasciando di scrivere esplicitamente gli µ ¶ 1 ν ∂0 j = r ¶ µ 1 ν = ∂i j r

argomenti, 1 ∂0 j ν , r µ ¶ xi 1 ν − 2 ∂0 j + o 2 . r r

Modulo termini di ordine 1/r2 queste relazioni equivalgono a, µ ¶ ¶ µ 1 ν 1 ν ∂µ j = n µ ∂0 j . r r Dalla (7.9) si ottiene allora, µ µ ¶ ¶ Z Z Z 1 1 ν 1 1 ν 1 ν 3 3 ∂µ A = d y ∂µ j = d y nµ ∂0 j = n µ ∂0 d3 y j ν = nµ ∂0 Aν , 4π r 4π r 4πr che `e la prima relazione in (7.10). La seconda `e conseguenza del fatto che il potenziale per costruzione soddisfa la gauge di Lorentz, ∂µ Aµ = 0. Una volta appurato che valgono le (7.10), concludiamo che il campo elettromagnetico nella zona delle onde condivide con le onde piane le propriet`a (5.77)–(5.79), h i ~ = −A ~˙ + (~n · A ~˙ ) ~n = ~n × ~n × A ~˙ , E ~ = ~n × E, ~ B µν Tem

~ = 0, ~n · E

~ = |B|, ~ |E| ¯ ¯2 ¯ ~˙ ¯¯ = nµ nν |E| ~ 2, = nµ nν (A˙ i A˙ j ) Λij = nµ nν ¯~n × A

(7.11) (7.12)

Λij ≡ δ ij − ni nj . (7.13)

In particolare i campi elettrico e magnetico sono ortogonali tra di loro, e la direzione di propagazione del campo `e la radiale uscente ~n. Infatti, dalle (7.12) segue che il vettore di Poynting `e parallelo e concorde a ~n, ~=E ~ ×B ~ = ~n |E| ~ 2. S

(7.14)

Le relazioni (7.12) e (7.14) generalizzano in particolare le formule asintotiche (6.113) e (6.118) – valide per il campo asintotico di un sistema di particelle puntiformi – al caso di una corrente generica. Dalla (7.9) segue inoltre l’andamento asintotico, 1 A˙ µ ∼ , r e le (7.11), (7.12) comportano allora per il campo elettromagnetico l’andamento asintotico previsto, F µν ∼ 1/r. Notiamo infine che la valutazione esplicita delle formule (7.11)–(7.13) richiede solo la ~ del quadrivettore (7.9). conoscenza della parte spaziale A 210

7.1.1

Emissione di quadrimomento

Inserendo la formula per il tensore energia–impulso asintotico (7.13) nella (7.1) otteniamo un’espressione compatta per la distribuzione angolare del quadrimomento emesso nell’unit`a di tempo, d2 P µ ~ 2. = r2 nµ |E| dt dΩ

(7.15)

Per calcolare invece il quadrimomento emesso nell’unit`a di tempo in tutte le direzioni, occorre integrare il membro di destra della (7.15) sull’angolo solido totale, Z

dP µ = r2 dt

~ 2. dΩ nµ |E|

(7.16)

Per processi di radiazione transitori, ovvero processi originati da cariche che sono accelerate solo per un intervallo finito di tempo, sar`a finito anche il quadrimomento emesso in direzione ~n nell’unit`a di angolo solido, durante l’intero processo, dP µ = r 2 nµ dΩ

Z



~ 2 dt. |E|

−∞

Indicando come al solito la potenza emessa con

dε = W, le componenti temporale e dt

spaziali della (7.15) si scrivono, vedi (7.11), d2 ε dW ~ 2 = r2 (A˙ i A˙ j Λij ), = = r2 |E| dt dΩ dΩ d2 P~ dW = ~n. dt dΩ dΩ

Λij ≡ δ ij − ni nj ,

(7.17) (7.18)

Si noti in particolare la compensazione delle potenze di r nella (7.17), una volta inserita la (7.9). Si vede che per il campo elettromagnetico nella zona delle onde, 1) il flusso di quantit`a di moto `e determinato localmente dal flusso di energia e, 2) la quantit`a di moto e l’energia soddisfano localmente le relazioni, ∆P~ = ~n ∆ε,

(∆ε)2 − |∆P~ |2 = 0,

(7.19)

come nel caso delle onde piane. Siccome a livello quantistico il fenomeno dell’irraggiamento corrisponde all’emissione di fotoni, le (7.19) indicano allora che queste particelle sono prive di massa, e che si propagano in direzione radiale. Torneremo su alcuni aspetti quantistici della radiazione nel capitolo 10. 211

Il risultato pi` u importante di questo paragrafo `e la relazione (7.17), in quanto punto di partenza per l’analisi energetica di tutti i fenomeni di radiazione: essa permette di determinare la distribuzione angolare e temporale della radiazione emessa da una generica corrente j µ , una volta valutata la parte spaziale del potenziale vettore attraverso la (7.9). 7.1.2

Sorgenti monocromatiche e onde piane

Abbiamo appena constatato che il campo elettromagnetico nella zona delle onde possiede molte delle propriet`a delle onde piane. Questo fatto chiaramente non `e casuale perch´e, essendo j µ (t, ~x) = 0 per |~x| > R, al di fuori della palla di raggio R il campo `e un campo libero. Pur non essendo libero in tutto lo spazio, la sua forma si avviciner`a tanto pi` ua quella di un campo libero in tutto lo spazio, quanto pi` u ci allontaniamo dalla sorgente. C’`e allora da aspettarsi che nella zona delle onde il campo elettromagnetico risulti con buona approssimazione una sovrapposizione di onde piane, e non stupisce che esso erediti le loro propriet`a pi` u salienti. Tuttavia, `e altrettanto chiaro che in generale questo campo non sar`a costituito da una singola onda piana monocromatica. Per decomporre il campo nella zona delle onde in onde elementari, sfruttiamo la linearit`a in j µ del potenziale vettore (7.9), e utilizziamo le decomposizioni spettrali della corrente (7.2) e (7.3). Considerando una singola frequenza ω inseriamo la sorgente monocromatica (7.4) nella (7.9), Z 1 d3 y eiω(t−r+~n·~y) j µ (ω, ~y ) + c.c. A (x) = 4πr Z 1 iω(t−r) = e d3 y eiω(~n·~y) j µ (ω, ~y ) + c.c. 4πr ≡ εµ eik·x + c.c. µ

(7.20)

Abbiamo definito il vettore d’onda k µ con componenti, ~k = ω ~n,

k 0 = ω, soddisfacente, k 2 = 0,

k · x = k µ xµ = ω(t − r),

e il vettore di polarizzazione, 1 ε = 4πr µ

Z d3 y eiω(~n·~y) j µ (ω, ~y ). 212

(7.21)

Vediamo allora che una sorgente monocromatica genera un campo che nella zona delle onde si riduce formalmente a un’onda piana, con i vettori d’onda e di polarizzazione indicati. In particolare, una corrente di frequenza ω genera un’onda della stessa frequenza. Onde piane e onde sferiche. Tuttavia, la (7.20) non costituisce un’onda piana vera e propria, perch´e sia il vettore d’onda, sia il vettore di polarizzazione esibiscono una dipendenza residua dalla posizione ~x = ~n r. In particolare il vettore di polarizzazione porta il prefattore 1/r, la cui presenza `e tra l’altro richiesta dalla conservazione dell’energia. Infatti, scrivendo il vettore di Poynting mediato nel tempo associato all’onda (7.20) si ha, vedi il problema 5.6, ~ = −2 ~n ω 2 ε∗µ εµ , S ~ `e proporzionale a 1/r2 . Di conseguenza l’energia che attraversa la sezione e si vede che S di un cono di apertura angolare dΩ nell’unit`a di tempo, ~ · (~n r2 dΩ), S `e indipendente da r. L’energia fluisce quindi verso l’infinito, conservandosi. La polarizzazione εµ dipende poi anche dalla direzione ~n, attraverso l’esponenziale nell’integrando della (7.21). Per queste particolari dipendenze da r e ~n il potenziale (7.20) corrisponde, propriamente parlando, a una sovrapposizione di “onde sferiche”, vedi il testo di J.D. Jackson

32

, piuttosto che a un’onda piana.

Tuttavia, in una regione con estensioni spaziali L piccole rispetto a r, L ¿ r, i vettori k µ e εµ risultano praticamente costanti, e localmente la (7.20) appare quindi come un’onda piana. Infatti, all’interno di una regione di questo tipo le variazioni relative di r e ~n sono limitate da, ∆r L < , r r

|∆~n| <

L , r

e la variazione relativa di ~k equivale allora a, |∆~k| L = |∆~n| < ¿ 1. ω r 32

J.D. Jackson, Classical Electrodynamics, 3a edizione, Wiley & Sons, New York, 1998.

213

Per quanto riguarda invece la variazione del vettore di polarizzazione, dalla (7.21) si ricava, µ ¶ Z 1 ∆r µ 3 ∆ε = dy − + i ω (∆~n · ~y ) eiω(~n·~y) j µ (ω, ~y ). 4πr r Considerando che |~y | < R abbiamo, ¯ ¯ ¯ L ¯ ∆r L ¯− ¯ ¯ r + i ω (∆~n · ~y )¯ < r + ωR |∆~n| < (1 + ωR) r . Siccome per sistemi microscopici ωR corrisponde alla velocit`a delle cariche nella corrente, vedi la prossima sezione, anche la variazione relativa di εµ `e allora dell’ordine di L/r ¿ 1. Se a titolo di esempio consideriamo la radiazione emessa dal sole e osservata sulla terra, r corrisponde alla distanza terra–sole, r = 1.5 · 108 km, mentre L `e il diametro della terra, L = 1.2 · 104 km. Sulla superficie della terra il vettore d’onda e il vettore di polarizzazione sono quindi soggetti a variazioni relative molto piccole, dell’ordine di L/r ∼ 10−4 , e la radiazione osservata risulta in pratica composta da onde piane. Sorgenti generiche. Data la linearit`a della (7.9), questi risultati si estendono direttamente alle generiche quadricorrenti (7.2) e (7.3). Nel caso generale il campo elettromagnetico nella zona delle onde risulta dunque – localmente – sovrapposizione di onde piane monocromatiche, e le frequenze presenti nella radiazione sono un sottoinsieme di quelle presenti nella corrente. Pu`o, infatti, succedere che l’integrale nella (7.21) sia zero. In particolare, a un arbitrario sistema di cariche che eseguono un moto periodico di periodo T , corrisponde una corrente periodica del tipo (7.3), e sistemi siffatti emettono quindi radiazione con frequenze appartenenti all’insieme, ωN = N ω0 ,

N = 1, 2, 3 · · · .

Viceversa, a un sistema di particelle che seguono orbite aperte corrisponde una corrente aperiodica del tipo (7.2), e un tale sistema di cariche emette quindi radiazione con uno spettro continuo di frequenze.

7.2

La radiazione dell’antenna lineare

Dalle formule derivate nella sezione precedente si vede che il calcolo del quadrimomento ~ nella zona delle onde. Sfortuemesso richiede la valutazione del potenziale spaziale A natamente l’integrale che compare nella (7.9) raramente pu`o essere eseguito in modo 214

esatto, ed in generale `e necessario ricorrere a un approccio perturbativo, come per esempio lo sviluppo in multipoli che presenteremo nella prossima sezione. Uno dei rari casi in cui l’integrale nella (7.9) pu`o essere valutato esattamente `e quello dell’antenna lineare, alimentata al centro. Senza entrare nei dettagli diamo la forma della densit`a di corrente spaziale in un’antenna lineare di lunghezza L disposta lungo l’asse z, alimentata al centro da un generatore di frequenza ω, ~j(t, ~y ) = I δ(y1 ) δ(y2 ) sen(ω(L/2 − |y3 |)) cos(ωt) ~u, I0 I ≡ . sen(ωL/2)

(7.22) (7.23)

` sottinteso che ~j = 0 per |y 3 | ≥ L/2. Si vede che la corrente si annulla al bordo, E per y 3 = ±L/2, mentre per ogni t fissato essa `e massima al “gap”, ovvero in y 3 = 0, che `e il punto in cui viene alimentata. I0 ha le dimensioni di una corrente, nel senso di carica per unit`a di tempo, e corrisponde alla corrente al gap. ~u = (0, 0, 1) `e il versore lungo z. Confrontando con la (7.4) vediamo in particolare che la (7.22) `e una corrente monocromatica, e quindi essa emette radiazione monocromatica di frequenza ω e lunghezza d’onda λ = 2π/ω. Per determinare il potenziale nella zona delle onde inseriamo la (7.22) nella (7.9), ~ ~x) = I~u A(t, 4πr

Z

Z

L/2

dy

Z

3

dy

1

dy 2 δ(y 1 ) δ(y 2 ) sen(ω(L/2 − |y 3 |)) cos(ω(t − r + ~n · ~y )).

−L/2

Possiamo integrare le funzioni δ in y 1 e y 2 , sostituendo ~n · ~y = n1 y 1 + n2 y 2 + n3 y 3 con n3 y 3 = cosϑ y 3 , dove ϑ `e l’angolo tra ~n e l’asse z. Si ottiene cos`ı, ~ ~x) = I~u A(t, 4πr

Z

L/2

dy 3 sen(ω(L/2 − |y 3 |)) cos(ω(t − r + cos ϑ y 3 )).

−L/2

L’integrazione rimanente su y 3 `e elementare e porta a, ¶ µ µ ¶ ωL ωL I cos(ω(t − r)) ~ cosϑ − cos cos ~u. A(t, ~x) = 2πr ω sen2 ϑ 2 2

(7.24)

~˙ Dalle Il potenziale vettore `e quindi in ogni punto parallelo all’asse z, cos`ı come lo `e A. (7.11) vediamo allora che il campo elettrico giace sempre nel piano individuato dall’asse z e da ~n, essendo ortogonale a ~n. 215

La distribuzione angolare della potenza emessa si ottiene invece derivando la (7.24) rispetto al tempo, e inserendo l’espressione risultante nella (7.17). Sfruttando il fatto che ~˙ `e diretto lungo l’asse z risulta, A ¯ ¯2 dW ¯ ~˙ ¯ = r2 (A˙ i A˙ j Λij ) = r2 ¯A ¯ sen2 ϑ. dΩ

(7.25)

La derivata temporale della (7.24) equivale alla sostituzione, cos(ω(t − r)) → −ω sen(ω(t − r)). Eseguendo inoltre la media temporale della (7.25) dobbiamo effettuare la sostituzione, sen2 (ω(t − r)) → 1/2. In definitiva otteniamo per la distribuzione angolare della potenza media emessa dall’antenna lineare l’espressione

33

,

dW I2 = 02 dΩ 8π

¯ ¯ ¯ cos ¡ ωL cosϑ¢ − cos ωL ¯2 ¯ 2 2 ¯ ¯ ¯ . ωL ¯ ¯ sen( 2 ) senϑ

(7.26)

Da questa formula si vede che l’esistenza di direzioni in cui dW/dΩ `e massima o minima dipende fortemente dai valori del rapporto, ωL πL = . 2 λ Invece di eseguire un’analisi sistematica della distribuzione angolare (7.26), di seguito ci limiteremo a considerare qualche caso particolare. Vediamo comumque che dW/dΩ `e sempre nulla per ϑ = 0, cio`e, lungo la direzione dell’antenna, mentre ha un massimo per ϑ = π/2, cio`e nel piano ortogonale all’antenna, a patto che sia L/λ 6= 2 n con n intero. Inoltre si pu`o vedere facilmente che se L ≤ λ allora la potenza non ha altri estremali, mentre se L > λ allora esistono ulteriori direzioni in cui essa `e massima o nulla. Qualitativamente possiamo dividere le antenne in due categorie, antenne “lunghe” corrispondenti a L ' λ, e antenne “corte” corrispondenti a L ¿ λ. Tratteremo le ultime in dettaglio nel paragrafo 7.3.3 nell’ambito dell’approssimazione di dipolo, mentre di seguito consideriamo un tipico esempio di antenna lunga. 33

Si noti che per L = n λ, con n intero, la normalizzazione di I nella (7.23) deve essere cambiata.

216

Antenne lunghe. Casi particolarmente interessanti di antenne lunghe sono le antenne a “mezz’onda” di lunghezza L = λ/2, e quelle a “onda intera” di lunghezza L = λ. Consideriamo a titolo d’esempio un’antenna a mezz’onda, per cui ωL/2 = π/2. In questo caso la (7.26) si riduce a,

¡ ¢ dW I02 cos2 π2 cosϑ = 2 , dΩ 8π sen2 ϑ

che ha un unico massimo in ϑ = π/2 e un unico minimo in ϑ = 0, dove si annulla. Se vogliamo invece analizzare “l’efficienza” dell’antenna a mezz’onda dobbiamo calcolare la potenza totale, ¢ ¢ ¡ ¡ Z Z Z 2π Z π cos2 π2 cosϑ cos2 π2 cosϑ dW I02 I02 π W= dΩ = 2 dϕ = dϑ . dϑ dΩ 8π 0 senϑ 4π 0 senϑ 0 L’ultimo integrale pu`o esser valutato solo numericamente e vale 1.22. In definitiva otteniamo, W = 0.097 I02 =

1 2 (1/2) I R . 2 0 rad

(7.27)

Abbiamo introdotto la “resistenza di radiazione” dell’antenna a mezz’onda, (1/2)

Rrad = 2 · 0.097, da non confondere con la sua resistenza ohmica Rohm . Se torniamo alle unit`a di misura del sistema MKS, il nostro valore adimensionale della resistenza deve essere moltiplicato per la “resistenza del vuoto”, r R0 =

µ0 ≈ 377 Ohm. ε0

La resistenza di radiazione dell’antenna a mezz’onda diventa allora, (1/2)

Rrad = 2 · 0.097 R0 ≈ 73 Ohm,

(7.28)

mentre per un’antenna a onda intera si otterrebbe, (1)

Rrad ≈ 201Ohm. Si pu`o vedere che questi valori della resistenza sono tipicamente molto maggiori della resistenza ohmica dell’antenna, Rohm ¿ Rrad . 217

Un’antenna lunga costituisce quindi un radiatore molto efficace, in quanto la maggior parte dell’energia fornita dal generatore viene irradiata sotto forma di onde elettromagnetiche, mentre solo una piccola parte viene dissipata per effetto Joule. Nel paragrafo 7.3.3 vedremo, invece, che un’antenna corta costituisce al contrario un radiatore poco efficace, in quanto in quel caso si ha Rohm À Rrad .

7.3

Sviluppi non relativistici

In sezione 7.1 abbiamo ricondotto il calcolo del quadrimomento emesso da una generica distribuzione di carica, si vedano le (7.17) e (7.18), alla determinazione della parte spaziale del quadripotenziale nella zona delle onde (7.9), che qu`ı riportiamo ripristinando la velocit`a della luce, 1 A (x) = 4πr c µ

µ

Z 3

d yj

µ

¶ r ~n · ~y t− + , ~y . c c

(7.29)

Insistiamo sul fatto che questo procedimento fornisce risultati esatti. Tuttavia, in pratica non `e quasi mai possibile valutare l’integrale tridimensionale nella (7.29) analiticamente, ed `e quindi necessario ricorrere a qualche approccio perturbativo. Se le cariche si muovono con velocit`a piccole rispetto alla velocit`a della luce, allora risulta appropriato un metodo perturbativo che viene chiamato “sviluppo in multipoli”. Vediamo in che cosa consiste. 7.3.1

Sviluppo in multipoli

Per definizione lo sviluppo in multipoli del potenziale (7.29) equivale a uno sviluppo in seµ ¶ r ~ n · ~ y rie di Taylor della corrente j µ t − + , ~y attorno al tempo ritardato macroscopico c c r ~n · ~y T = t − , considerando come parametro di sviluppo il ritardo microscopico , c c Z ³ ´ 1 ~n · ~y 1 (~n · ~y )2 2 µ µ A (x) = d3 y j µ (T, ~y ) + ∂t j µ (T, ~y ) + ∂ j (T, ~ y ) + · · · . (7.30) t 4πr c c 2 c2 Come si vede questo sviluppo equivale a un’espansione in potenze di 1/c, e costituisce quindi uno sviluppo non relativistico. Il primo termine nella (7.30) viene chiamato “termine di dipolo”, il secondo “termine di quadrupolo”, e cos`ı via. Spieghiamo innanzitutto il motivo per cui questa espansione risulta appropriata, se le velocit`a delle particelle cariche che compongono la corrente j µ sono piccole rispetto alla 218

velocit`a della luce. Supponiamo che queste particelle si muovano con velocit`a caratteristica v. Esse impiegano allora il tempo caratteristico R/v per attraversare la palla di raggio R entro la quale sono confinate, e ne segue che la corrente varia sensibilmente su scale temporali dell’ordine di t0 = R/v. Dato che |~y | < R, possiamo allora dare la seguente stima del ritardo microscopico, ¯ ¯ ¯ ~n · ~y ¯ R v ¯ ¯ ¯ c ¯ < c = c t0 .

(7.31)

Siccome la corrente varia su µ ¶ scale temporali caratteristiche dell’ordine di t0 , concludiamo ~n · ~y allora che j µ T + , ~y differisce poco da j µ (T, ~y ), a patto che il ritardo microscopico c sia molto minore di t0 , ¯ ¯ ¯ ~n · ~y ¯ ¯ ¯ (7.32) ¯ c ¯ ¿ t0 . Ma per la (7.31) ci`o equivale a, v t0 ¿ t0 c



v ¿ c.

Per velocit`a piccole rispetto a c la corrente potr`a allora essere sviluppata in serie di potenze ~n · ~y di . c Un modo alternativo per analizzare il significato dello sviluppo in multipoli consiste nell’analizzare Aµ frequenza per frequenza, cio`e, considerando la corrente monocromatica (7.4), j µ (t, ~x) = eiωt j µ (ω, ~x) + c.c.

(7.33)

con frequenza ω fissata. La velocit`a caratteristica delle cariche risulta allora essere v = ωR. Siccome in questo caso schematicamente abbiamo, ∂tN jµ ' ω N jµ , dalla (7.31) segue che il termine N –esimo dello sviluppo in (7.30) ammonta a, 1 (ωR)N 1 ³ v ´N 1 (~n · ~y )N N j (T, ~ y ) ' ∂ j (T, ~ y ) = jµ (T, ~y ), µ µ t N ! cN N ! cN N! c che equivale quindi direttamente a uno sviluppo in serie di potenze di

219

v . c

7.3.2

La radiazione di dipolo

Il resto di questa sezione sar`a dedicato a un’analisi dettagliata dell’approssimazione di ordine pi` u basso – l’approssimazione di dipolo – che equivale a considerare nella (7.30) solo il primo termine dello sviluppo, 1 A (x) = 4πr c

Z 3

i

d yj

i

³

r ´ t − , ~y . c

(7.34)

Ricordiamo che per l’analisi della radiazione emessa `e sufficiente determinare Ai . Il campo elettromagnetico risultante dalla (7.34) viene chiamato “campo di dipolo”, e la radiazione ad esso associata “radiazione di dipolo”. Quando le velocit`a delle cariche in gioco sono piccole rispetto alla velocit`a della luce, l’approssimazione di dipolo fornisce in generale valori sufficientemente accurati per il campo asintotico e per il quadrimomento irradiato. Se si richiede, invece, un grado di precisione pi` u elevato, oppure se il campo di dipolo `e nullo, allora nella (7.30) bisogna tenere conto anche dell’ordine successivo, corrispondente al “campo di quadrupolo”. Come vedremo in sezione 7.4, l’energia emessa trasportata ³ v ´2 rispetto a quella trasportata dal dal campo di quadrupolo `e soppressa di un fattore c campo di dipolo. Il momento di dipolo. La (7.34) pu`o essere riscritta in modo pi` u semplice, se si introduce per una generica quadricorrente j µ il suo momento di dipolo (elettrico), Z i

d3 x xi ρ(t, ~x),

D (t) ≡

j 0 = c ρ.

(7.35)

Come conseguenza dell’equazione di continuit`a ∂µ j µ = 0, la sua derivata temporale soddisfa,

Z D˙ (t) = i

d3 x j i (t, ~x).

(7.36)

Infatti, dato che ρ˙ = ∂0 j 0 , si ha, Z D˙ (t) = i

Z 3

i

0

d x x ∂0 j = −

Z 3

i

k

d x x ∂k j = −

3

£

i k

d x ∂k (x j ) − j

i

¤

Z =

d3 x j i ,

dove nell’ultimo passaggio la derivata totale non contribuisce, perch´e per |~x| > R la corrente `e zero. La (7.34) diventa allora semplicemente, Ai =

1 ˙i D, 4πr c 220

(7.37)

dove `e sottointeso che il momento di dipolo `e valutato all’istante ritardato macroscopico t − rc . La caratteristica principale di questa formula – peculiare per l’approssimazione di dipolo – `e che esprime Ai in termini della sola densit` a di carica, senza coinvolgere esplicitamente la corrente spaziale. Il potenziale scalare A0 . Per l’analisi della radiazione `e sufficiente la conoscenza di Ai , ma per completezza facciamo notare che nello sviluppo (7.30) occorre fare una distinzione tra Ai e A0 . Questa distinzione deriva dal fatto che la componente temporale della corrente `e legata alla densit`a di carica ρ dalla relazione j 0 = c ρ, mentre le sue componenti spaziali sono indipendenti da c. Per una singola particella si ha, infatti, ~j = ~v ρ. Ne segue che, se nello sviluppo in multipoli (7.30) per Ai ci si arresta all’ordine (~n · ~y )N /cN , per consistenza nello sviluppo di A0 bisogna considerare anche il termine successivo di ordine (~n ·~y )N +1 /cN +1 . In approssimazione di dipolo nel calcolo di A0 bisogna allora tenere conto anche del termine lineare in ~n · ~y /c. La (7.30) d`a allora, 1 A0 = 4πr c dove Q =

R

µZ

1 d3 y c ρ + ~n · ∂t c



Z d3 y ~y c ρ

1 = 4πr

Ã

ni D˙ i Q+ c

! ,

(7.38)

d3 x ρ `e la carica totale conservata del sistema. Si riconosce nel primo termine,

indipendente dal tempo, il potenziale coulombiano, mentre il secondo, dipendente dal tempo, coinvolge a sua volta il momento di dipolo. Si noti come nell’approssimazione di dipolo il potenziale vettore (7.37), (7.38) soddisfi la gauge di Lorentz ∂µ Aµ = 0, modulo termini di ordine 1/r2 . D’ora in poi porremo di nuovo c = 1. Emissione di quadrimomento. Dato il potenziale vettore (7.37) possiamo usare le (7.11) e (7.12), valide nella zona delle onde, per ottenere espressioni semplici per i campi di dipolo, ~ = − 1 [D ~¨ − (~n · D) ~¨ ~n], E 4πr

~ = − 1 ~n × D. ~¨ B (7.39) 4πr ~¨ e ~n. Inserendo infine la Il campo elettrico giace quindi nel piano individuato da D (7.37) nella (7.17) otteniamo la distribuzione angolare della potenza emessa da un generico sistema di cariche non relativistiche, 1 dW 1 ¨ i ¨ j ij i j D (δ − n n ) = = D dΩ 16 π 2 16 π 2

221

¯ ¯2 ¯ ~¨ ¯ ¯D¯ sen2 ϑ =

1 16 π 2

¯ ¯ ¯ ¨ ¯2 ~ ~ n × D ¯ , ¯

(7.40)

~¨ e ~n. Vediamo quindi che la radiazione di dipolo ha una distridove ϑ `e l’angolo tra D ~¨ mentre `e massima buzione angolare molto semplice: essa `e nulla lungo la direzione di D, ~¨ nel piano ortogonale a D. La potenza totale si ottiene invece integrando dW/dΩ sugli angoli. Usando gli integrali invarianti del problema 2.6 risulta, Z

Z ¡ ¢ dW 1 ¨i ¨j W = dΩ = DD dΩ δ ij − ni nj 2 dΩ 16π µ ¶ 4π ij 1 ¯¯ ~¨ ¯¯2 1 ¨i ¨j ij D D 4π δ − δ = = ¯D¯ . 16π 2 3 6π

(7.41)

Al contrario, la quantit`a di moto totale emessa in tutte le direzioni `e nulla. Infatti, dalla (7.18) segue, dP k = dt

Z

dW 1 ¨i ¨j n dΩ = DD dΩ 16π 2

Z

k

dΩ nk (δ ij − ni nj ) = 0,

(7.42)

dove di nuovo si sono usati gli integrali invarianti. L’annullamento della quantit`a di moto totale emessa `e dovuta al fatto che, come conseguenza dell’invarianza della (7.40) per ~n → −~n, le energie emesse in due direzioni opposte sono uguali; ne segue che le quantit`a di moto emesse in direzioni opposte si cancellano. Sistemi di particelle e Bremsstrahlung. Consideriamo ora come caso particolare un sistema di particelle cariche puntiformi non relativistiche. In questo caso la densit`a di carica `e j 0 (t, ~x) =

X

er δ 3 (~x − ~yr (t)),

r

e per il momento di dipolo la (7.35) d`a, Z ~ D(t) =

d3 x ~x

X r

er δ 3 (~x − ~yr (t)) =

X

er ~yr (t)

r



X ~¨ = D er ~ar ,

(7.43)

r

dove ~ar `e l’accelerazione della particella r–esima. Secondo la (7.41) un tale sistema emette quindi radiazione di dipolo con potenza istantanea, ¯2 ¯ ¯ 1 ¯¯X ¯ er ~ar ¯ . W= ¯ ¯ 6π ¯

(7.44)

r

Questa formula, che lega l’energia emessa direttamente alla causa della radiazione – l’accelerazione delle particelle – generalizza la formula di Larmor (6.128) a un sistema di pi` u 222

particelle. Si noti, in particolare, che la potenza emessa non `e data dalla somma delle P 2 1 potenze individuali, ovvero 6π ar |2 , in quanto sono presenti anche dei termini di r er |~ “interferenza” tra le varie particelle. La presenza di questi termini `e conseguenza del fatto che il campo elettromagnetico soddisfa il principio di sovrapposizione, e che obbedisce quindi alle leggi dell’interferenza. Se indichiamo il campo elettrico asintotico della ~ r , vedi (7.45), la (7.17) si scrive per l’appunto, particella r–esima con E ¯ ¯ ¯X ¯2 dW ¯ ~ r ¯¯ , E = r2 ¯ ¯ ¯ r dΩ e non

dW dΩ

= r2

P ~ 2 r |E r | .

Il fenomeno della radiazione emessa da particelle cariche a causa di un’accelerazione momentanea, o prolungata nel tempo, viene genericamente chiamato Bremsstrahlung, ovvero, radiazione di frenamento. La formula (7.44) quantifica l’entit`a di questa radiazione – sommata sugli angoli – per un arbitrario sistema di particelle non relativistiche. Nei prossimi paragrafi analizzeremo in dettaglio vari casi di Bremsstrahlung non relativistica, tra cui la diffusione Thomson, e la radiazione emessa a causa dell’interazione coulombiana tra due particelle cariche. Particella singola. Consideriamo pi` u in dettaglio il caso di una particella singola, per ~¨ = e ~a. Per i campi a grandi distanze le (7.39) danno allora, cui D ~ = − e [~a − (~n · ~a) ~n], E 4πr

~ = − e ~n × ~a. B 4πr

(7.45)

Si noti come questi campi siano fondamentalmente diversi dai campi prodotti a grandi distanze da una particella non relativistica in moto rettilineo uniforme, vedi (6.70) e (6.68). Vediamo in particolare che in questo caso il campo elettrico non `e pi` u radiale – essendo piuttosto ortogonale alla direzione radiale ~n – e che appartiene al piano formato da ~n e ~a. Per la distribuzione angolare della radiazione la (7.40) d`a invece, e2 |~n × ~a|2 dW = . dΩ 16 π 2

(7.46)

Vediamo che la particella non emette radiazione lungo la direzione dell’accelerazione, mentre l’emissione `e massima nel piano ortogonale ad essa. Anticipiamo che questa propriet`a della distribuzione angolare della radiazione `e caratteristica per il limite non relativisti223

co. Vedremo, infatti, che per particelle ultrarelativistiche la distribuzione angolare della radiazione sar`a radicalmente diversa. Infine, per la potenza totale emessa da una particella singola non relativistica con carica e e accelerazione ~a, la (7.44) si riduce a, W=

e2 | ~a |2 , 6π

che `e la formula di Larmor (6.128). Si noti come le formule per una singola particella non relativistica appena derivate, siano in perfetto accordo con i limiti non relativistici delle corrispondenti formule esatte derivate nel paragrafo 6.4.4, a partire dai campi di Lienard–Wiechert. Assenza della radiazione di dipolo. Menzioniamo ora alcuni casi importanti in cui la radiazione di dipolo `e assente. Oltre al caso ovvio di un sistema di cariche che si muovono di moto rettilineo uniforme, quindi molto distanti tra di loro, la radiazione di dipolo `e assente per un sistema isolato di cariche con rapporto er /mr = γ indipendente da r. In questo caso il momento di dipolo si pu`o infatti scrivere come, ~ D(t) =

X

er ~yr (t) = γ

r

e quindi,

X

mr ~yr (t),

r

³X ´ ~¨ = γ d D mr ~vr = 0, dt

in quanto la quantit`a di moto totale di un sistema isolato non relativistico `e una costante del moto. Concludiamo in particolare che in qualsiasi processo isolato che coinvolge solo una specie di particelle, come per esempio lo scattering tra due particelle identiche, non c’`e emissione di radiazione di dipolo. La radiazione di dipolo `e pure assente per una distribuzione sferica di cariche. Ci`o `e conseguenza del teorema di Birkhoff, vedi problema 2.5, che assicura che una distribuzione sferica di carica nel vuoto d`a luogo a un campo statico. E un campo statico non pu`o emettere radiazione. Per verificare che le nostre formule sono in accordo con questa previsione, `e sufficiente ricordare che per una distribuzione sferica la densit`a di carica dipende solo da r e t, j 0 (t, ~x) = j 0 (t, r). 224

Per il momento di dipolo si ottiene allora, usando coordinate polari e sfruttando gli integrali invarianti, µZ

Z i

3

D (t) =

i 0

¶ µZ 3

d x x j (t, r) =

0

r drj (t, r)

¶ dΩ n

i

= 0.

Nei casi in cui la radiazione di dipolo `e assente diventa dunque rilevante il termine di ordine successivo nello sviluppo (7.30), ovvero, quello corrispondente alla campo di quadrupolo. Per sistemi a simmetria sferica la radiazione `e evidentemente assente a tutti gli ordini. Riepilogo. Concludiamo questo paragrafo riassumendo le varie formule per il potenziale vettore, e la corrispondente distribuzione angolare della potenza emessa. a) Potenziale esatto: 1 A (x) = 4π

Z

µ

d3 y

1 j µ (t − |~x − ~y |, ~y ). |~x − ~y |

b) Potenziale nella zona delle onde: 1 A (x) = 4πr µ

Z d3 y j µ (t − r + ~n · ~y , ~y ).

c) Potenziale nella zona delle onde in approssimazione di dipolo: Z 1 ˙i 1 i d3 y j i (t − r, ~y ) = D. A (x) = 4πr 4πr

a) Potenza locale esatta: dW ~ × B) ~ · ~n. = r2 (E dΩ b) Potenza “emessa” esatta: dW = r2 (A˙ i A˙ j Λij ). dΩ c) Potenza emessa in approssimazione di dipolo: dW 1 = dΩ 16π 2

¯ ¯ ¯ ¨ ¯2 ~ ~ n × D ¯ . ¯

Nell’approssimazione di dipolo si pu`o anche determinare la potenza totale emessa in tutte le direzioni, W=

1 ¯¯ ~¨ ¯¯2 ¯D¯ . 6π 225

7.3.3

Potenza emessa da un’antenna lineare corta

Come prima applicazione dell’approssimazione di dipolo determiniamo la potenza emessa da un’antenna lineare alimentata al centro, molto pi` u corta della lunghezza d’onda su cui emette, L ¿ λ,

ovvero ωL ¿ 1.

(7.47)

Siccome la potenza emessa da un’antenna lineare di lunghezza arbitraria `e gi`a stata calcolata in modo esatto, vedi sezione 7.2, l’analisi che segue ci permetter`a in particolare di discutere i limiti di validit`a dell’approssimazione di dipolo in un esempio concreto. Ripartiamo dalla corrente spaziale (7.22), 3 ~j(t, ~y ) = I0 δ(y 1 ) δ(y 2 ) sen(ω(L/2 − |y |)) cos(ωt) ~u. sen(ωL/2)

(7.48)

In questo caso l’approssimazione di dipolo `e in effetti appropriata perch´e il tempo caratteristico con cui varia la corrente `e t0 = 2π/ω, e la condizione (7.32) diventa allora, |~n · ~y | ≤ L ¿ t0 = 2π/ω, che `e soddisfatta grazie alla (7.47). La potenza emessa dall’antenna pu`o allora essere calcolata usando la (7.40), che coinvolge solo il momento di dipolo. La determinazione di quest’ultimo richiede in realt`a la conoscenza della densit`a di carica, ma questa pu`o essere determinata a sua volta sfruttando la conservazione della quadricorrente, ∂0 j 0 = −∂i j i = −

∂ 3 j . ∂y 3

Dalla (7.48) si ottiene allora facilmente, cos(ω(L/2 − |y 3 |)) j (t, ~y ) = I0 δ(y ) δ(y ) sen(ωt) ε(y 3 ), sen(ωL/2) 0

1

2

dove ε(·) `e la funzione segno. Possiamo allora calcolare il momento di dipolo, Z Z I sen(ωt) 0 3 0 ~ D(t) = d y ~y j (t, ~y ) = d3 y ~y δ(y 1 ) δ(y 2 ) cos(ω(L/2 − |y 3 |)) ε(y 3 ) sen(ωL/2) Z 2I0 sen(ωt) ~u L/2 3 3 2I0 sen(ωt)(1 − cos(ωL/2)) = dy y cos(ω(L/2 − y 3 )) = ~u. sen(ωL/2) 0 ω 2 sen(ωL/2) Siccome per ipotesi abbiamo ωL ¿ 1, questa espressione si riduce a, ~ = I0 L sen(ωt) ~u, D 2ω

~¨ = − 1 I0 ωL sen(ωt) ~u. D 2 226

La potenza istantanea si ottiene allora dalla (7.40), dW (I0 ωL)2 sen2 (ω(t − r)) sen2 ϑ, = 2 dΩ 64 π dove ϑ `e l’angolo tra ~n e l’asse z. Eseguendo la media temporale su un periodo abbiamo < sen2 (ω(t − r)) >= 1/2, e quindi, dW (I0 ωL)2 = sen2 ϑ, 2 dΩ 128 π

(7.49)

da confrontare con il risultato esatto (7.26). In effetti si vede facilmente che nel limite ωL ¿ 1 quest’ultimo si riduce alla (7.49). Per quanto riguarda la distribuzione angolare notiamo che la potenza approssimata (7.49) ha una distribuzione molto semplice – tipica per la radiazione di dipolo – con un massimo nel piano ortogonale all’antenna, e uno zero nella direzione parallela ad essa. Da un confronto qualitativo tra la (7.49) e la (7.26) emerge allora che fino a quando L ≤ λ quest’ultima ha in effetti una forma molto simile alla prima: un unico massimo in ϑ = π/2 e uno zero in ϑ = 0. La discrepanza maggiore tra il trattamento esatto e l’approssimazione di dipolo emerge, invece, se si confrontano le intensit`a delle radiazioni. Per rendercene conto, per semplicit`a consideriamo la potenza totale. Integrando la (7.49) sull’angolo solido si ottiene infatti, (ωL)2 2 1 2 (c) W= I = I0 Rrad , 48 π 0 2

(7.50)

dove la resistenza di radiazione `e data da, (c) Rrad

(ωL)2 π = = 24 π 6

µ ¶2 L . λ

Reinserendo la resistenza del vuoto, R0 ≈ 377 Ohm, risulta dunque, µ ¶2 µ ¶2 π L L (c) Rrad = R0 = 197 Ohm. 6 λ λ

(7.51)

Se in accordo con l’ipotesi di lavoro (7.47) scegliamo, per esempio, L = λ/50 otteniamo, (c)

Rrad = 0.08 Ohm, (1/2)

che `e molto minore della resistenza (7.28) dell’antenna a mezz’onda, Rrad = 73 Ohm. Tuttavia, il dato pi` u rilevante `e che la resistenza ohmica di un’antenna corta pu`o essere 227

(c)

dello stesso ordine di grandezza di Rrad , o anche sensibilmente maggiore: un’antenna corta costituisce quindi in generale un radiatore poco efficace. Infine possiamo chiederci quale risultato avremmo ottenuto se per l’antenna a mezz’onda – sbagliando – avessimo usato l’approssimazione di dipolo. Il risultato sarebbe stata la (7.50) con L = π/ω, cio`e, W=

π 2 I = 0.065 I02 , 48 0

al posto della (7.27), W = 0.097 I02 . Avremmo quindi ottenuto il corretto ordine di grandezza, ma un valore numerico sbagliato. 7.3.4

Diffusione Thomson della radiazione

Un fenomeno che ricopre un ruolo importante in Elettrodinamica `e costituito dalla diffusione di radiazione elettromagnetica da parte di una particella carica libera. Se questo processo viene considerato a livello classico, esso `e descritto da un’onda elettromagnetica che investe una particella carica, e viene chiamato “diffusione Thomson”. A livello quantistico lo stesso processo `e invece descritto dall’urto tra un fotone e una particella carica, e viene chiamato “effetto Compton”. Vediamo in cosa consiste qualitativamente la diffusione Thomson. Se un’onda elettromagnetica piana incide su una particella carica libera, la particella incomincer`a ad oscillare, principalmente lungo la direzione del campo elettrico. Essendo accelerata essa emetter`a a sua volta radiazione elettromagnetica. Questa radiazione “diffusa” viene emessa in direzioni diverse da quella dell’onda incidente, ma vedremo che per velocit`a non relativistiche della particella, essa ha la stessa frequenza dell’onda incidente. Consideriamo dunque una generica onda piana “incidente” in direzione ~u, con campi elettrico e magnetico dati da, vedi problema 5.5, E~ = E~0 eik·x + c.c.,

~ B~ = ~u × E,

dove E~0 `e un generico vettore complesso costante, ortogonale a ~u. In seguito assumeremo che l’onda incidente sia polarizzata linearmente, vale a dire che E~ abbia direzione costante. Avremo allora, E~0∗ = E~0 . 228

L’intensit`a media dell’onda incidente, definita come l’energia che attraversa l’unit`a di superficie nell’unit`a di tempo `e allora data da, ~ >=< |E| ~ 2 >= 2 E02 . I0 =< |S|

(7.52)

In seguito supporremo che l’intensit`a dell’onda incidente sia sufficientemente bassa, in modo tale che la velocit`a della particella si mantenga molto minore della velocit`a della luce. Per l’analisi della radiazione emessa risulter`a dunque appropriata l’approssimazione di dipolo. Vediamo ora qual `e l’effetto di questa onda se investe una particella di massa m e carica e. Per moti non relativistici dovremo risolvere l’equazione, ³ ´ m ~a = e E~ + ~v × B~ .

(7.53)

~ = |E|, ~ il campo magnetico pu`o essere trascurato. L’equaSiccome abbiamo v ¿ 1 e |B| zione da risolvere si scrive allora pi` u precisamente, d2 ~y (t) ~ = e E~0 ei(ω t − k · ~y (t)) + c.c. = 2 e E~0 cos(ω t − ~k · ~y (t)). 2 dt Se supponiamo che la direzione di incidenza sia z – nel qual caso ~k = (0, 0, ω) – e che E~0 m

sia diretto lungo x, si ottiene la soluzione stazionaria, x(t) = −

2 e E0 cos(ωt), m ω2

y(t) = z(t) = 0.

(7.54)

La particella si mette quindi a oscillare attorno all’origine lungo la direzione del campo elettrico incidente, con la sua stessa frequenza ω. Vediamo in particolare che la nostra approssimazione non relativistica `e consistente, purch´e la velocit`a massima vM della particella sia molto minore di 1, vM =

2 e E0 ¿ 1. mω

(7.55)

L’onda diffusa. Dalle (7.54) si ottiene l’accelerazione, ~a(t) =

2 e E~0 cos(ωt). m

229

(7.56)

A questo punto possiamo applicare le formule (7.45) e (7.46), per scrivere i campi di radiazione e la potenza emessa, ´ e2 ³ ~ ~ ~ E = − E0 − (~n · E0 ) ~n cos(ω(t − r)), 2πm r ´ dW e4 ³ 2 ~0 )2 cos2 (ω(t − r)), = E − (~ n · E 0 dΩ 4π 2 m2

~ = ~n × E, ~ B

(7.57) (7.58)

Il campo elettromagnetico di radiazione, che rappresenta l’onda diffusa, ha quindi la stessa frequenza dell’onda incidente, ma si propaga radialmente in tutte le direzioni. Inoltre la sua intensit`a `e massima nel piano passante per la particella ed ortogonale a E~0 . Vediamo poi che la sua polarizzazione appartiene sempre al piano formato da E~0 e ~n. Onda incidente non polarizzata. Analizziamo ora pi` u in dettaglio la distribuzione angolare (7.58) della potenza emessa. Possiamo intanto eseguire la media temporale, che 1 equivale alla sostituzione cos2 (ω(t − r)) → . Inoltre, nella maggior parte dei casi la 2 radiazione incidente non `e polarizzata, ma ammonta a una sovrapposizione equiprobabile di tutte le polarizzazioni E~0 ortogonali a ~k, come nel caso della luce naturale. In questo caso dobbiamo mediare la distribuzione angolare della potenza emessa (7.58), su tutte le polarizzazioni ortogonali a ~k. Per fare questo esplicitiamo i termini della (7.58) che dipendendono dalle polarizzazioni, 2 2 E02 − (~n · E~0 )2 = E02 − (nx E0x + ny E0y )2 = E02 − n2x E0x − n2y E0y − 2 nx ny E0x E0y . 2 2 Prendendo la media di questa espressione si ha < E0x >=< E0y >= 21 E02 , e < E0x E0y >= 0.

Inoltre, se chiamiamo ϑ l’angolo tra ~n e la direzione di inicidenza, nel presente caso l’asse z, allora abbiamo nz = cosϑ, e quindi n2x + n2y = sen2 ϑ. Si ottiene cos`ı, < E02 − (~n · E~0 )2 >= E02 −

1 1 sen2 ϑ E02 = (1 + cos2 ϑ) E02 . 2 2

Per un’onda incidente non polarizzata dalla (7.58) si ottiene allora la potenza diffusa, µ ¶ dW e4 E02 (1 + cos2 ϑ). (7.59) = dΩ n.p. 16 π 2 m2 Si vede che questa potenza risulta massima lungo la direzione di propagazione dell’onda incidente, in entrambi i versi ϑ = 0 e ϑ = π, in accordo con il fatto che per qualsiasi polarizzazione dell’onda incidente, la particella oscilla nel piano ortogonale alla direzione di incidenza. 230

Infine possiamo integrare la (7.59) sugli angoli per ottenere la potenza totale. Usando, Z

Z

Z



2

dΩ (1 + cos ϑ) =

dϕ 0

si ottiene,

π 0

Z µ W=

senϑ dϑ (1 + cos2 ϑ) =

dW dΩ

¶ dΩ = n.p.

16 π , 3

(7.60)

e4 E02 . 3 πm2

Lo stesso risultato si pu`o ovviamente anche ottenere inserendo la (7.56) nella formula di Larmor (6.128) per la potenza totale, e mediando sul tempo. Il risultato cos`ı ottenuto `e indipendente dalle polarizzazioni, e la media su queste `e quindi banale. Sezione d’urto. Dal punto di vista sperimentale le grandezze rilevanti in un processo dσ di diffusione sono la sezione d’urto differenziale , ed eventualmente la sezione d’urto dΩ dσ totale σ. Nel caso in questione `e definita come l’energia diffusa nell’unit`a di tempo dΩ in una data direzione nell’unit`a di angolo solido, divisa l’energia incidente per unit`a di superficie nell’unit`a di tempo, ovvero, l’intensit`a incidente I0 , vedi (7.52). Analogamente, σ `e definita come l’energia diffusa nell’unit`a di tempo in tutte le direzioni, divisa l’intensit`a incidente. Dalle formule scritte sopra risulta, µ ¶ 1 + cos2 ϑ 2 1 dW dσ = = r0 , dΩ I0 dΩ n.p. 2

(7.61)

dove abbiamo introdotto il raggio classico della particella r0 , che per l’elettrone vale, r0 =

e2 = 2.8 · 10−13 cm. 4πm c2

(7.62)

Possiamo confrontare questo raggio con il raggio di Bohr rB , e la lunghezza d’onda Compton λC dell’elettrone, rB =

4π~2 = 5.3 · 10−9 cm, me2

λC =

~ = 3.8 · 10−11 cm. mc

(7.63)

La sezione d’urto totale si ottiene integrando la (7.61) su tutti gli angoli. Usando di nuovo la (7.60) ottiene,

Z σ=

W 8π 2 dσ dΩ = = r . dΩ I0 3 0

(7.64)

Questa sezione d’urto viene chiamata sezione d’urto di Thomson. Essa ha le dimensioni di una superficie e – vista la definizione – pu`o essere interpretata come la superficie che

231

` proprio questa circostanza che l’elettrone “offre” come bersaglio all’onda incidente. E permette di interpretare r0 come il raggio classico dell’elettrone. Bilancio del quadrimomento e reazione di radiazione. Concludiamo l’analisi della diffusione Thomson con un commento sulla conservazione del quadrimomento in questo processo. Ricordiamo innanzitutto che in approssimazione di dipolo la radiazione emessa complessivamente non trasporta quantit`a di moto, vedi (7.42). Di conseguenza alla radiazione diffusa, rappresentata dal campo (7.57), complessivamente non `e associata nessuna quantit`a di moto. Inoltre, vista la definizione di σ, il processo di diffusione in questione pu`o essere interpretato come segue: di tutta l’onda incidente, concettualmente infinitamente estesa, solo la parte che colpisce la superficie σ viene diffusa, mentre il resto passa indisturbato e costituisce l’onda trasmessa. Consideriamo ora il bilancio del quadrimomento separatamente per l’onda trasmessa, l’onda diffusa e la particella. Per l’onda trasmessa il quadrimomento iniziale e finale sono evidentemente uguali. Anche la particella conserva in media il suo quadrimomento, perch´e essa si trova in moto stazionario. All’onda diffusa prima della diffusione `e associato il flusso di energia σI0 , mentre dopo la diffusione le `e associato il flusso W; siccome si ha W = σI0 la sua energia si conserva. Al contrario, il suo flusso di quantit`a di moto prima della diffusione vale, dPz = σI0 , dt mentre dopo la diffusione esso `e nullo! Dato che la quantit`a di moto totale del sistema si deve conservare, dobbiamo concludere che la quantit`a di moto mancante `e stata trasferita alla particella. Quest’ultima deve quindi subire una forza media in avanti pari a, Fz =

dPz 16 π 2 2 = r E , dt 3 0 0

(7.65)

forza che andrebbe ad aggiungersi al membro di destra della (7.53). ~ v ×B) ~ costituisce la causa primaria che Emerge quindi il seguente quadro. La forza e(E+~ imprime un’accelerazione alla particella. Di conseguenza la particella d`a luogo a un campo di radiazione emettendo onde elettromagnetiche le quali, a loro volta, provocano una reazione di rinculo nella particella, rappresentata dalla forza Fz . Questa forza scaturisce quindi dall’interazione tra la particella e il campo da essa stessa creata, e viena chiamata 232

alternativamente “reazione di radiazione”, “forza di autointerazione”, o anche “forza di ~ – la causa primaria – `e frenamento”. Si noti che mentre la forza di Lorentz e(E~ + ~v × B) lineare in E0 , la reazione di radiazione Fz – un effetto secondario – `e quadratica in E0 , e corrisponde a una correzione relativistica. Stimando il rapporto tra le due forze si ottiene infatti, vedi (7.55) e (7.62), 16 π r02 Fz vM r0 vM = E0 ∼ ω r 0 = 2π . e E0 3e c λ c Nel capitolo 12 vedremo che la validit`a dell’Elettrodinamica classica richiede comunque che sia λ > r0 . La forza di reazione `e quindi soppressa rispetto alla forza di Lorentz dal fattore non relativistico vM /c. Per completezza aggiungiamo che in realt`a `e possibile dedurre la presenza della reazione di radiazione (7.65), direttamente dall’equazione di Lorentz “completa” (2.21), d~p ~ + e(E ~ + ~v × B), ~ = e(E~ + ~v × B) dt

(7.66)

~ e B ~ sono i campi di Lienard–Wiechert prodotti dalla particella stessa. Tuttadove E via, in questo caso non `e lecito usare le loro espressioni asintotiche (7.57), perch´e nella (7.66) questi campi sono valutati nella posizione della particella – dove essi sono divergenti. Un’analisi dettagliata del membro di destra della (7.66) conferma s`ı la presenza del termine (7.65), ma rivela anche la presenza di termini infiniti: l’equazione di Lorentz, nella sua forma originale (2.21), dovr`a dunque essere abbondonata. Anticipiamo che una trattazione sistematica della reazione di radiazione, che comporta in particolare la sostituzione dell’equazione di Lorentz con l’equazione di Lorentz–Dirac, vede l’Elettrodinamica classica entrare in contraddizione con se stessa, vedi capitolo 12. Effetti quantistici. La diffusione Thomson come qu`ı analizzata non tiene conto di effetti quantistici, in quanto trascura il fatto che le onde elettromagnetiche sono costituite da particelle, i fotoni. A livello quantistico il processo di diffusione di radiazione di frequenza ω da parte di elettroni si realizza, infatti, attraverso urti tra fotoni “incidenti” di energia ~ ω, ed elettroni, e viene chiamato effetto Compton. In questo caso “l’onda” uscente `e costituita da fotoni che si propagano in tutte le direzioni ϑ. Fino a quando le lunghezze d’onda della radiazione incidente sono molto maggiori della lunghezza d’onda Compton, 233

2πc ~ À λC = , e quindi ~ω ¿ mc2 , gli effetti quantistici possono essere trascurati, ω mc ed `e valida l’analisi svolta sopra. Viceversa, per λ ≈ λC il fotone incidente cede parte

λ=

della sua energia all’elettrone, ed emerge quindi dall’urto con una frequenza pi` u piccola, ovvero, con una lunghezza d’onda λ0 maggiore di λ. Imponendo la conservazione del quadrimomento risulta, infatti, la nota formula dell’effetto Compton, λ0 = λ + 2π(1 − cosϑ)λC , dove ϑ `e l’angolo tra il fotone entrante e quello uscente. Le differenze principali rispetto all’analisi classica della diffusione sono quindi 1) che l’energia non viene pi` u irradiata con continuit`a, ma sotto forma di quanti di luce e 2) che la frequenza della radiazione uscente `e minore di quella della radiazione incidente. Inoltre si pu`o vedere 3) che la sezione d’urto di Thomson subisce una correzione quantistica che al primo ordine in ~ risulta in, µ ¶ 8π 2 λC σ= r 1 − 4π . 3 0 λ Per λ À λC i fotoni entranti e uscenti hanno praticamente la stessa energia ~ω, indipendentemente dall’angolo di diffusione ϑ, e in questo limite sono inoltre valide le formule per le sezioni d’urto (7.61), (7.64). In questo limite l’energia delle radiazioni incidente ed uscente `e data semplicemente dal numero di fotoni moltiplicato per ~ω, e quindi queste sezioni d’urto danno allora anche il numero di fotoni diffusi nell unit`a di tempo, diviso il numero di fotoni incidenti per unit`a di superficie nell’unit`a di tempo, ovvero il “flusso entrante”. 7.3.5

Bremsstrahlung dall’interazione coulombiana

In questo paragrafo consideriamo la radiazione generata dall’interazione elettromagnetica tra due particelle cariche in moto non relativistico – prototipo di Bremsstrahlung non relativistica. Di nuovo siamo interessati principalmente alla determinazione dell’energia emessa sotto forma di radiazione. Dato che nel limite non relativistico l’interazione elettromagnetica tra due particelle `e governata dal potenziale coulombiano α/r, le orbite relative sono coniche, ovvero ellissi, iperboli o parabole. La conoscenza della forma analitica delle orbite faciliter`a notevolmente l’analisi della potenza emessa e, come vedremo, 234

essa ci permetter`a di determinare l’energia totale irraggiata durante il moto in modo esatto. Consideriamo dunque un sistema isolato formato da due particelle cariche, con masse m1 e m2 e cariche e1 e e2 . Indichiamo i vettori posizione rispettivamente con ~r1 e ~r2 , la posizione relativa con ~r = ~r1 − ~r2 , e quella del centro di massa con ~rCM . Allora abbiamo, ~r1 = ~rCM +

m2 ~r, m1 + m2

~r2 = ~rCM −

m1 ~r. m1 + m2

(7.67)

Secondo la teoria dei moti relativi la dinamica del sistema `e allora governata dalle equazioni del moto, µ ~¨r = α

~r , r3

~¨rCM = 0,

(7.68)

dove, α=

e1 e2 , 4π

µ=

m1 m2 , (m1 + m2 )

essendo µ la massa ridotta. Cinematica delle coniche. Siccome il potenziale coulombiano `e centrale e a simmetria sferica, il moto relativo `e piano, e si conservano l’energia ε e il momento angolare L. Introducendo le coordinate polari piane r e ϕ si ha, ε=

α 1 µ v2 + , 2 r

L = µ r2 ϕ. ˙

(7.69)

Per il potenziale in questione le orbite del moto relativo sono coniche. Se l’energia `e negativa, e quindi necessariamente α < 0, l’orbita `e un ellisse di equazione, r(ϕ) =

(1 − e2 ) a , 1 + e cosϕ

dove l’eccentricit`a e e il semiasse maggiore a sono dati da, s α 2 εL2 , a=− . e= 1+ 2 µα 2ε Il periodo risulta essere,

s T = 2π

µ a3 . | α|

Si noti che il momento angolare pu`o essere scritto anche come, L=

p

µ a| α| 235



1 − e2 .

(7.70)

(7.71)

Se l’energia `e invece positiva, le orbite sono iperboli di equazione, r(ϕ) =

(e2 − 1) a , ±1 + e cosϕ

(7.72)

dove il segno + corrisponde al caso attrattivo, α < 0, e il segno – al caso repulsivo, α > 0. I parametri e ed a sono ancora dati dalle (7.71), ma ora le costanti del moto possono essere espressi anche in termini del parametro d’impatto b e della velocit`a asintotica v0 , ε=

1 µ v02 , 2

L = µ b v0 .

(7.73)

Ricordiamo poi che nel caso delle iperboli la variabile angolare `e limitata da, −ϕ0 < ϕ < ϕ0 ,

1 cos ϕ0 = ∓ . e

(7.74)

L’energia emessa. Torniamo ora al calcolo dell’energia emessa via Bremsstrahlung. Secondo la (7.41) la potenza emessa istantanea `e data in termini del momento di dipolo del sistema, dalla formula, 1 W= 6π

¯ ¯2 ¯ ~¨ ¯ ¯D¯ .

(7.75)

~ usando le (7.67), Possiamo valutare D µ ~ = e1 ~r1 + e2 ~r2 = (e1 + e2 ) ~rCM + µ D

e1 e2 − m1 m2

¶ ~r.

Derivando due volte e usando le (7.68) si ottiene, µ ¶ µ ¶ e1 e2 ¨ e1 e2 ~r ¨ ~ D=µ − ~r = − α 3. m1 m2 m1 m2 r Per la potenza istantanea si ottiene allora 34 , µ ¶2 e2 1 α 2 e1 − . W= 6π m1 m2 r4

(7.76)

Vediamo che la radiazione di dipolo `e assente se le due particelle hanno lo stesso rapporto e/m – in particolare se le particelle sono identiche – come dimostrato nel paragrafo 7.3.2. Se siamo interessati all’energia emessa tra due istanti temporali t1 e t2 , dobbiamo integrare la (7.76) tra questi istanti. L’integrale risultante pu`o essere ricondotto a un integrale 34

Ricordiamo che questa formula rappresenta la potenza emessa W(t, r) all’istante t a una distanza r molto grande dalla particella, se il raggio r che compare a secondo membro `e valutato all’istante ritardato t − r. Se valutiamo il raggio r invece in t, allora la formula fornisce l’energia che viene emessa all’istante t e che raggiunge l’infinito. Torneremo su questo punto nel capitolo 9.

236

sugli angoli, valutabile esattamente, se sfruttiamo la costanza del momento angolare (7.69) per scrivere, µ r2 dϕ. L

dt =

Se indichiamo gli angoli corrispondenti ai due istanti temporali t1 e t2 con ϕ1 e ϕ2 , l’energia emessa tra questi due istanti risulta allora, Z

t2

∆ε = t1

µ

µ α2 W dt = 6πL

e1 e2 − m1 m2

¶2 Z

ϕ2 ϕ1

1 dϕ. r2

(7.77)

Inserendo in questa espressione le equazioni polari (7.70) e (7.72) si ottengono integrali elementari che possono essere valutati esattamente. Consideriamo ora separatamente moti ellittici e moti iperbolici. Moti ellittici. Se il moto relativo `e ellittico entrambe le particelle compiono moti periodici di periodo T . La corrente associata j µ `e allora pure periodica, e il sistema emette quindi radiazione sulle frequenze discrete ωN = 2πN/T , con N intero, vedi paragrafo 7.1.2. In questo caso l’energia totale emessa `e evidentemente infinita, e ha senso solo la potenza media, ottenuta mediando la (7.77) su un periodo, µ ¶2 Z 2π Z e1 1 T µ α2 e2 1 W = W dt = − dϕ T 0 6πL T m1 m2 r2 0 µ ¶2 Z 2π µ α2 e1 1 e2 = − (1 + e cosϕ)2 dϕ. 6πL T m1 m2 a2 (1 − e2 )2 0 Usando l’integrale,

Z

2π 0

µ

e2 (1 + e cosϕ) dϕ = 2π 1 + 2 2

¶ ,

e sostituendo i valori cinematici dati sopra si ottiene, µ ¶2 2 1 + e2 e2 α2 e1 − . W= 6πa4 m1 m2 (1 − e2 )5/2

(7.78)

L’energia che la Bremsstrahlung asporta invece durante un ciclo `e data da, ∆εc = T W. Una conseguenza importante della Bremsstrahlung `e che l’energia totale del sistema “cariche + campo”, che nel limite non relativistico qu`ı in esame `e data dalla (7.69), non pu`o restare costante, perch´e durante ogni ciclo essa deve diminuire della quantit`a T W. 237

Di conseguenza le orbite ellittiche non possono restare stabili e si devono, in particolar modo, “aprire”, entrando in un regime spiraleggiante. La causa diretta di questo fenomeno `e di nuovo la forza di frenamento, le cui conseguenze fisiche saranno analizzate in modo sistematico pi` u avanti, vedi capitolo 12. Nel prossimo paragrafo quantitificheremo comunque la perdita di energia (7.78) in un caso importante dal punto di visto storico, quello dell’atomo di idrogeno classico, e vedremo che la forza di frenamento lo farebbe collassare in una frazione di secondo. Moti iperbolici. Se il moto relativo `e iperbolico, entrambe le particelle compiono moti aperiodici. Anche la corrente associata `e allora aperiodica, e il sistema emette dunque radiazione con uno spettro continuo di frequenze. Questo processo corrisponde a un urto tra due particelle cariche che arrivano dall’infinito, si deflettono a vicenda, e poi escono di nuovo verso l’infinito. Negli istanti iniziale e finale l’accelerazione delle due particelle `e nulla, e l’energia totale irradiata durante l’intero processo, come vedremo, risulta finita. Per calcolarla dobbiamo porre nella (7.77) t1 = −∞ e t2 = +∞, ovvero ϕ1 = −ϕ0 e ϕ2 = ϕ0 , vedi (7.74). Inserendo la (7.72) nella (7.77) troviamo per l’energia irradiata durante l’intero processo, µ ¶2 Z ϕ0 Z ∞ e2 1 µ α 2 e1 − ∆ε = W dt = (±1 + e cosϕ)2 dϕ 2 (e2 − 1)2 6πL m m a 1 2 −ϕ0 −∞ µ ¶2 ³ ´ 2 p e1 1 e2 µα 2 2 − (2 + e ) ϕ0 ± 3 (e − 1) . = 6πL m1 m2 a2 (e2 − 1)2 Usando le (7.73) possiamo esprimere questo risultato in termini della velocit`a asintotica v0 e del parametro d’impatto b. Per fare questo `e conveniente introdurre il parametro adimensionale, γ=√

∓1 α = , 2 µ v02 b e −1

ϕ0 =

π − arctg γ. 2

Si noti che nel caso attrattivo si ha γ < 0, mentre nel caso repulsivo risulta γ > 0. Dopo semplici passaggi si ottiene allora, ¶2 h µ ³π ´ i µ3 v05 e1 e2 2 ∆ε = (3γ + 1) − − arctg γ − 3γ γ 3 . 6π α m1 m2 2

(7.79)

Notiamo che per parametri d’impatto grandi, corrispondenti a valori di γ piccoli, l’energia irradiata va a zero, α2 ∆ε ≈ 12 v0

µ

e1 e2 − m1 m2

238

¶2

1 , b3

(7.80)

in accordo con il fatto che per b grandi le orbite si discostano poco da traiettorie rettilinee. Parametri d’impatto piccoli. Se il parametro d’impatto va invece a zero, si ha un urto frontale e, |γ| → ∞. In questo caso la (7.79) ha due andamenti diversi, a seconda che il potenziale sia attrattivo o repulsivo. Nel caso attrattivo si ha γ → −∞, e entrambi i termini tra le parentesi quadre in (7.79) vanno a pi` u infinito. Anche l’energia irradiata tende quindi a pi` u infinito, in accordo con il fatto che l’accelerazione diverge quando le particelle collidono. Si noti, tuttavia, che in questo caso anche la velocit`a delle particelle va a pi` u infinito, e l’approssimazione non relativistica non `e pi` u valida. Nel caso repulsivo le particelle si avvicinano invece solo fino alla distanza minima, rm =

2α , µ v02

e l’energia totale irradiata deve quindi essere finita. In questo caso il parametro γ tende a +∞, ed eseguendo il limite nella (7.79) si trova, µ ¶2 2 µ3 v05 e1 e2 ∆ε0 ≡ lim ∆ε = − . γ→∞ 45 π α m1 m2

(7.81)

Per renderci conto dell’entit`a dell’energia irradiata assumiamo che una delle due particelle sia molto pi` u pesante dell’altra, m2 À m1 , e che le cariche siano uguali, come succede per esempio nell’urto protone/positrone. In queste condizioni il processo equivale all’urto della particella leggera contro la particella pesante, considerata praticamente a riposo. Si ha allora µ ≈ m1 e α = e2 /4π, e otteniamo, ∆ε0 ≈ Infine, dato che ora ε ≈

1 2

8 m1 v05 . 45

m1 v02 , per la diminuzione relativa dell’energia della particella

leggera durante l’urto otteniamo, 16 ³ v0 ´3 ∆ε0 ≈ . ε 45 c Siccome siamo nel limite non relativistico abbiamo v0 ¿ c, e quindi ∆ε0 /ε ¿ 1. Come nel caso (7.80) la perdita di energia per irraggiamento `e quindi completamente trascurabile. 239

Nel prossimo capitolo analizzeremo il fenomeno dell’irraggiamento nel limite ultrarelativistico, ovvero per v ≈ c, e vedremo che le conseguenze saranno drasticamente diverse. Vedremo, infatti, che per velocit`a prossime alla velocit`a della luce gli effetti radiativi possono dare luogo a perdite di energia notevoli, anche negli urti dovuti all’interazione coulombiana. 7.3.6

La radiazione dell’atomo d’idrogeno classico

In questo paragrafo illustriamo brevemente il quadro fenomenologico che emergerebbe per l’atomo d’idrogeno, se la sua dinamica fosse governata dalle leggi della fisica classica. Concentreremo la nostra analisi sullo stato fondamentale dell’atomo, che classicamente corrisponde all’elettrone che compie un moto circolare uniforme attorno al protone, con velocit`a v ¿ 1. Possiamo allora applicare le formule derivate nel paragrafo precedente per il moto ellittico, nel caso particolare di eccentricit`a nulla. Dato che il protone `e molto pi` u pesante dell’elettrone vale m2 À m1 ≡ m e µ ≈ m, e2 e r = a. Siccome la forza centripeta vale e inoltre in questo caso abbiamo α = − 4π 2 2 mv e = , l’energia totale e la velocit`a angolare dell’elettrone diventano, vedi (7.69), r 4πr2 r r e2 r0 e2 1 v m e4 2 ε=− = − mv , ω= = = = , (7.82) 8πr 2 r 4π m r3 r3 (4π)2 ~ 3 dove abbiamo introdotto il raggio classico r0 dell’elettrone, e identificato r con il raggio di Bohr, vedi (7.63). Il moto dell’elettrone `e periodico con periodo T = 2π/ω, e la sua accelerazione ~a(t) `e quindi una funzione periodica semplice. Secondo le (7.45) il campo di radiazione `e allora costituito da una singola onda monocromatica di frequenza ω. Concludiamo che l’atomo d’idrogeno classico emetterebbe radiazione unicamente sulla frequenza fondamentale ω. Come vedremo pi` u avanti, vedi sezione 10.4, una particella relativistica in moto circolare uniforme emette, invece, radiazione su tutte le frequenze ωN = N ω, con N intero. Queste previsioni sono comunque in contrasto con la formula quantistica di Rydberg, che prevede le frequenze di emissione, ωM N

1 = 2

µ

1 1 − 2 2 N M 240



m e4 , (4π)2 ~ 3

dove N e M sono interi. Torniamo ora al calcolo della potenza emessa dall’atomo classico. Ponendo nella (7.78) l’eccentricit`a uguale a zero si ottiene, µ 2 ¶2 e e2 e2 r02 e2 4 2 W= = = ω r , 4π 6π m2 r4 6π r4 6π

(7.83)

dε abbiamo dunque quandt tificato la perdita di energia dell’atomo. Ma dato che ε ∝ −1/r questa perdita comporta in accordo con la formula di Larmor (6.128). Siccome W = −

anche una diminuzione del raggio. Dalle (7.82), (7.83) si ottiene la variazione relativa, 1 dr 1 dε 4 r2 =− = − 03 ≈ −2 · 1010 /s, r dt ε dt 3r dove abbiamo sostituito i valori (7.62), (7.63). Si vede che il raggio dell’orbita dell’elettrone si ridurrebbe a met`a in meno di 10−10 s, e l’atomo di idrogeno classico collasserebbe nella frazione di un secondo ! Si noti in particolare che la velocit`a dell’elettrone andrebbe allora a pi` u infinito, vedi (7.82). ` comunque interessante calcolare la diminuzione relativa dell’energia dell’atomo duE rante un ciclo,

∆ε TW 2πW 8π ³ r0 ´3/2 = = = ≈ 3 · 10−6 , ε ε ωε 3 r

che `e in realt`a una frazione molto piccola. Quello che in ultima analisi fa collassare l’atomo di idrogeno classico in pochissimo tempo `e la brevit`a di un ciclo, r r 2π r T = ≈ 1.4 · 10−16 s. c r0 Per concludere aggiungiamo che la velocit`a dell’elettrone `e data da, r v r0 = ωr = ≈ 0.7 · 10−2 , c r ed era quindi corretto affrontare il problema nell’approssimazione non relativistica di dipolo. Conlcudiamo questo paragrafo con un caveat sui limiti di validit`a della nostra analisi. Da un punto di vista quantitativo l’analisi qu`ı eseguita `e infatti valida solo fino a quando il raggio dell’orbita dell’elettrone non varia apprezzabilmente. Se il raggio non `e costante non `e pi` u costante nemmeno l’accelerazione da inserire nella formula di Larmor, e anche la 241

potenza emessa varierebbe nel tempo. L’equazione del moto dell’elettrone dovrebbe allora essere risolta tenendo conto della perdita di energia attraverso la formula di Larmor, la quale coinvolge a sua volta l’accelerazione incognita. Le equazioni differenziali risultanti sarebbero non lineari, e non risolubili in modo analitico. Per di pi` u, come notato sopra, la diminuzione del raggio porta a un aumento della velocit`a, la quale per r → 0 tenderebbe a pi` u infinito. Riassumendo, per affrontare il problema dell’atomo di idrogeno classico in modo corretto, in linea di principio bisognerebbe risolvere le equazioni di Maxwell e di Lorentz complete, come sistema accoppiato. Inoltre da un certo istante in poi non `e pi` u lecito affrontare il problema nell’approssimazione non relativistica. Tuttavia, le conclusioni qualitative della nostra trattazione restano comunque valide.

7.4

Radiazione di quadrupolo elettrico e di dipolo magnetico

Nei casi in cui la radiazione di dipolo `e assente, ovverosia, quando la derivata seconda del momento di dipolo si annulla, ~¨ = 0, D nello sviluppo in multipoli (7.30) diventa rilevante il termine perturbativo successivo, cio`e, quello lineare in ~n · ~y /c. Questo termine d`a luogo alle cosiddette radiazioni di quadrupolo elettrico e di dipolo magnetico, soppresse rispetto a quella di dipolo elettrico di un fattore non relativistico v/c. In questa sezione determiniamo l’apporto all’eneriga irradiata, dovuto a queste radiazioni. Per via della formula generale (7.17) `e di nuovo sufficiente determinare la parte spaziale del quadripotenziale. ~ fino all’ordine 1/c2 . Riprendiamo lo sviluppo (7.30), considerando ora Il potenziale A anche il termine lineare in ~n · ~y /c. Sottintendendo che la quadricorrente j µ `e valutata in (t − r, ~y ), e ponendo c = 1, abbiamo allora, A

i

Z ³ ´ 1 = j i + (nk y k ) ∂t j i d3 y, 4πr · ¶ ¸ Z µ ¢ 1¡ k i ¢ 3 1 1¡ k i i k i k i k ˙ = y j −y j + y j +y j D + n ∂t dy 4πr 2 2 ¶ µ Z ¡ k i ¢ 3 1 k 1 i k i ik k ˙ ˙ y j +y j d y . D − M n + n ∂t = 4πr 2

242

(7.84)

Abbiamo definito il tensore tridimensionale antisimmetrico, Z ¢ 1 ¡ i k ik M ≡ x j − xk j i d3 x, 2 legato al momento di dipolo magnetico, Z

~ ≡1 M 2

d3 x ~x × ~j,

dalle relazioni, Mi =

1 ijk jk ε M , 2

M ij = εijk M k .

(7.85)

Per un sistema di particelle, per cui, ~j(t, ~x) =

X

er ~vr (t) δ 3 (~x − ~yr (t)),

r

si ha in particolare,

X ~ =1 M er ~yr × ~vr . 2 r

(7.86)

L’ultimo termine in (7.84) pu`o invece essere valutato introducendo il momento di quadrupolo elettrico Dij della distribuzione di carica, e la sua versione “ridotta” Dij , a traccia nulla, Z ij

d3 x xi xj ρ,

D =

ρ = j 0,

Dij = Dij −

1 ij kk δ D , 3

Dii = 0.

(7.87)

L’ultimo termine nella (7.84) pu`o infatti essere espresso in termini di Dij sfruttando l’identit`a,

Z D˙ ij =

¡

¢ xi j j + xj j i d3 x,

analoga alla (7.36). La si dimostra – come nel caso di quest’ultima – con un’integrazione per parti, usando la conservazione della quadricorrente, e ricordando che j µ ha supporto compatto, Z

Z

Z

¡ ¢ x x (∂k j )d x = ∂k xi xj j k d3 x Z Z ¡ i j ¢ k 3 ¡ i j ¢ i j = δk x + x δk j d x = x j + xj j i d3 x.

D˙ ij =

i j

0

3

x x ∂0 j d x = −

i j

k

3

Otteniamo quindi, i

A

¶ 1 ij j ¨ n D˙ − M˙ n + D 2 µ µ ¶ ¶ ¨ kk 1 1 ¨ ij 1 ij ¨ kk D i ij j ˙ ˙ = ni , D −M n + D − δ D nj + 4πr 2 3 24πr 1 = 4πr

µ

i

ij

j

243

(7.88)

dove abbiamo tolto e aggiunto lo stesso termine. Consideriamo ora l’ultimo termine di questa espressione. Dalla definizione (7.87) risulta che Dkk `e funzione solo di t − r, perch´e nell’integrale la densit`a di carica ρ `e valutata in (t − r, ~x). Questo ci permette di scrivere, Ã ! µ ¶ ¨ kk (t − r) D D˙ kk (t − r) 1 i i n =∂ +o 2 . (7.89) 24πr 24πr r Il termine o(1/r2 ) `e ininfluente perch´e il potenziale `e valutato nella zona delle onde. Inoltre sappiamo che una funzione del tipo

1 r

f (t − r) soddisfa l’equazione delle onde per r 6= 0,

vedi problema 5.7. Questo ci permette di concludere che l’ultimo termine nella (7.88) pu`o essere eliminato con una trasformazione di gauge residua, Ai → Ai + ∂ i Λ, 2Λ = 0, scegliendo, Λ=−

D˙ kk (t − r) . 24πr

Alla stessa conclusione si giunge osservando che un contributo ad Ai che `e proporzionale a ni , come quello in (7.89), comunque non contribuisce alla potenza (7.17), perch´e Λij nj = 0. Ritroviamo il fatto che l’energia, essendo una quantit`a osservabile, `e invariante sotto trasformazioni di gauge. In definitiva, a meno di una trasformazione di gauge, e ripristinando la velocit`a della luce, otteniamo per il potenziale corretto fino all’ordine 1/c2 , ¶ µ 1 1 1 i ij j ij j i ¨ n . D˙ − M˙ n + D A = 4πr c c 2c

(7.90)

In questa approssimazione il campo nella zona delle onde risulta quindi sovrapposizione lineare di un campo di dipolo elettrico, un campo di dipolo magnetico e un campo di quadrupolo elettrico. Gli ultimi due sono soppressi di un fattore 1/c rispetto al primo, e costituiscono quindi correzioni relativistiche di ordine superiore. Confrontando la (7.43) con la (7.86) si vede in particolare che, schematicamente, si ha, M ij ∼ v Di . La potenza totale. In presenza dei campi di dipolo magnetico e di quadrupolo elettrico la distribuzione angolare della potenza emessa (7.17) esibisce ora una dipendenza dagli angoli abbastanza complicata, perch´e ora ni compare non solo in Λij , ma anche in Ai .

244

Ciononostante `e ancora possibile derivare un’espressione compatta per la potenza totale. Integrando la (7.17) sull’angolo solido si ottiene infatti, r2 W = c

Z

(A˙ i A˙ j Λij ) dΩ (7.91)    ik jl Z ˙ ˙ ik jl ¨ ¨ ¨ ¨ 1 ¨ i − M nk + D nk  D ¨ j − M nl + D nl  (δ ij − ni nj ). dΩ D = 2 3 16π c c 2c c 2c

Gli integrali sugli angoli possono essere valutati come al solito, usando gli integrali invaij ¨ i, M ¨ ij e D ¨˙ devono contrarsi tra di loro, e rianti. Siccome alla fine tutti gli indici di D siccome Dij `e simmetrico e a traccia nulla ed M ij `e antisimmetrico, i termini misti non contribuiscono all’integrale. I termini diagonali, invece, possono esser valutati facilmente usando gli integrali invarianti. Dalla relazione (7.85) si ricava in particolare, ¯ ¯2 ¨~ ¯ ¨ ij M ¨ ij = 2 ¯¯M M ¯ . Il risultato finale che cos`ı si ottiene `e, 1 W= 6πc3

¯ ¯2 ¯ ~¨ ¯ ¯D ¯ +

1 ¯¯ ¨~ ¯¯2 1 ¨˙ ij ¨˙ ij M D D . + ¯ ¯ 6πc5 80πc5

(7.92)

I tre contributi alla potenza corrispondono rispettivamente alla radiazione di dipolo elettrico, di dipolo magnetico e di quadrupolo elettrico, gli ultimi due termini essendo subleading di un fattore 1/c2 rispetto al termine di dipolo elettrico. Come si vede, grazie alla cancellazione dei termini misti non ci sono correzioni di ordine 1/c4 . Si noti, tuttavia, che tali correzioni sono presenti nella distribuzione angolare dW/dΩ. Facciamo infine un commento importante sull’utilizzo corretto della formula (7.92). L’espansione non relativistica (7.30) del potenziale nella zona delle onde pu`o essere scritta come, ~= 1A ~1 + 1 A ~2 + 1 A ~3 + · · · , A 2 c c c3

(7.93)

~ N intendiamo il contributo di 2N –polo, includendo anche i corrispondenti condove con A tributi magnetici. La (7.90) rappresenta allora i primi due termini di questa espansione. ~ N contiene N − 1 fattori dei versori ~n. Se si Notiamo in particolare che il termine A inserisce lo sviluppo (7.93) nella (7.91) si ottiene una serie di potenze in 1/c, ma dato che l’integrale sugli angoli di un numero dispari di fattori ~n `e zero, sopravvivono solo i 245

prodotti del tipo A˙ N A˙ M con M + N pari. La (7.91) si scrive allora, µ ¶¶ Z µ ´ 1 ˙i ˙j 1 ³ ˙i ˙j 1 2 i ˙j ˙ Λij dΩ. W=r A1 A1 + 5 A2 A2 + 2 A1 A3 + o 7 3 c c c Si vede, dunque, che per calcolare correttamente la potenza emessa fino all’ordine 1/c5 , alla (7.92) andrebbe aggiunto il termine dovuto al prodotto misto A˙ i1 A˙ j3 , che coinvolge ~ 3 . Possiamo comunque concludere che la (7.92) d`a la potenza la radiazione di sestupolo A corretta fino all’ordine 1/c5 , se la radiazione di dipolo `e assente, ~˙ 1 = 0 A



~¨ = 0. D

Solo in questo caso la (7.92) `e allora di utilit`a concreta. In caso contrario in generale bisogna tenere conto anche della radiazione di sestupolo. Assenza delle radiazioni di quadrupolo e di dipolo magnetico. Vediamo ora qualche caso in cui i contributi di ordine 1/c5 alla potenza emessa (7.92) si annullano. Il contributo er = γ indi dipolo magnetico `e nullo per un sistema isolato di particelle, con rapporto mr dipendente da r. Questo `e una conseguenza della conservazione del momento angolare di un sistema isolato. Per vederlo `e sufficiente inserire la relazione er = γ mr nella definizione (7.86) del momento di dipolo magnetico. Risulta, X γ~ ~ =γ ~yr × mr ~vr = L, M 2 r 2 ~ `e il momento angolare totale conservato; ne segue che M ~˙ = 0. Il contributo di dove L dipolo magnetico `e assente anche per un sistema isolato composto da due sole particelle, con cariche arbitrarie. In questo caso nel sistema di riferimento del centro di massa si ha m1~r1 + m2~r2 = 0, p~1 = −~p2 , e risulta, ~ = 1 (e1 ~r1 × ~v1 + e2 ~r2 × ~v2 ) = 1 M 2 2

µ

e2 e1 + 2 2 m1 m2



m1 m2 ~ L, m1 + m2

~ = ~r1 × p1 + ~r2 × p~2 `e il momento angolare totale conservato del sistema. Di nuovo dove L ~˙ = 0. abbiamo quindi che M Infine, come conseguenza del teorema di Birkhoff i contributi di ordine 1/c5 nella (7.92) si devono annullare entrambi, se la corrente j µ `e a simmetria sferica, ~j = ~x j(t, r),

246

~ `e nullo, perch´e ~x × ~j = 0. Per quanto riguarda invece j 0 = ρ(r, t). In effetti si vede che M il momento di quadrupolo ridotto, usando coordinate polari si ha, µ ¸ ·Z µ ¶ ·Z ∞ ¶¸ Z 1 ij 1 ij 2 ij 3 i j 4 i j D = d x xx − δ x ρ= r ρ dr dΩ n n − δ = 0, 3 3 0

(7.94)

in quanto l’integrale sugli angoli `e zero.

7.5

Problemi

7.1 Radiazione di ciclotrone nel limite non relativistico. Si consideri una particella di carica e che in presenza di un campo magnetico costante e uniforme compie un moto circolare uniforme, con frequenza ω = eB/m e raggio R, tale che v = ωR ¿ 1. a) Si determini il campo elettrico generato dalla particella nella zona delle onde. b) Per ogni istante t fissato si determinino le direzioni in cui la potenza emessa `e massima e minima. c) Mediando su tempi grandi rispetto al periodo si dimostri che la distribuzione angolare della potenza media `e data da, e2 ω 4 R2 dW = (1 + cos2 ϑ), dΩ 32π 2 dove ϑ `e l’angolo tra la direzione di osservazione e l’asse della circonferenza. d) Supponendo che la carica sia vincolata a un anello di raggio R, si determini la legge oraria con cui la velocit`a della particella diminuisce. Si assuma che valga, |v| ˙ ¿ ω 2 R, in modo da poter considerare nella formula di Larmor solo l’accelerazione centripeta. Si verifichi la validit`a di questa ipotesi a posteriori. 7.2 Si consideri una particella carica leggera che compie un moto circolare uniforme attorno a una particella carica pesante, nelle stesse ipotesi del paragrafo 7.3.6. a) Si determini la legge oraria con cui variano la velocit`a e il periodo della particella leggera. b) Si discutano i limiti di validit`a dell’analisi svolta. 247

7.3 Distribuzioni di carica a simmetria sferica. Si consideri la formula (7.9) per il potenziale Aµ nella zona delle onde. Si supponga che la corrente j µ sia dotata di simmetria sferica, come specificato nel problema 2.5. Si verifichi che una tale distribuzione di carica non irradia in nessuna direzione, cio`e, dW = 0, dΩ

∀ ~n,

come implicato dal teorema di Birkhoff. ` sufficiente dimostrare Ai dato in (7.9) `e della forma, Traccia dello svolgimento. E ~ ~x, ) = ~n g(t, ~x), A(t,

(7.95)

per qualche funzione g. A questo scopo si pu`o sfruttare il seguente teorema sugli integrali invarianti tridimensionali. Teorema: Sia data una funzione di due variabili tridimensionali f (~x, ~y ), invariante per rotazioni, cio`e, f (R~x, R~y ) = f (~x, ~y ),

∀ R ∈ SO(3),

condizione che risulta essere equivalente ad assumere che f dipenda da ~x e ~y solo attraverso gli invarianti |~x|, |~y | e ~x · ~y . Si definisca la funzione vettoriale, Z F~ (~x) =

~y f (~x, ~y ) d3 y.

Allora F~ `e necessariamente della forma, F~ (~x) = ~x F0 (|~x|).

(7.96)

Dimostrazione: eseguendo nell’integrale che definisce F~ il cambiamento di variabili ~y → R~y , si ricava che F~ `e una “funzione covariante” per rotazioni, cio`e, F~ (R~x) = RF~ (~x),

∀ R ∈ SO(3).

La funzione F~ (~x) `e allora necessariamente della forma (7.96). Risulta che la funzione g(t, ~x) che compare nella (7.95), in generale `e diversa da zero e dipendente dal tempo. Ci`o sembra in contraddizione con il teorema di Birkhoff, secondo cui per distribuzioni sferiche di carica il campo elettromagnetico nel vuoto `e statico. Il 248

paradosso si risolve facilemente se si ricorda che Aµ `e definito modulo una trasformazione di gauge. La funzione g che compare nella (7.95) `e, infatti, della forma particolare g(t, ~x) = 1 f (t r

− r), e si pu`o fare vedere allora che esiste una trasformazione di gauge che annulla Q Ai , e riporta allo stesso tempo il potenziale scalare nella forma standard A0 = . 4πr 7.4 A partire dai campi di Lienard–Wiechert (6.99) si verifichi che il tensore energia– impulso del campo prodotto da una particella in moto arbitrario, nella zona delle onde si riduce a, µν ~ 2, = nµ nν |E| Tem

in accordo con la formula generale (7.13). Traccia dello svolgimento. Nella zona delle onde il campo elettromagnetico (6.99) `e dominato dal campo di accelerazione (6.102), che riscriviamo come, F µν → Faµν =

e (mµ ∆ν − mν ∆µ ) , 4π(um)3 R

∆µ ≡ (um) wµ − (wm) uµ .

Questa scrittura `e conveniente in quanto si ha, mµ mµ = 0 = mµ ∆µ ,

∆2 = (um)2 w2 + (wm)2 .

Allora `e immediato valutare il tensore energia–impulso nella zona delle onde, µν Tem = F µρ Fρ ν +

1 µν ρσ e2 ∆2 η F Fρσ = − mµ mν . 4 16π 2 (um)6 R2

(7.97)

Per r grandi si ha R → r, m ~ → ~n, e segue in particolare che mµ → nν . La verifica ~ a |2 , vedi (6.108), `e lasciato come che il coefficiente di nµ nν nella (7.97) eguaglia allora |E esercizio. 7.5 Bremsstrahlung in campo coulombiano a grandi distanze. Si consideri un elettrone non relativistico che passa accanto a un nucleo di carica Ze, considerato fisso, a una distanza molto grande. In questo modo la sua traiettoria si discosta poco da una retta. Indicando la sua velocit`a asintotica con v0 ¿ 1, e il parametro d’impatto con b, la sua distanza dal nucleo come funzione del tempo pu`o allora essere approssimata con, q r(t) = |~y (t)| '

249

b2 + v02 t2 .

a) Considerando che l’accelerazione dell’elettrone lungo la traiettoria `e data da, ~a = −

Ze2 ~y , 4πm r3

si dimostri che durante il passaggio vicino al nulceo esso irraggia l’energia, ∆ε(v0 , b) =

e6 Z 2 1 . 2 2 192π m v0 b3

Si confronti questa espressione con il risultato esatto (7.79). b) Si supponga ora di avere un fascio di elettroni incidenti a velocit`a v0 . Si dimostri che “l’irraggiamento efficace”, definito come la potenza irraggiata Wrad divisa per il flusso j di elettroni incidenti, `e dato in generale da 35 , Z ∞ χ(v0 ) = 2π b db ∆ε(v0 , b),

Wrad = χ(v0 ) j.

(7.98)

0

Si noti che χ(v0 ) ha le dimensioni di [energia]·[area]. c) Per il caso in questione l’integrale in b diverge per b → 0. A questo proposito bisogna tenere presente che il calcolo di ∆ε(v0 , b) eseguito sopra `e valido per b grandi, e che a distanze piccole non si possono trascurare gli effetti quantistici. In Meccanica Quantistica un cut–off naturale `e fornito dal principio di indeterminazione, che suggerisce di stimare la distanza di minimo avvicinamento d attraverso d mv0 ≈ ~, ovvero d ≈ ~/mv0 . Si pu`o allora dare una stima dell’irraggiamento efficace sostituendo l’estremo inferiore dell’integrale in (7.98) con b ≈ d. Si ottiene, χ(v0 ) ≈

e6 Z 2 , 96 π m~ c3

(7.99)

formula che riproduce il corretto ordine di grandezza del risultato della Meccanica Quantistica. In realt`a si pu`o vedere che per un fascio non relativistico di elettroni incidenti – per esempio – su un solido, la perdita di energia per irraggiamento (7.99) `e soppressa di un fattore (v0 /c)2 , rispetto alla perdita di energia dovuta alle collisioni. In questo caso il fenomeno dell’irraggiamento diventa quindi rilevante solo nel limite ultrarelativistico. 7.6 Si consideri una particella non relativistica in un ciclotrone come nel problema 7.1. a) Si dimostri che la radiazione di dipolo magnetico `e assente. 35

Con “flusso incidente” si intende in generale il numero di particelle incidenti che attraversano l’unit`a di superficie nell’unit`a di tempo.

250

b) Si determini il contributo alla potenza emessa dovuto alla radiazione di quadrupolo, confrontandolo con il contributo della radiazione di dipolo. c) Si determinino le frequenze presenti nella radiazione di quadrupolo. 7.7 Si consideri un urto tra due particelle cariche identiche non relativistiche, nel sistema di riferimento del centro di massa. Si stimi la potenza istantanea emessa durante l’urto, confrontandola con la potenza istantanea emessa nell’urto tra due particelle della stessa massa ma di carica opposta. Per la soluzione si veda il testo di L.D. Landau et. al. paragrafo 71, problema 1.

36

L.D. Landau e E.M. Lifsits, Teoria dei Campi, Editori Riuniti, Roma, 1976.

251

36

,

8

La radiazione gravitazionale

Questo capitolo `e dedicato a un confronto tra la radiazione elettromagnetica e quella gravitazionale, ed `e quindi di carattere pi` u speculativo, visto che la seconda attende tuttora un riscontro sperimentale diretto. Per concretezza considereremo queste radiazioni nel limite non relativistico, ovvero quando vengono generate da corpi che si muovono con velocit`a piccole rispetto alla velocit`a della luce. In questo modo risulta appropriato lo sviluppo in multipoli, e cos`ı avremo a disposizione formule sufficientemente esplicite da permettere un confronto concreto. Riporteremo le previsioni fatte dalla Relativit`a Generale omettendo evidentemente le deduzioni, ma forniremo, ove possibile, argomentazioni euristiche. Nonostante le onde gravitazionali attendano a tuttoggi una conferma sperimentale diretta, esistono pochi dubbi sul fatto che qualsiasi corpo accelerato ne debba emettere, non per ultimo perch´e le equazioni di Einstein le predicono come soluzioni. Resta comunque il fatto curioso che fino a pochissimo tempo fa, l’unica traccia indiretta della loro esistenza proveniva dalla pulsar binaria PSR 1913+16, scoperta nel 1974 da R.A. Hulse e J.H. Taylor, che nel 1993 valse ai suoi scopritori il premio Nobel

8.1

37

.

Onde gravitazionali e onde elettromagnetiche

Per quanto riguarda il confronto tra le onde elettromagnetiche e quelle gravitazionali i risultati di questo capitolo possono essere riassunti come segue. 1) Mentre le onde elettromagnetiche costituiscono soluzioni esatte delle equazioni di Maxwell, le equazioni di Einstein ammettono come soluzioni onde gravitazionali solo nel limite di campo debole. Questa approssimazione `e pi` u che giustificata, perch´e le onde gravitazionali, se esistono, hanno sicuramente un’intensit`a bassissima, altrimenti sarebbero gi`a state osservate. 2) Cos`ı come la sorgente del campo elettromagnetico `e la quadricorrente j µ , cos`ı la sorgente del campo gravitazionale `e il tensore energia–impulso T µν del sistema, e cos`ı come una carica elettrica accelerata emette onde elettromagnetiche, cos`ı qualsiasi corpo accelerato emette onde gravitazionali. 3) Un sistema a simmetria sferica emette n`e onde elettromagnetiche, n`e onde gravitazionali. 4) Le onde gravitazionali trasportano quadrimomento 37

Per osservazioni pi` u recenti si veda M. Kramer et. al, Tests of General Relativity from Timing the Double Pulsar, Science 314, 97-102 (2006); astro–ph/0609417.

252

come quelle elettromagnetiche, ma rispetto alle ultime l’intensit`a delle prime `e soppressa ³ v ´2 di un fattore relativistico . Questo segue dal fatto che le radiazioni di dipolo “eletc trico” e “magnetico” nel caso gravitazionale sono assenti per qualsiasi sistema isolato, e che il contributo dominante della radiazione gravitazionale `e quindi costituito dalla radiazione di quadrupolo. 5) Ricordiamo che entrambi i tipi di onda sono onde trasversali a due gradi di libert`a, che si propagano con la velocit`a della luce. Ma mentre le onde elettromagnetiche hanno elicit`a ±1, quelle gravitazionali hanno elicit`a ±1. 6) Infine facciamo notare, senza entrare nei dettagli, che il gruppo di simmetria di “gauge” dell’interazione gravitazionale `e rappresentato dai “diffeomorfismi”, ovverosia, da arbitrari cambiamenti di coordinate, xµ → x0µ (x), che generalizzano le trasformazioni di Poincar´e, xµ → Λµ ν xν + aµ .

8.2

Le equazioni per un campo gravitazionale debole.

In questa sezione useremo da una parte argomenti di invarianza relativistica, e dall’altra la stretta analogia esistente tra le forze gravitazionale e elettromagnetica a livello non relativistico, per dedurre le equazioni di propagazione per un campo gravitazionale di bassa intensit`a in modo euristico. Le equazioni che otterremo, vedi (8.10), si identificano con le equazioni di Einstein nel limite di campo debole. Come vedremo, queste equazioni hanno una struttura analoga a quella delle equazioni di Maxwell in gauge di Lorentz, e sfruttando l’esperienza accumulata con queste ultime non avremo nessuna difficolt`a a risolvere le prime. Cominciamo con la semplice osservazione che a livello non relativistico le interazioni gravitazionale e elettromagnetica hanno in realt`a la stessa identica struttura. Le forze quasi–statiche tra due corpi sono infatti date da, e1 e2 ~r F~em = 4πr3 m1 m2 F~gr = −G 3 ~r, r

(8.1) (8.2)

essendo G la costante di Newton. Corrispondentemente i potenziali scalari elettrico e

253

gravitazionale soddisfano le equazioni di tipo Poisson, −∇2 ϕem = ρe , ∇2 ϕgr = 4πG ρm ,

(8.3) (8.4)

dove ρe `e la densit`a di carica elettrica e ρm la densit`a di massa. Queste equazioni evidentemente non sono covarianti per trasformazioni di Lorentz, ma nel caso elettromagnetico sappiamo bene come modificare la (8.3) per renderla tale. Come primo passo dobbiamo covariantizzare il Laplaciano sostituendolo con il d’Alembertiano, −∇2 → −∇2 + ∂02 = 2, ottenendo cos`ı, 2ϕem = ρe .

(8.5)

Come secondo passo dobbiamo assegnare un ben definito carattere tensoriale alle grandezze coinvolte. A questo proposito ricordiamo che la densit`a di carica `e la componente 0 della quadricorrente, ρe = j 0 , e cos`ı possiamo concludere che anche il potenziale scalare debba essere la componente 0 di un certo quadrivettore Aµ , ϕem = A0 . Imponendo l’invarianza di Lorentz arriviamo cos`ı a postulare l’equazione, 2Aµ = j µ .

(8.6)

La conservazione della quadricorrente impone infine il vincolo, ∂µ Aµ = 0.

(8.7)

Abbiamo effettivamente ottenuto le equazioni di Maxwell in gauge di Lorentz. Cerchiamo ora di applicare la stessa strategia alla (8.4), per derivare un’equazione relativistica per il campo gravitazionale. Di nuovo cominciamo sostituendo la (8.4) con, 2ϕgr = −4πGρm .

(8.8)

Per individuare il multipletto tensoriale al quale appartiene il campo ϕgr , dobbiamo allora trovare il multipletto tensoriale al quale appartiene la densit`a di massa. A questo proposito ricordiamo che in Relativit`a Ristretta la massa `e una forma di energia, e ci dobbiamo allora aspettare che in una teoria relativistica della gravitazione il campo gravitazionale venga generato non dalla massa, ma piuttosto dall’energia di un corpo. Sappiamo, infatti, che i 254

fotoni vengono deviati da un campo gravitazionale, pur non possedendo massa, ma “solo” energia. Nella (8.8) dobbiamo quindi sostituire la densit`a di massa con la densit`a di energia, che altro non `e che la componente 00 del tensore energia–impulso, ρm → T 00 . Si noti che per un sistema di particelle non relativistiche T 00 si riduce di nuovo alla densit`a di massa, vedi (2.71). Questa analisi ci induce dunque a considerare ϕgr come la componente 00 di un tensore doppio simmetrico H µν , il “campo gravitazionale”. Convenzionalmente si pone, ϕgr =

1 00 H . 4

La (8.8) si scrive allora, 2H 00 = −16πG T 00 ,

(8.9)

che si covariantizza naturalmente in, 2H µν = −16πG T µν .

(8.10)

La legge di conservazione ∂µ T µν = 0, analoga a ∂µ j µ = 0, impone poi al campo gravitazionale il vincolo, ∂µ H µν = 0.

(8.11)

Confrontando la (8.10) con la (8.6) si vede che la sorgente del campo gravitazionale `e il tensore energia–impulso, cos`ı come la quadricorrente elettrica `e la sorgente del campo elettromagnetico. Ma a parte questo, la struttura delle (8.10), (8.11) `e identica a quella delle (8.6), (8.7), e la soluzione delle prime sar`a quindi immediata. 8.2.1

La relazione con le equazioni di Einstein

Le equazioni per il campo gravitazionale (8.10) costituiscono una covariantizzazione “minimale” della (8.4), in quanto realizzano l’invarianza di Lorentz nel modo pi` u semplice. In realt`a le equazioni di campo esatte, ovvero, le equazioni di Einstein, come postulate ` infatti dalla Relativi`a Generale, si riducono alle (8.10) solo nel limite di campo debole. E immediato rendersi conto le (8.10) non possono descrivere la dinamica del campo gravitazionale in modo esatto. Il motivo principale `e che secondo la (8.10) il campo gravitazionale 255

sarebbe generato unicamente dal tensore energia–impulso T µν della materia, che per un sistema di particelle cariche, per esempio, `e dato dalla (2.66). Questa equazione non tiene dunque conto dell’energia e della quantit`a di moto trasportate dal campo gravitazionale stesso. Occorre quindi completare il membro di destra della (8.10), aggiungendo il tenµν µν sore energia–impulso Tgr del campo gravitazionale. In analogia con il tensore Tem del µν campo elettromagnetico, Tgr dovrebbe essere costruito con termini quadratici in H µν , ma

secondo la Relativit`a Generale esso contiene tutte le potenze (Hµν )N , per N ≥ 2. Emerge cos`ı la differenza fondamentale tra le equazioni di Maxwell e quelle di Einstein: mentre le prime sono lineari in Aµ in quanto il campo elettromagnetico non porta carica elettrica, le seconde sono (altamente) non lineari in Hµν in quanto il campo gravitazionale porta quadrimomento. Facciamo tuttavia notare che, se il campo gravitazionale `e di intensit`a cos`ı bassa da µν non (auto)influenzare la sua propagazione, allora nella (8.10) il contributo Tgr potr`a essere

trascurato. Data la presenza di potenze di tutti gli ordini in Hµν , per ottenere il corretto completamento non lineare della (8.10), ovvero le equazioni di Einstein, `e necessario ricorrere al principio di equivalenza, che a sua volta si traduce nella richiesta di invarianza sotto diffeomorfismi. Mentra questa costruzione esula dagli scopi di questo testo, spieghiamo comunque in che modo il campo Hµν `e legato alla “curvatura” dello spazio–tempo. Come anticipato nel paragrafo 5.3.2, in presenza di un campo gravitazionale non nullo l’intervallo tra due eventi si scrive, ds2 = dxµ dxν gµν (x), dove gµν rappresenta la “metrica” di uno spazio–tempo curvo. Se la scriviamo nella forma, gµν (x) = ηµν + hµν (x), allora il campo hµν quantifica lo scostamento della metrica, dalla metrica ηµν dello spazio– tempo piatto. Dato che secondo Einstein `e la materia a curvare lo spazio, in assenza di materia (e di onde gravitazionali) si dovr`a dunque avere hµν = 0. Si definisce poi il campo Hµν a partire da hµν attraverso, Hµν = hµν − 256

1 ηµν hρ ρ , 2

(8.12)

relazione che si inverte facilmente, dato che H ρ ρ = −hρ ρ , hµν = Hµν −

1 ηµν H ρ ρ . 2

(8.13)

Si dimostra allora che nel limite di campo debole, cio`e, per |hµν | ¿ 1, ovvero |Hµν | ¿ 1, le equazioni di Einstein per la metrica, gµν = ηµν + Hµν −

1 ηµν H ρ ρ , 2

(8.14)

si riducono alle equazioni (8.10), (8.11), per un’opportuna scelta di gauge–fixing per i diffeomorfismi. Risolte queste ultime per Hµν , la (8.14) permette di determinare la metrica in ogni punto dello spazio–tempo. Scelte alternative per il campo gravitazionale. A priori si offrono due alternative per il tipo di tensore da scegliere per il campo gravitazionale. La prima – immediata – emerge se si riguarda ρm come la componente 0 della “quadricorrente di massa”, la quale per un sistema di particelle `e data da, µ Jm

=

X

Z mr

uµr δ 4 (x − yr ) dsr .

(8.15)

r

Seguirebbe infatti, 0 Jm =

X

mr δ 3 (~x − ~yr ) = ρm .

r

In base alla (8.8) il campo ϕgr sarebbe allora la componente 0 di un quadrivettore. Questa scelta `e, tuttavia, in conflitto con due fatti sperimentali fondamentali. In primo luogo in questo modo costruiremmo una teoria relativistica della gravit`a, in completa analogia con l’Elettrodinamica – procedura che `e in palese contrasto con il fatto che la prima prevede solo “cariche” positive, le masse, mentre la seconda prevede cariche di entrambi i segni. In secondo luogo, data la (8.15) si conserverebbe la massa totale di un sistema – di nuovo in contrasto con l’esperienza. La seconda scelta alternativa consiste, invece, nel considerare ϕgr come un quadriscalare. Nel limite non relativistico le componenti T 0i e T ij del tensore energia–impulso sono trascurabili rispetto a T 00 , vedi (2.71), e di conseguenza T µ µ ≈ T 00 . Potremmo allora identificare ρm con la traccia di T µν . Al posto di (8.10) otterremmo allora l’equazione, 2ϕgr = −4πG T µ µ . 257

Tuttavia, essendo che Tem µ µ = 0, qesta scelta implicherebbe che il campo elettromagnetico non genera alcun campo gravitazionale, in contrasto con il fatto che i raggi luminosi in un campo gravitazionale vengono deviati.

8.3

Irraggiamento gravitazionale

Nel limite di campo debole le equazioni del campo gravitazionale hanno dunque la stessa struttura delle equazioni del campo elettromagnetico, di cui conosciamo tutte le soluzioni. In questo limite, dunque, anche le equazioni del campo gravitazionale possono essere risolte esattamente. In questa sezione riportiamo le soluzioni rilevanti e ne discutiamo le conseguenze fisiche, specie in riferimento al fenomeno dell’irraggiamento gravitazionale. Come prima cosa osserviamo che nel vuoto, dove T µν = 0, le (8.10) si riducono alle equazioni delle onde, 2H µν = 0.

(8.16)

Come sappiamo, queste equazioni ammettono come soluzioni delle onde piane “gravitazionali”, e viste le (8.11), (8.12) `e immediato verificare che esse sono date proprio dalle (5.82). Viceversa, in presenza di un tensore energia–impulso diverso da zero la (8.10) ammette la soluzione esatta, vedi (6.48), Z H

µν

= −4 G

d3 y

1 T µν (t − |~x − ~y |, ~y ). |~x − ~y |

A grandi distanze dalla sorgente – nella zona delle onde – possiamo ripetere l’analisi asintotica svolta in sezione 7.1. Usando le stesse notazioni di quella sezione `e allora immediato vedere che il campo gravitazionale nella zona delle onde `e dato da, H

µν

4G =− r

Z d3 y T µν (t − r + ~n · ~y , ~y ),

r = |~x|,

~n =

~x . r

(8.17)

A grandi distanze il campo gravitazionale decade quindi come 1/r, come si conviene a un campo di accelerazione. Come in sezione 7.1 si dimostra inoltre che, modulo termini di ordine 1/r2 , il campo (8.17) soddisfa le relazioni delle onde, ∂ρ H µν = nρ H˙ µν ,

nµ H˙ µν = 0, 258

n2 = 0,

nµ = (1, ~n).

(8.18)

Con lo stesso argomento del pargrafo 7.1.2 si pu`o poi vedere che asintoticamente il campo hµν = Hµν −

1 2

ηµν H ρ ρ risulta sovrapposizione di onde piane del tipo (5.82), come si

conviene a un campo di radiazione. Infine, nel limite non relativistico si pu`o trascurare il termine ~n · ~y , e si ottiene la semplice espressione, H

µν

4G =− r

Z d3 y T µν (t − r, ~y ).

(8.19)

La potenza emessa. Passiamo ora all’analisi energetica della radiazione emessa. Per eseguire questa analisi occorre conoscere l’espressione esplicita del tensore energia–impulso µν del campo gravitazionale Tgr , in termini di H µν . Noto questo tensore si possono deter-

minare la distribuzione angolare della potenza emessa dWgr /dΩ, e la potenza totale Wgr , in completa analogia con la componente µ = 0 della (6.116), ¡ 0i i ¢ dWgr = r2 Tgr n , dΩ

Z r → ∞,

Wgr =

dWgr dΩ. dΩ

(8.20)

µν Tuttavia, per derivare la forma esplicita di Tgr `e necessario ricorrere alle equazioni

di Einstein esatte. Per il momento ci `e sufficiente sapere che nel limite di campo debole esso risulta quadratico in H µν , di modo tale che per r → ∞ la (8.20) d`a luogo a un risultato finito. Nella prossima sezione valuteremo la (8.20) esplicitamente, e l’espressione di Wgr risultante sar`a in effetti molto semplice, vedi (8.25). In sezione 8.5 applicheremo poi questa formula per valutare la perdita di energia della pulsar binaria PSR 1913+16, causa emissione di onde gravitazionali, ne analizzeremo le conseguenze fenomenologiche e le confronteremo con le osservazioni astronomiche di Hulse e Taylor. 8.3.1

Un argomento euristico per la formula di quadrupolo

Invece di passare direttamente al calcolo esplicito della (8.20), in questo paragrafo daremo un argomento euristico – basato ancora sull’analogia con l’Elettrodinamica – per valutare l’ordine di grandezza di Wgr . Questo argomento ci permetter`a inoltre di comprendere meglio il significato fisico del risultato. Prima di procedere ricordiamo che nella trattazione svolta finora abbiamo supposto che ∂µ T µν = 0, cio`e, che il sistema irradiante che stiamo considerando sia isolato. Per valutare la potenza emessa `e infatti sufficiente considerare la dinamica del sistema nell’approssimazione di ordine zero, cio`e, trascurando la “forza di frenamento gravitazionale”. 259

Torniamo dunque all’espansione non relativistica (7.92) della potenza elettromagnetica emessa da un sistema carico, Wem =

1 ¯¯ ~¨ ¯¯2 1 ¯¯ ¨~ ¯¯2 1 ¨˙ ij ¨˙ ij D M D D . + + ¯ ¯ ¯ ¯ 6πc3 6πc5 80πc5

(8.21)

Supponiamo ora che il sistema in questione sia formato da un certo numero di particelle, con cariche er e masse mr . Allora l’analogia fra la (8.1) e la (8.2) suggerisce di stimare la potenza gravitazionale emessa dallo stesso sistema, operando nella (8.21) semplicemente le sostituzioni, er →



4πG mr .

(8.22)

Dato che a livello non relativistico l’energia `e dominata dalla massa, dovremo quindi effettuare la sostituzione, vedi (2.80), jµ →



4πG T µ0 .

Se si ricordano le definizioni dei vari momenti di multipolo che compaiono nella (8.21), si vede che questa procedura porta alla stima, Wgr

2G ≈ 3 3c

¯ ¯2 G ¯¯ ~¨ ¯¯2 G ¨˙ ij ¨˙ ij ¯ ~˙ ¯ P P , ¯P ¯ + 5 ¯L¯ + 6c 20c5

(8.23)

P ~ = P ~yr × mr~vr `e il suo dove P~ = r mr~vr `e la quantit`a di moto totale del sistema, L r momento angolare totale, e P ij `e il suo momento di quadrupolo gravitazionale ridotto, Z 1 ij kk ij ij ij P =P − δ P , P = d3 x xi xj T 00 . (8.24) 3 ˙ ~˙ ed entrambi i contributi di dipolo Ma siccome il sistema `e isolato abbiamo P~ = 0 = L, nella (8.23) sono allora nulli! In ultima analisi l’assenza dei contributi di dipolo nella radiazione gravitazionale `e conseguenza del principio di equivalenza, che assicura che la “carica gravitazionale” di un corpo coincide con la sua massa: dopo la sostituzione (8.22) il rapporto “er /mr ” diventa allora indipendente da r per qualsiasi corpo, eguagliando la √ costante γ = 4πG. E in questo caso sappiamo, infatti, che le radiazioni di dipolo sono entrambe assenti, si vedano il paragrafo 7.3.2 e la sezione 7.4. Resterebbe quindi solo il termine di quadrupolo. In realt`a nel prossimo paragrafo vedremo che la valutazione esplicita della (8.20) conferma il risultato (8.23) – a parte un 260

fattore moltiplicativo 4. Otterremo infatti, Wgr =

G ¨˙ ij ¨˙ ij P P . 5c5

(8.25)

Questa `e la celebrata formula di quadrupolo per l’irraggiamento gravitazionale. Essa costituisce a tutti gli effetti la controparte gravitazionale dell’analogo risultato (7.41) dell’Elettrodinamica, Wem =

1 6πc3

¯ ¯2 ¯ ~¨ ¯ ¯D¯ ,

in quanto entrambe le formule danno il termine leading della potenza totale emessa in √ approssimazione non relativistica. Previa l’identificazione e ↔ 4πG m si vede che l’intensit`a della radiazione gravitazionale, essendo di quadrupolo, `e soppressa di un fattore (v/c)2 rispetto alla radiazione elettromagnetica, che `e appunto di dipolo. Teorema di Birkhoff. Facciamo, infine, notare che nella (8.25) la comparsa del momento di quadrupolo ridotto (8.24) `e dovuta al fatto che il teorema di Birkhoff, vedi problema 2.5, vale anche per il campo gravitazionale, per il quale, in realt`a, originalmente `e stato dimostrato. In Relativit`a Generale questo teorema afferma che il campo gravitazionale prodotto da un sistema sferico nel vuoto, `e statico, e quindi un tale sistema non pu`o emettere onde gravitazionali, ovvero Wgr = 0. La formula (8.24) verifica in effetti questo teorema, perch`e per un sistema a simmetra sferica si ha T 00 = T 00 (t, r), e l’argomento dato in (7.94) si estende allora immediatamente al momento di quadrupolo ridotto (8.24), e ne segue che P ij = 0. Per un sistema sferico si ha quindi Wgr = 0.

8.4

La potenza della radiazione di quadrupolo

In questa sezione deriviamo la (8.25) a partire dalla (8.20). Punto di partenza `e l’espressione per il tensore energia–impulso del campo gravitazionale, che viene fornita dalle equazioni di Einstein. Invece di riportare l’espressione esatta, diamo la sua forma nella zona delle onde, che risulta particolarmente semplice, µ ¶ nµ nν 1 µν α αβ 2 Tgr = H˙ H˙ αβ − (H˙ α ) . 32π G 2

(8.26)

Scrivendo la (8.26) abbiamo omesso un termine proporzionale a una quadridivergenza,

261

del tipo, ∂ρ W ρµν = nρ

∂W ρµν , ∂t

(8.27)

dove W ρµν `e un tensore bilineare in H αβ e H˙ αβ . Essendo una derivata totale rispetto al tempo, questo termine non contribuisce quando si considera un sistema che compie un moto periodico, e si media la potenza (8.20) nel tempo. In questo caso H αβ `e, infatti, periodico nel tempo, e tale sar`a allora W ρµν . Se un sistema compie, invece, un moto aperiodico, ed `e accelerato per un intervallo temporale finito, allora il termine (8.27) non contribuisce all’energia totale emessa, perch`e in quel caso per t → ±∞ H˙ αβ tende a zero, e per t → ±∞ si annulla quindi anche W ρµν . µν Facciamo notare l’analogia formale tra la (8.26) e l’espressione corrispondente di Tem

per il campo elettromagnetico (5.72), µν Tem = −nµ nν (A˙ α A˙ α ).

Per la distribuzione angolare della potenza le (8.20), (8.26) danno allora, µ ¶ dWgr 1 ˙α 2 r2 αβ ˙ ˙ H Hαβ − (H α ) . = dΩ 32πG 2

(8.28)

Come nel caso elettromagnetico esprimiamo innanzitutto il membro destra di questa formula in termini delle sole componenti spaziali H ij del campo gravitazionale. A questo scopo riprendiamo dalle (8.18) le identit`a algebriche nµ H˙ µν = 0, che permettono di esprimere tutte le componenti di H˙ µν in termini delle sole H˙ ij , H˙ 00 = ni nj H˙ ij H˙ 0i = nj H˙ ij . Inserendo queste espressioni nella (8.28) si ottiene facilmente, dWgr dΩ Λijlm

r2 ˙ ij ˙ lm ijlm H H Λ , 32πG 1 1 ≡ δ il δ jm − δ ij δ lm − 2 δ il nj nm + δ ij nl nm + ni nj nl nm , 2 2 =

(8.29) (8.30)

analoga alla (7.17) dell’Elettrodinamica. Per procedere `e pi` u conveniente riesprimere il membro di destra della (8.29) in termini della parte di traccia di H ij , cio`e H ii , e della sua parte a traccia nulla, Hij ≡ H ij −

1 ij kk δ H , 3 262

Hii = 0.

Inserendo nella (8.29) l’espressione, H ij = Hij +

1 ij kk δ H , 3

e svolgendo i calcoli si vede che la parte di traccia si cancella, e si ottiene, dWgr dΩ

=

r2 ˙ ij ˙ lm ijlm H H Σ , 32πG

Σijlm ≡ δ il δ jm − 2 δ il nj nm +

(8.31) 1 i j l m nn nn . 2

(8.32)

I campi H ij , infine, sono dati dalle (8.19), 4G H =− r

Z

ij

d3 y T ij .

(8.33)

Come ultimo passo facciamo vedere che questi campi sono legati in modo molto semplice ai momenti di quadrupolo (8.24). Si dimostra infatti che vale l’identit`a, Z 1 d3 x T ij = P¨ ij . 2 La dimostrazione sfrutta la conservazione del tensore energia–impulso ∂µ T µν = 0, che comporta, T˙ 00 = −∂k T k0 , T˙ 0k = −∂m T mk , e quindi, T¨00 = −∂k T˙ k0 = ∂k ∂m T km . Integrando due volte per parti si ottiene allora, Z Z Z ¡ ¢ ij 3 i j ¨ 00 3 i j km ¨ P = d x x x T = d x x x ∂k ∂m T = d3 x ∂k ∂m xi xj T km Z Z ¢ km ¡ i j j i 3 = d x δk δm + δk δm T = 2 d3 x T ij . Concludiamo che nel limite non relativistico il campo gravitazionale nella zona delle onde `e legato al momento di quadrupolo dalla semplice relazione H ij = −

2G ¨ ij P , r

38

38

, (8.34)

Ripristinando la velocit`a della luce e identificando nella (8.24) T 00 con la densit`a di massa ρm , la 2G (8.34) si scrive, H ij = − 4 P¨ ij . Rispetto alla (7.37) – che `e una radiazione `e di dipolo – ci si sarebbe rc aspettati una potenza di 1/c2 . L’ulteriore fattore 1/c2 `e dovuto al fatto che hµν corrisponde al campo gravitazionale, diviso c2 .

263

da confrontare con la (7.37). Per questo motivo la radiazione rappresentata da H ij corrisponde a una “radiazione di quadrupolo”. Sottraendo dalla (8.34) la traccia si trova, Hij = −

2G ¨ ij P , r

e sostituendo in (8.31) si ottiene, dWgr G ¨˙ ij ¨˙ lm ijlm = P P Σ . dΩ 8π In generale la distribuzione angolare della potenza `e quindi una funzione abbastanza complicata degli angoli. Tuttavia, grazie agli integrali invarianti del problema 2.6 si ottiene una formula molto semplice per la potenza totale, Z G ¨˙ ij ¨˙ lm Wgr = P P Σijlm dΩ 8π ¢ G ¨˙ ij ¨˙ lm 2π ¡ ij lm = P P δ δ + 11 δ il δ jm + δ im δ jl 8π 15 G ¨˙ ij ¨˙ ij = P P , 5

(8.35)

(8.36)

che `e la formula di quadrupolo (8.25).

8.5

La pulsar binaria PSR 1913+16

La formula appena derivata fornisce l’energia emessa nell’unit`a di tempo da un sistema non relativistico mediante onde gravitazionali, noto il momento di quadrupolo (8.24), e quindi la sua densit`a di energia. Nel limite non relativistico la densit`a di energia `e a sua volta dominata dalla densit`a di massa. Se il sistema `e composto da un certo numero di particelle con massa Mr e traiettorie ~yr (t), o pi` u in generale, da un certo numero di corpi rigidi con moti rotazionali trascurabili, allora abbiamo dunque, vedi (2.80), T 00 =

X

Mr δ 3 (~x − ~yr ).

r

Di conseguenza otteniamo la semplice espressione, Z Z X X ij 3 i j 00 P = d xx x T = Mr d3 x xi xj δ 3 (~x − ~yr ) = Mr yri yrj . r

(8.37)

r

Derivandola tre volte rispetto al tempo, sottraendo la traccia e inserendo l’espressione risultante nella (8.25), si pu`o quindi calcolare facilmente l’energia che viene emessa nell’unit`a di tempo. Per i motivi spiegati sopra l’entit`a di questa energia `e in generale 264

molto piccola, e quindi difficile da misurare. La verifica sperimentale della (8.25) necessita dunque dell’esistenza di particolari sistemi fisici, in cui la radiazione gravitazionale sia cos`ı intensa da poter essere rivelata sperimentalmente. In linea di principio ci sono due possibilit`a diverse per stabilire la presenza di onde gravitazionali. Osservazioni dirette. Siccome in Wgr compaiono le derivate delle coordinate, l’intensit`a della radiazione sar`a elevata se un sistema `e costituito da corpi con accelerazioni molto violente e masse molto grandi. In questo caso dovrebbe essere possibile osservare direttamente gli effetti del campo (8.34), anche se la durata delle accelerazioni `e molto breve, come per esempio nelle supernovae. Le tecniche sperimentali per effettuare misure di questo tipo impiegano antenne gravitazionali o dispositivi interferometrici. Osservazioni indirette. Se un sistema fisico `e soggetto ad accelerazioni troppo piccole, allora la radiazione gravitazionale emessa pu`o essere troppo poco intensa per essere osservata sperimentalmente. Tuttavia, per la conservazione dell’energia il fenomeno dell’irraggiamento gravitazionale comporta necessariamente una diminuzione dell’energia del sistema irradiante. Anche se la potenza istantanea `e molto piccola, se il sistema irradia abbastanza a lungo, compiendo per esempio un moto periodico, allora pu`o succedere che la continua perdita di energia causa nel sistema effetti cumulativi cos`ı grandi da poter essere rivelati sperimentalmente. Effetti di questo tipo possono essere, per esempio, variazioni molto leggere delle velocit`a o delle dimensioni delle orbite di un sistema – altrimenti supposto periodico. Un sistema astronomico con queste caratteristiche `e stato scoperto da R.A. Hulse e J.H. Taylor nel 1974, la pulsar binaria PSR 1913+16, la quale `e stata tenuta sotto osservazione dagli scopritori per una decina di anni. La pulsar PSR 1913+16 e la sua compagna ruotano una attorno all’altra su orbite ellittiche pressoch`e newtoniane, di periodo T = 7.75h, a una distanza di 2 r ≈ 1.8 · 106 km. Il diametro di entrambe le stelle si stima di una decina di km. La pulsar si trova inoltre in rotazione rapida attorno a un suo asse con periodo di “spin” τ ≈ 59 ms, ed in corrispondenza emette impulsi elettromagnetici intervallati dallo stesso periodo. L’osserazione di questi impulsi, in particolare l’analisi delle oscillazioni del periodo di spin dovute all’effetto Doppler, causato dal moto orbitale, ha permesso di effettuare una serie di misure molto precise sulla dinamica del sistema. Una caratteristica delle pulsar isolate 265

`e, infatti, costituita dal fatto che l’intervallo τ tra due impulsi successivi resta costante nel tempo, con una precisione che rasenta spesso quella degli orologi atomici. Cos`ı `e stato possibile, per esempio, determinare le masse delle due stelle e l’eccentricit`a dell’orbita relativa, con precisione molto elevata. Se indichiamo con M0 la massa del sole, la massa della pulsar e quella della sua compagna valgono rispettivamente, M1 = 1.4414(2)M0 ,

M2 = 1.3867(2)M0 ,

mentre l’eccentricit`a dell’orbita `e, e = 0.617127(3). Le misure effettuate su questo sistema hanno permesso, in particolare, di verificare diverse previsioni della Relativit`a Generale in un regime di campi gravitazionali forti, ma il dato sperimentale forse pi` u rilevante `e che il periodo orbitale T del sistema diminuisce nel tempo, anche se molto lentamente. Le osservazioni effettuate da Hulse e Taylor nell’arco di circa un decennio, tra il 1974 e il 1987, hanno infatti rivelato che sussiste una diminuzione costante e sistematica del periodo data da, µ ¶ dT = −(2.4056 ± 0.0051) · 10−12 s/s. dt oss

(8.38)

Si noti che in un anno il periodo di 7.75 ore diminuisce di soli 7 · 10−5 s. Valutazione della formula di quadrupolo. Analizzeremo ora gli effetti dell’emissione di radiazione gravitazionale sul sistema stesso, in stretta analogia con l’analisi svolta per l’atomo di idrogeno classico nel paragrafo 7.3.6. In questo caso svolgeremo l’analisi approssimando le traiettorie ellittiche con orbite circolari di raggio r, e assumendo che si abbia M1 = M2 = M ; la correzione dovuta all’eccentricit`a non nulla sar`a introdotta alla fine. Dai dati riportati si vede che la velocit`a delle stelle vale v/c = 2πr/T ≈ 0.7 · 10−3 , e quindi `e giustificata l’approssimazione non relativistica. Per valutare la potenza irradiata (8.25) dobbiamo partire dal momento di quadrupolo (8.37). Dato che abbiamo ~y1 = −~y2 ≡ ~y , si ottiene semplicemente, P ij = 2M y i y j .

266

Sfruttando la cinematica del moto circolare uniforme e ponendo v i = y˙ i si ottiene poi facilmente, ij ¢ 8M v 2 ¡ i j y v + yj vi . P¨˙ = − 2 r ii ˙ Dato che ~y · ~v = 0, segue che P¨ = 0, e quindi in questo caso abbiamo, ij ij P¨˙ = P¨˙ .

La (8.25) d`a allora immediatamente, Wgr =

128 G M 2 v 6 . 5r2 c5

(8.39)

Per quantificare gli effetti della potenza emessa (8.39) sul sistema, procediamo come nel caso dell’atomo di idrogeno classico. Poniamo, Wgr = −

dε , dt

dove ε `e l’energia totale non relativistica del sistema. Dall’equazione della forza centripeta, M

v2 GM 2 = r (2r)2

si ottiene,

µ ε=2



v2 =

MG , 4r

¶ 1 GM 2 GM 2 2 Mv − =− . 2 2r 4r

D’altra parte, siccome, T2 r2 4r3 = = , 4π 2 v2 MG risulta che ε `e proporzionale a T −2/3 . Si conclude allora che il periodo diminuisce nel tempo secondo la legge, dT 3 T dε 12 T G3 M 3 =− =− , dt 2 ε dt 5 r4 c5 dε abbiamo sostituito la (8.39). Infine, si pu`o vedere che la struttura eldt littica delle orbite modifica questo risultato solo per un fattore correttivo dipendente dove per −

dall’eccentricit`a, dT 12 T G3 M 3 1 + 73e2 /24 + 37e4 /96 =− . dt 5 r4 c5 (1 − e2 )7/2 Inserendo in questa formula i dati di Hulse e Taylor si conclude che la Relativit`a Generale prevede per la diminuzione del periodo orbitale nel tempo il valore, µ ¶ dT = −(2.40242 ± 0.00002) · 10−12 s/s. dt RG 267

La diminuzione del periodo osservata (8.38) `e quindi perfettamente consistente con l’emissione di onde gravitazionali, come prevista dalla Relativit`a Generale. Risulta infatti, ¡ dT ¢ dt oss ¡ dT ¢ = 1.0013 ± 0.0021. dt

8.6

RG

Problemi

8.1

Si dimostri che l’integrale sugli angoli nella (8.35) d`a la (8.36).

8.2

Si consideri un sistema formato da due stelle identiche di massa M , che ruotano

una attorno all’altra su orbite circolari di raggio r, come in sezione 8.5. a) Si dimostri che la potenza totale della radiazione gravitazionale emessa `e data dalla (8.39). b) Si esegua l’analisi spettrale della radiazione emessa.

268

9

Irraggiamento ultrarelativistico

La fisica moderna ricorre frequentemente ad esperimenti che coinvolgono particelle cariche con velocit`a molto elevate, spesso prossime alla velocit`a della luce. Per farle raggiungere velocit`a cos`ı grandi occorre fornire loro energia, e se inoltre le si vogliono confinare a zone limitate le loro traiettorie devono essere necessariamente curvate. In entrambi i processi le particelle sono sottoposte ad accelerazione ed emettono quindi radiazione elettromagnetica, dissipando parte dell’energia accumulata. In questi casi per valutare la perdita di energia non si pu`o pi` u ricorrere allo sviluppo in multipoli, valido nel limite non relativistico, ma sono necessari strumenti di calcolo che forniscono risultati esatti, validi per velocit`a arbitrarie. In questo capitolo svilupperemo gli strumenti utili a tal scopo, e li useremo in particolare per analizzare il fenomeno della dissipazione di energia negli acceleratori ad alte energie, a causa dell’irraggiamento. Le basi per l’analisi relativistica della radiazione emessa da un generico sistema carico sono gi`a state sviluppate nel capitolo precedente. Sappiamo in particolare che la valutazione del quadrimomento emesso, che secondo le (7.13) e (7.15) `e dato da, ¡ µi i ¢ d2 P µ ~ 2, = r2 Tem n = r2 nµ |E| dt dΩ

(9.1)

richiede solo la conoscenza del campo elettrico nella zona delle onde; e per una distribuzione di carica generica questo campo pu`o essere calcolato agevolmente usando le (7.9) e (7.11). Tuttavia, in seguito ci occuperemo principalmente della radiazione emessa da una ~ potremo usare alternativamente l’espressione di singola particella, e in questo caso per E Lienard–Wiechert. Eseguendo i limiti asintotici R → r e m ~ → ~n, dalla (6.108) si ottiene infatti, ~ = E

e ~n × [(~n − ~v ) × ~a] . 4π r (1 − ~v · ~n)3

(9.2)

Ricordiamo che le variabili cinematiche ~v e ~a che compaiono in questa espressione sono valutate al tempo ritardato t0 (x), definito dalla relazione implicita, t − t0 = |~x − ~y (t0 )|.

(9.3)

Anche questa relazione deve allora essere specificata al caso di grandi r. Eseguendo

269

l’espansione di |~x − ~y (t0 )| per grandi r si ottiene, vedi sezione 7.1, µ ¶ 1 0 0 |~x − ~y (t )| = r − ~n · ~y (t ) + , r da cui segue la relazione asintotica, t = t0 + r − ~n · ~y (t0 ).

(9.4)

Derivando quest’ultima rispetto a t0 , per ~x = ~n r fissato, si ottiene una relazione che useremo pi` u volte in seguito, dt = 1 − ~n · ~v (t0 ). dt0

(9.5)

Inserendo infine la (9.2) nella (9.1) si ottiene un’espressione, abbastanza complicata, per la distribuzione angolare del quadrimomento emesso. Tuttavia, nella prossima sezione faremo vedere che integrando la (9.1) sugli angoli `e possibile derivare un’espressione molto µ dPrad , irradiato dalla particella nell’unit`a di tempo semplice per il quadrimomento totale dt in tutte le direzioni. Dato che per una particella singola possiamo sempre scrivere, d d = u0 , ds dt questo risultato fornir`a poi anche il quadrimomento totale irradiato per unit`a di tempo proprio,

µ dPrad dP µ = u0 rad , ds dt

che `e una quantit`a Lorentz–covariante. La formula risultante costituisce una generalizzazione relativistica della formula di Larmor, valida per velocit`a arbitrarie. Un’analisi qualitativa della distribuzione angolare della radiazione emessa da particelle ultrarelativistiche verr`a invece svolta in sezione 9.3.

9.1

Generalizzazione relativistica della formula di Larmor

Consideriamo una particella carica che compie un moto arbitrario. In quanto segue, per semplicit`a supporremo che la particella sia accelerata solo durante un intervallo temporale limitato, oppure che l’accelerazione vada a zero con sufficiente rapidit`a per |t| → ∞. In questo modo la particella emetter`a radiazione solo per un intervallo temporale finito, e anche il quadrimomento totale emesso sar`a allora finito. In questa sezione vogliamo, infatti, 270

calcolare il quadrimomento totale emesso in tutte le direzioni lungo l’intera traiettoria, e µ dPrad successivamente il quadrimomento emesso in tutte le direzioni per unit`a di tempo ds proprio. Per fare questo dovremmo inserire la (9.2) nella (9.1), e integrare l’espressione risultante su tutti gli angoli e su tutti i tempi. Questo calcolo `e istruttivo e lo eseguiremo esplicitamente nel paragrafo 9.1.2, ma esso risulta anche un po’ lungo. Per questo motivo µ dPrad , sfrutnel paragrafo che segue daremo una deduzione alternativa e pi` u rapida di ds tando il semplice fatto che sotto trasformazioni di Lorentz il quadrimomento si comporta come un quadrivettore. 9.1.1

Un argomento di covarianza

Riprendiamo i risultati per l’energia e la quantit`a di moto irradiate nell’unit`a di tempo da una particella non relativistica, vedi paragrafo 7.3.2, dε e2 dP~ = |~a(t − r)|2 , = 0. dt 6π dt Ricordiamo che questo quadrimomento viene rivelato a un istante t a una distanza r dalla particella, motivo per cui l’accelerazione `e valutata all’istante ritardato t − r. Proprio questa circostanza ci permette di interpretare l’espressione, µ dPrad e2 = |~a(t)|2 (1, 0, 0, 0), dt 6π

(9.6)

come quella frazione di quadrimomento emessa da una particella non relativistica all’istante t, che raggiunge l’infinito. Ci`o premesso consideriamo ora una particella che compie un moto arbitrario. Dato che siamo in presenza di un’unica particella, al posto del tempo possiamo equivalentemente dP µ considerare il suo tempo proprio, e chiederci quanto vale il quadrimomento rad , irradiato ds dalla particella nell’unit`a di tempo proprio. In seguito assumeremo che questa quantit`a sia un quadrivettore

39

. Per riallacciarci alla (9.6) consideriamo per ogni s fissato il sistema

di riferimento K ∗ , in cui la particella in quell’istante `e a riposo. Secondo quanto stabilito sopra, in questo sistema di riferimento vale allora, ∗µ dPrad e2 ∗ 2 ∗µ = |~a | u , ds 6π

u∗µ ≡ (1, 0, 0, 0),

(9.7)

µ Se la quantit`a dPrad /ds uguagliasse la perdita di quadrimomento della particella in quell’istante, questa ipotesi sarebbe soddisfatta banalmente. Ma in realt`a pi` u avanti vedremo che la particella perde localmente un’ulteriore porzione di quadrimomento, il termine di Schott, che risulta covariante anch’esso. La nostra ipotesi si giustifica quindi a posteriori. 39

271

dove u∗µ `e la quadrivelocit`a della particella in K ∗ . Abbiamo posto dt∗ = ds, in quanto ~v ∗ = 0. Notiamo poi che in K ∗ la quadriaccelerazione vale w∗µ = (0, ~a ∗ ), e quindi possiamo scrivere, w∗2 = w∗µ wµ∗ = −|~a ∗ |2 . La (9.7) si scrive allora,

∗µ dPrad e2 = − w∗2 u∗µ . ds 6π

Dato che questa relazione eguaglia un quadrivettore a un quadrivettore, concludiamo che essa vale in qualsiasi riferimento, e otteniamo dunque, µ dPrad e2 = − w 2 uµ , ds 6π

(9.8)

che costituisce la generalizzazione relativistica della formula di Larmor. Rimarchiamo il fatto che questa formula non esprime il quadrimomento “totale” emesso dalla particella all’istante s, ma solo quella parte che raggiunge l’infinito. Dalla (9.8) si vede che a livello relativistico la radiazione trasporta ora anche quantit`a d d di moto. Ricordando che = u0 , la componente spaziale di questa formula corrisponde ds dt appunto a, dP~rad e2 = − w2 ~v , dt 6π che risulta trascurabile se v ¿ 1. Considerando invece la componente temporale della (9.8) si ottiene la potenza totale emessa da una particella in moto arbitrario, W=−

e2 2 w . 6π

(9.9)

Facciamo notare che questa espressione `e Lorentz invariante, nonostante la potenza in generale non sia una quantit`a scalare, ma dipenda dal sistema di riferimento. Nel caso in µ dPrad questione la Lorentz–invarianza di W `e una conseguenza del fatto che ∝ uµ . ds ~a ⊥ ~v e ~a k ~v . Per confrontare la (9.9) con la formula di Larmor non relativistica (6.128), esprimiamo la prima in termini dell’accelerazione spaziale ~a, vedi problema 2.1, e2 a2 − (~a × ~v )2 W= . 6π (1 − v 2 )3 Per velocit`a piccole riotteniamo ovviamente la potenza di Larmor, ma per particelle ul1 – a parit`a di accelerazione – danno luogo a una potenza trarelativistiche i fattori 1 − v2 272

irradiata molto pi` u elevata, rispetto al caso non relativistico. In particolare possiamo analizzare separatamente i moti per cui ~a k ~v e quelli per cui ~a ⊥ ~v , Wk =

e2 a2 1 , 6π (1 − v 2 )3

W⊥ =

1 e2 a2 . 6π (1 − v 2 )2

(9.10)

Si vede che a parit`a di accelerazione per particelle ultrarelativistiche si avrebbe Wk À W⊥ , e quindi in un moto rettilineo verrebbe emessa molta pi` u radiazione che non in un moto con pura accelerazione centripeta. Tuttavia, questa analisi non tiene conto delle accelerazioni che si possono raggiungere sperimentalmente in un caso e nell’altro, e inoltre non rapporta l’energia irradiata all’energia posseduta dalla particella. Vedremo, per esempio, che nel caso degli acceleratori ad alte energie la situazione `e difatti rovesciata. 9.1.2

Deduzione della formula di Larmor relativistica

Deriveremo ora la formula di Larmor relativistica (9.8), a partire dalla formula base (9.1). La procedura che seguiremo ci permetter`a in particolare di confermare la correttezza dell’interpretazione fisica datane sopra. Invece di inserire la (9.2) direttamente nella (9.1), `e pi` u conveniente usare per il tensore energia–impulso dei campi asintotici di Lienard–Wiechert l’espressione equivalente (7.97), vedi problema 7.4. La riportiamo qu`ı con le identificazioni asintotiche R → r, mµ → nµ , T µν = −

e2 [(u n)2 w2 + (wn)2 ] µ ν n n . 16π 2 (u n)6 r2

(9.11)

Inserendo questa formula in (9.1) risulta, d2 P µ e2 [(u n)2 w2 + (wn)2 ] µ =− n . dt dΩ 16π 2 (u n)6

(9.12)

` un semplice esercizio fare vedere che si ottiene lo stesso risultato se si inserisce la (9.2) E nella (9.1). L’espressione (9.12) fornisce la distribuzione angolare del quadrimomento emesso nell’unit`a di tempo. Per determinare il quadrimomento totale ∆P µ emesso lungo tutta la traiettoria, la integriamo su tutti gli angoli e su tutti i tempi, µ 2 ¶ Z ∞ Z e2 w (wn)2 µ µ ∆P = − dt dΩ n + . 16π 2 −∞ (u n)4 (u n)6

(9.13)

L’integrando in questa espressione dipende in modo complicato da t e ~n, per via del fatto che u e w sono valutati al tempo ritardato t0 (t, ~x). Per valutare l’integrale `e allora pi` u 273

conveniente passare dalla variabile d’integrazione t al tempo proprio s della particella. Per ogni ~x fissato esiste, infatti, una relazione biunivoca tra t e t0 , vedi (9.4), e una relazione biunivoca tra t0 e s, vedi (6.83). Usando la (9.5) si trova in particolare, dt =

dt0 dt ds = u0 (1 − ~n · ~y ) ds = (u n) ds, ds dt0

e la (9.13) diventa in definitiva, e2 ∆P = − 16π 2 µ

Z

µ

Z



ds

µ

dΩ n

−∞

(wn)2 w2 + (u n)3 (u n)5

¶ .

(9.14)

Ora s `e una variabile di integrazione indipendente, e l’integrazione sugli angoli `e elementare. La eseguiamo esplicitamente, per illustrare alcune tecniche che vengono usate di frequente in fisica teorica. Cominciamo notando che la funzione integranda in (9.14) dipende dai “parametri” u e w, che sono soggetti ai vincoli u2 = 1 e u w = 0. La tecnica che useremo prevede, invece, di valutare l’integrale per vettori u e w generici, cio`e, non soggetti a tali vincoli. L’integrale che ci interessa sar`a poi ottenuto imponendo questi vincoli nel risultato finale. Considerando dunque uµ come una variabile libera, possiamo riscrivere l’integrando di (9.14) come un gradiente rispetto a uµ , ¶ µ 2 ¶ µ 2 (wn)2 w 1 (wn)2 w 1 ∂ µ + + =− . n (u n)3 (u n)5 2 ∂uµ (u n)2 2 (u n)4 Portando la derivata rispetto a uµ fuori dall’integrale sugli angoli otteniamo, µ 2 ¶ Z ∞ Z ∂ w e2 1 (wn)2 µ ds ∆P = dΩ + . 32π 2 −∞ ∂uµ (u n)2 2 (u n)4 Ci siamo dunque ricondotti al calcolo di un unico integrale. Possiamo semplificare ulteriormente l’integrando se notiamo l’identit`a, (wn)2 nα nβ 1 ∂2 1 = w w = w w , α β α β (u n)4 (u n)4 6 ∂uα ∂uβ (u n)2 e portiamo le derivate rispetto a uµ di nuovo fuori dal segno di integrale, ·µ ¶Z ¸ Z ∞ e2 ∂ 1 ∂2 1 µ 2 ∆P = ds w + wα wβ dΩ . 32π 2 −∞ ∂uµ 12 ∂uα ∂uβ (u n)2

274

Abbiamo quindi ricondotto l’integrale al calcolo di qualche derivata e alla valutazione di un unico integrale elementare

40

, Z dΩ

Si ottiene, e2 ∆P = 8π µ

Z



∂ ds ∂uµ −∞

1 4π = 2. 2 (u n) u

·µ ¶ ¸ 1 ∂2 1 2 w + wα wβ . 12 ∂uα ∂uβ u2

(9.15)

(9.16)

Il calcolo delle derivate `e elementare e d`a, ·µ ¶ ¸ µ ¶ 2 µ µ ¶ ∂ 1 1 2 4 2 µ ∂2 w u uw 2 2 µ w + wα wβ = + − 2u u w − 4(uw)u 2 2 3 ∂uµ 12 ∂uα ∂uβ u 3 (u ) 3 (u2 )4 4 = − w 2 uµ , 3 dove nell’espressione finale, valida per qualsiasi u e w, abbiamo imposto i vincoli fisici u2 = 1, u w = 0. La (9.16) si riduce quindi a, Z e2 ∞ 2 µ µ w u ds. ∆P = − 6π −∞

(9.17)

Questo risultato quantifica il quadrimomento totale irradiato dalla particella lungo tutta la traiettoria. Vediamo che esso risulta da una somma di contributi individuali, ciascuno associato ad un istante d’emissione fissato s, dati da, µ ∆Prad (s) = −

e2 2 w (s) uµ (s)∆s, 6π

(9.18)

che equivale in effetti alla (9.8). Dopo questa deduzione possiamo affermare, con pi` u precisione, che la generalizzazione relativistica della formula di Larmor (9.8) rappresenta il quadrimomento che la particella emette all’istante s e che raggiunge l’infinito. In effetti non possiamo affermare che la (9.18) rappresenta tutto il quadrimomento emesso all’istante s, perch´e la particella potrebbe emettere in quell’istante un quadrimomento addizionale, µ ∆Padd = Gµ (s)∆s, 40

Questo integrale `e a priori una funzione generica di u0 e di ~u. Tuttavia, per l’invarianza per rotazioni tridimensionali esso pu`o dipendere solo da u0 e |~u|, ma non dalla direzione di ~u, perch´e una rotazione spaziale di ~u pu`o essere compensata da un cambiamento delle variabili d’integrazione angolari nella (9.15). ` allora sufficiente calcolare l’integrale, per esempio, per uµ = (u0 , 0, 0, u3 ). Si ottiene, E Z π Z 4π 4π 1 senϑ dϑ = 2π = 0 2 = 2. dΩ 0 − u3 cosϑ)2 3 )2 (u n)2 (u (u ) − (u u 0

275

e riassorbirlo successivamente. Questi termini non darebbero, infatti, nessun contributo al quadrimomento totale ∆P µ , se vale, Z



Gµ (s) ds = 0.

(9.19)

−∞

In questo caso dovremmo allora concludere che la variazione istantanea del quadrimomento della particella, dovuta all’emissione di radiazione, non eguaglia − −

µ dPrad ds

ma piuttosto,

µ dPrad − Gµ . ds

Nel capitolo 12 vedremo in effetti che il quadrivettore Gµ `e diverso da zero. Facciamo, infine, notare che l’interpretazione che abbiamo dato alla quantit`a (9.17) – come la variazione del quadrimomento della particella tra lo stato iniziale e quello finale, causata dell’irraggiamento – presuppone che il quadrimomento del campo elettromagnetico negli stati iniziale e finale sia lo stesso. Questa ipotesi verr`a giustificata nel capitolo 13, dove faremo vedere che il quadrimomento (rinormalizzato) del campo elettromagnetico di una particella che si muove di moto rettilineo uniforme `e in effetti nullo. Siccome abbiamo supposto che la particella sia accelerata solo per un intervallo temporale finito, il quadrimomento del campo negli stati iniziale e finale `e quindi lo stesso, ovvero zero.

9.2

Perdita di energia negli acceleratori

In questa sezione applicheremo la formula (9.9) per valutare la perdita di energia negli acceleratori ad alte energie. In questi casi le velocit`a delle particelle sfiorano quella della luce, e l’approssimazione non relativistica non `e pi` u valida. Negli acceleratori il moto delle particelle `e determinato essenzialmente dai campi elettrici e magnetici presenti lungo la traiettoria. Incominceremo quindi questa sezione derivando una formula per la potenza emessa, nel caso in cui l’accelerazione della particella `e dovuta a un generico campo elettromagnetico F µν esterno. Useremo poi questa formula per analizzare la portata degli effetti radiativi negli acceleratori ultrarelativistici. Troveremo che mentre negli acceleratori lineari questi effetti sono completamente trascurabili, negli acceleratori circolari le perdite di energia dovute all’irraggiamento possono diventare il fenomeno dinamico dominante – a un punto tale da limitare in modo sostanziale le energie massime raggiungibili. 276

Supponiamo dunque di avere una particella carica che si muove sotto l’influenza di un campo elettromagnetico F µν . Sappiamo allora che il suo moto `e determinato dall’equazione di Lorentz, dpµ = e F µν uν . ds

(9.20)

Questa equazione permette di esprimere la quadriaccelerazione, wµ =

1 dpµ , m ds

in termini dei campi e della quadrivelocit`a, e possiamo usarla per esplicitare la formula di Larmor relativistica (9.9). Otteniamo, e2 dpµ dpµ 1 e2 W=− = 6πm2 ds ds 6πm2 1 − v 2

· ¯ ¯ 2 µ ¶2 ¸ ¯ d~p ¯ ¯ ¯ − dε . ¯ dt ¯ dt

Usando l’equazione di Lorentz in notazione tridimensionale, vedi (2.19) e (2.20), si ottiene in definitiva, W=

~ + ~v × B| ~ 2 − (~v · E) ~ 2 e 4 |E . 6πm2 1 − v2

(9.21)

Questa formula fornisce dunque la potenza istantanea, in termini dei campi esterni valutati lungo la traiettoria ~y (t) della particella, per determinare la quale bisognerebbe risolvere, a sua volta, l’equazione di Lorentz. La (9.21) risulta quindi particolarmente utile quando quest’ultima pu`o essere risolta esattamente, come per esempio nel caso di campi costanti e uniformi. Occorre, tuttavia, tenere presente che procedendo in questo modo si trascura l’effetto della perdita di energia sulla forma della traiettoria, ovverosia la forza di frenamento. L’attendibilit`a del risultato deve quindi essere accertata a posteriori, verificando che il valore di W fornito dalla (9.21) `e piccolo, rispetto alla potenza Wex somministrata alla particella dai campi esterni. Concludiamo queste considerazioni introduttive con un’osservazione di carattere generale, riguardante la fisica degli acceleratori. A questo scopo riscriviamo la (9.21) in termini dell’energia ε della particella, W=

´ e 4 ε2 ³ ~ ~ 2 − (~v · E) ~ 2 . | E + ~ v × B| 6πm4

Dalle potenze di m che compaiono a denominatore si vede allora che a parit`a di campi acceleranti e di energia raggiunta, nel caso ultrarelativistico una particella leggera irradia 277

molto di pi` u di una particella pesante. Questo segue essenzialmente dal fatto che a parit`a di forza applicata, una particella leggera subisce un’accelerazione maggiore di una particella pesante. Si conclude che dal punto di vista della dissipazione di energia per irraggiamento, gli acceleratori di protoni, come LHC, sono molto pi` u convenienti degli acceleratori di elettroni e positroni, come LEP, in quanto mp ≈ 2000 me . 9.2.1

Acceleratori lineari

Applichiamo ora la (9.21) per analizzare la rilevanza della perdita di energia per irraggiamento negli acceleratori lineari. In questi acceleratori le particelle sono sottoposte ad un ~ parallelo al loro moto, diciamo lungo l’asse x, e l’equazione di Lorentz campo elettrico E d`a allora, Wex =

dε = e v E. dt

~ = 0, otteniamo, D’altra parte, ponendo nella (9.21) B W=

e4 E 2. 6πm2

(9.22)

Notiamo che questa formula sembra in conflitto con l’espressione di Wk calcolata nella 1 (9.10), in quanto sono scomparsi i fattori relativistici √ . Tuttavia, dall’equazione 1 − v2 di Lorentz per un moto unidimensionale, µ ¶ v d √ = e E, m dt 1 − v2 `e immediato dedurre che si ha, vedi problema 2.10, a=

´3 eE dv ³√ = 1 − v2 , dt m

e le due formule combaciano. Per valutare la rilevanza di (9.22) rapportiamo la potenza emessa alla potenza fornita dal campo esterno, W e3 E 2 r0 dε = = , 2 Wex 6πm v 3 m v dx

(9.23)

dove, 1 dε dε = = eE, dx v dt rappresenta l’energia fornita dal campo esterno per unit`a di spazio percorso, ed r0 = e2 /4πm `e il raggio classico della particella. Per velocit`a elevate, v ≈ 1, avremmo quindi 278

che la perdita di energia per irraggiamento `e rilevante solo in presenza di campi esterni cos`ı intensi, da fornire alla particella un’energia dell’ordine di grandezze della sua massa, mentre essa percorre uno spazio dell’ordine di grandezza del suo raggio classico. Ma in pratica i campi elettrici che si riescono a produrre sperimentalmente sono molto pi` u piccoli, e non superano il valore E ≈ 100 M V /m, per cui, dε ≈ 100 M eV /m. dx Il rapporto (9.23) `e comunque massimo per la particella carica pi` u leggera, ovvero l’elettrone, per cui m = 0.5 M eV e r0 = 3 · 10−13 cm, e si otterrebbe, W ≈ 4 · 10−13 , Wex mentre per il protone questo rapporto sarebbe ancora pi` u piccolo, dell’ordine di 10−19 . Concludiamo quindi che negli acceleratori lineari ad alta energia il fenomeno dell’irraggiamento `e completamente trascurabile. 9.2.2

Acceleratori circolari

In un acceleratore circolare – o ciclotrone – una particella carica compie un moto circolare uniforme sotto l’influenza di un campo magnetico B costante e uniforme. L’equazione di Lorentz diventa allora,

´ ³e √ d~u ~ , 1 − v2 B = ~u × dt m

da cui si ricava la frequenza relativistica di ciclotrone, ω0 =

eB√ eB 1 − v2 = . m ε

(9.24)

~ = 0 e la (9.21) d`a, In questo caso abbiamo E W=

e4 v 2 B 2 e2 v 2 ω02 = , 6πm2 1 − v 2 6π (1 − v 2 )2

(9.25)

da confrontare con la potenza non relativistica di Larmor, Wn.r. =

e2 a2 , 6π

a=

veB . m

Per esaminare la rilevanza degli effetti dell’irraggiamento negli acceleratori circolari, calcoliamo l’energia ∆ε emessa durante un ciclo. Indicando il raggio dell’orbita con R e 279

usando ω0 = v/R si ha, ∆ε =

2πR e2 v3 e2 v 3 4 W= = ε, v 3R (1 − v 2 )2 3R m4

dove abbiamo introdotto l’energia ε della particella. Per particelle ultrarelativistiche poniamo v ≈ 1 nel numeratore, e otteniamo cos`ı l’importante formula per l’irraggiamento nei ciclotroni ultrarelativistici, ∆ε =

e2 ³ ε ´4 . 3R m

(9.26)

Questa formula impone, infatti, forti restrizioni sulle caratteristiche tecniche degli acceleratori circolari realizzabili in pratica. Vediamo in particolare che a parit`a di energia accumulata, l’effetto dell’irraggiamento `e minore se si scelgono orbite grandi e particelle pesanti. Esempi di ciclotroni ad alta energia. Dato che in un acceleratore circolare la perdita di energia (9.26) `e inevitabile, se si vogliono mantere le particelle in orbita ad energia costante, lungo l’anello di accumulazione devono essere disposti dei campi elettrici acceleranti – delle cosiddette cavit`a a radiofrequenza – che compensano questa perdita. A titolo di esempio valutiamo l’energia dissipata nel sincrotrone di elettroni di Cornell, che era attivo dal 1968 al 1979. Questo acceleratore raggiungeva energie dell’ordine di ε = 10 GeV , ed aveva un raggio R = 100 m. La (9.26) d`a allora, ∆ε = 8.9 · M eV,

∆ε ≈ 10−3 , ε

mentre le cavit`a risonanti erano capaci di fornire un’energia di 10.5 M eV per ciclo. Ad un’energia di 10 GeV l’acceleratore funzionava dunque al limite delle sue possibilit`a. Come secondo esempio consideriamo l’acceleratore circolare LEP presso il CERN di Ginevra, che accumulava elettroni e positroni. In questo caso il raggio `e di circa R = 4.3 km, e l’energia massima raggiunta per elettrone era di circa 100 GeV . Si ottiene, ∆ε ≈ 2 GeV, che significa una perdita di energia del 2% per ogni ciclo. Dato che in un secondo le particelle compiono circa 11.000 cicli, in assenza di cavit`a a radiofrequenza tutta l’energia accumulata si sarebbe quindi dispersa nella frazione di un secondo. 280

Infine consideriamo l’acceleratore LHC del CERN, che prevede la collisione tra due fasci di protoni di energia ε = 7 T eV . Grazie al fatto che la massa di un protone `e circa duemila volte quella di un elettrone, la (9.26) d`a per la perdita di energia in un ciclo il valore molto piccolo, ∆ε ≈ 3 keV. Ne segue che, ∆ε ≈ 0.5 · 10−9 , ε ed `e immediato vedere che nell’arco di un’ora l’energia dei protoni diminuisce solo del 2%.

9.3

Distribuzione angolare nel limite ultrarelativistico

In questo paragrafo effettuiamo un’analisi qualitativa della distribuzione angolare della radiazione emessa da una particella ultrarelativistica. Prima di procedere ricordiamo le caratteristiche della distribuzione angolare della radiazione di una particella non relativistica, v ¿ 1. In questo caso avevamo ottenuto, vedi (7.46),

dW e2 |~n × ~a|2 e2 = = |~a|2 sen2 ϑ, 2 2 dΩ 16 π 16 π

(9.27)

dove ϑ `e l’angolo tra ~a e ~n. In questo limite la potenza emessa ha quindi una distribuzione angolare “continua”, con un massimo nel piano ortogonale all’accelerazione, ed uno zero lungo la direzione dell’accelerazione. In particolare essa risulta indipendente dalla direzione della velocit`a della particella. Vedremo ora che nel limite ultrarelativistico la natura della distribuzione angolare cambia drasticamente. Riprendiamo dunque la formula generale per la distribuzione angolare (7.17), dW ~ 2, = r2 |E| dΩ e inseriamo il campo elettrico asintotico (9.2). Risulta l’espressione, e2 |~n × [(~n − ~v ) × ~a]|2 dW = , dΩ 16 π 2 (1 − ~v · ~n)6

(9.28)

che `e valida per velocit`a arbitrarie. Per v → 0 essa si riduce evidentemente alla (9.27), ma per v ∼ 1 il suo andamento `e determinato dalla presenza delle potenze del fattore 281

1 . Per velocit`a non relativistiche questo fattore `e prossimo all’unit`a, in qualsiasi 1 − ~v · ~n direzione, ma per velocit`a elevate esso diventa molto grande lungo la direzione di volo della particella. Per ~n = ~v /v si ha infatti, 1 1 = . 1 − ~v · ~n 1−v Per analizzare l’effetto di questi termini pi` u in dettaglio riscriviamo la (9.28) come prodotto di due fattori, ¯2 ¯ 1 dW e2 ¯¯ ~n × [(~n − ~v ) × ~a] ¯¯ · = , ¯ ¯ 2 dΩ 16 π (1 − ~v · ~n) (1 − ~v · ~n)4

(9.29)

e distinguiamo i seguenti due casi. Velocit` a e accelerazione generiche. Consideriamo un istante in cui la velocit`a e l’accelerazione formano un generico angolo diverso da zero. Per ~n = ~v /v abbiamo, ~n − ~v = ~n, 1 − ~v · ~n e quindi lungo la direzione di volo il primo fattore della (9.29) si riduce a ¯ ¯ ¯ ~n × [(~n − ~v ) × ~a] ¯2 ¯ ¯ = |~n × ~a|2 , ¯ ¯ (1 − ~v · ~n)

(9.30) 41

,

che `e indipendente dalla velocit`a. D’altra parte, il secondo fattore della (9.29) lungo la direzione di volo diventa 1/(1 − v)4 , che per v ∼ 1 `e molto grande. Concludiamo quindi che una particella ultrarelativistica in moto generico emette radiazione principalmente “in avanti”, lungo la direzione del moto. Possiamo stimare l’apertura angolare α del cono centrato in ~v , all’interno del quale viene emessa la maggior parte della radiazione. Le direzioni ~n in questione devono soddisfare, 1 − ~v · ~n ∼ 1 − v, 41

(9.31)

Un’analisi pi` u accurata mostra che per qualsiasi ~n vale, ¯ ¯ ¯ ~n − ~v ¯ ¯ ¯≤ √ 1 1≤¯ , 1 − ~v · ~n ¯ 1 − v2

dove, se α `e l’angolo tra ~v e ~n, l’estremo inferiore viene raggiunto per α = 0 e α = π, mentre l’estremo √ superiore si raggiunge per sen α = 1 − v 2√ . In realt`a, quindi, per v ∼ 1 anche il vettore (~n −~v )/(1 −~v ·~n) diventa molto grande, nella direzione α ≈ 1 − v 2 , sicch´e la (9.30) equivale a una stima per difetto.

282

di modo tale che il valore del fattore

1 della (9.29) si mantenga vicino al suo (1 − ~v · ~n)4

1 . Indicando l’angolo tra ~n e ~v con α, e sfruttando il fatto che questo (1 − v)4 angolo `e piccolo, abbiamo, µ ¶ α2 α2 1 − ~v · ~n = 1 − v cosα ∼ 1 − v 1 − ∼1−v+ . 2 2 √ Se vogliamo che valga la (9.31) dobbiamo dunque avere α ∼ 1 − v, oppure, che `e lo massimo

stesso, α∼



1 − v2.

(9.32)

In conclusione, una particella ultrarelativistica in moto generico, irradia principalmente lungo la direzione di volo, e la maggior parte della radiazione `e contenuta nel cono centrato √ in ~v di apertura angolare α ∼ 1 − v 2 . Velocit` a parallela all’accelerazione. Un caso speciale `e rappresentato dalle orbite rettilinee, vedi paragrafo 9.2.1, per cui ~a k ~v . Per tali orbite la (9.29) si riduce a, dW e2 |~n × ~a|2 e2 a2 sen2 α = = , dΩ 16 π 2 (1 − ~v · ~n)6 16 π 2 (1 − v cosα)6 dove α `e di nuovo l’angolo tra ~n e ~v . In questo caso si vede che la particella non emette dW radiazione lungo la direzione di volo, perch´e si annulla in α = 0. Tuttavia, dalla dΩ dW formula appena scritta `e facile vedere che nel limite ultrarelativistico, ha un massimo dΩ √ molto pronunciato per α ∼ 1 − v 2 , vedi problema 9.2. Anche in questo caso la maggior parte della radiazione viene quindi emessa all’interno del cono centrato in ~v e di apertura √ ∼ 1 − v2. Da queste considerazioni di carattere generale segue, per esempio, che un elettrone ultrarelativistico in un ciclotrone emette radiazione principalmente nel piano dell’orbita, attraverso un lampo spiraleggiante di tipo “pulsar”. Si noti che questa distribuzione angolare della radiazione `e radicalmente diversa da quella emessa da un ciclotrone non relativistico, vedi problema 7.1. Energia osservata ed energia emessa. Concludiamo questa sezione con un commento sull’interpretazione della formula generale (9.28). Come osservato varie volte questa espressione fornisce la distribuzione angolare dell’energia della radiazione che a un istante 283

fissato t attraversa la sfera di raggio r nell’unit`a di tempo. Sappiamo poi che questa radiazione proviene dalla posizione della particella all’istante ritardato t0 dato dalla (9.4), t = t0 + r − ~n · ~y (t0 ). Se si vuole invece determinare la distribuzione angolare dell’energia emessa dalla particella tra gli istanti τ1 e τ2 bisogna considerare l’espressione, Z τ2 +r−~n·~y(τ2 ) Z τ2 dε dW dW = dt = (1 − ~n · ~v ) dt0 , dΩ τ1 +r−~ n·~ y (τ1 ) dΩ τ1 dΩ dove abbiamo usato la (9.5). La potenza emessa dalla particella nell’unit`a dt0 del suo tempo di accelerazione `e allora data da, dt dW dW dW 0 = 0 = (1 − ~n · ~v ) . dΩ dt dΩ dΩ

(9.33)

dW 0 dW rappresenta l’energia osservata da un osservatore lontano, mentre rappresenta dΩ dΩ l’energia emessa dalla particella. Per capire meglio il significato fisico della relazione (9.33) tra queste due grandezze, conviene considerare l’energia W 0 emessa dalla particella nell’unit`a di tempo proprio ds, dW 0 dW 0 dt0 dW 0 1 1 − ~n · ~v dW = =√ = √ , dΩ ds dΩ 1 − v 2 dΩ 1 − v 2 dΩ ovvero,

√ dW 1 − v 2 dW 0 = . dΩ 1 − ~n · ~v dΩ

In questa formula riconosciamo il fattore di proporzionalit`a dell’effetto Doppler, vedi sezione 5.4, che connette giustappunto la frequenza – e quindi l’energia – della radiazione emessa da una sorgente in moto, alla frequenza della radiazione rivelata da un osservatore statico. ` comunque immediato riconoscere che la presenza del fattore (1 − ~n · ~v ) nella (9.33), E non cambia i risultati dell’analisi qualitativa della distribuzione angolare ultrarelativistica di cui sopra.

9.4

Problemi

9.1 Si dimostri che l’energia totale irradiata da una particella ultrarelativistica con carica e, massa m e velocit`a v0 , che passa con parametro d’impatto b grande accanto a un nucleo 284

di carica Ze, considerato fisso, vale, ∆ε(v0 , b) =

e6 Z 2 1 − v02 /4 . 192π 2 m2 b3 v0 1 − v02

Si confronti il risultato con quello del problema 7.5. [Sugg.: Dato che v0 ≈ 1 e b `e grande, la particella praticamente non viene deviata e si pu`o assumere che la traiettoria sia pressoch`e rettilinea, ovvero ~y (t) = (v0 t, b, 0).] 9.2 Un’onda piana polarizzata circolarmente, con campo elettrico dato da, ~ ~x) = (E0 cos(ω(t − z)), E0 sen(ω(t − z)), 0), E(t, investe una particella carica relativistica. a) Si dimostri che i moti stazionari della particella sono moti circolari uniformi, determinandone velocit`a e raggio. b) Per questi moti si determini la potenza totale irradiata dalla particella. 9.3 Si analizzi la distribuzione angolare della radiazione emessa da una particella ultrarelativistica in moto rettilineo, individuando in particolare le direzioni di emissione massima e minima, e la si confronti con la distribuzione angolare del limite non relativistico.

285

10

Analisi spettrale

Nei capitoli precedenti abbiamo fornito gli strumenti principali per un’analisi sistematica del contenuto energetico della radiazione emessa da un generico sistema carico. Abbiamo in particolare derivato formule esplicite per l’energia emessa nell’unit`a di tempo, e per la distribuzione angolare della radiazione. Per alcuni sistemi siamo anche stati in grado di determinare le frequenze su cui essi emettono. Abbiamo visto, per esempio, che l’antenna lineare emette tutta la radiazione sulla frequenza fondamentale, mentre nel moto circolare uniforme la radiazione di dipolo contiene la frequenza fondamentale, e la radiazione di quadrupolo la prima armonica superiore, vedi problema 7.6. In generale la radiazione emessa da sistemi relativistici `e distribuita su un’ampia banda di frequenze, e molti sistemi fisici – da un semplice atomo a una pulsar – sono difatti identificabili attraverso il loro spettro di emissione. La grandezza osservabile rilevante `e la quantit`a di energia che viene emessa tra le frequenze ω e ω + ∆ω, osservabile che quantifica il peso con cui le varie frequenze sono presenti nella radiazione emessa dal sistema. Lo studio di questa grandezza viene chiamato “analisi spettrale”, o anche “analisi in frequenza”. In questo capitolo presenteremo un approccio sistematico all’analisi spettrale, valido per la radiazione di un sistema carico arbitrario. Nella prima sezione presenteremo gli strumenti fondamentali dell’approccio, in sezione 10.2 applicheremo questi strumenti a sistemi non relativistici, e in sezione 10.3 li applicheremo a sistemi relativistici.

10.1

Analisi di Fourier e risultati generali

Abbiamo visto che la soluzione generale delle equazioni di Maxwell nel vuoto corrisponde a una sovrapposizione di onde piane monocromatiche, e che l’analisi temporale di Fourier del campo elettromagnetico risultante equivale a un’analisi in frequenza, vedi (5.60). Corrispondentemente nel paragrafo 7.1.2 abbiamo visto che anche il campo elettromagnetico prodotto da una generica corrente nella zona delle onde `e sovrapposizione di onde elementari, e che il campo risultante ammette un’analisi di Fourier temporale, che ` possibile esprimere la trasformata di Fourier equivale ancora a un’analisi in frequenza. E del campo elettrico nella zona delle onde, direttamente in termini della generica sorgente 286

j µ data in (7.2). Per fare questo `e sufficiente inserire la (7.2) nella (7.9), e usare la (7.11). Si trova, ~ ~x) = √1 E(t, 2π dove, −i ωr

iωe ~ E(ω, ~x) ≡ − 4πr

Z

Z



~ dω eiωt E(ω, ~x),

−∞

h i d3 y ei ω ~n· ~y ~j(ω, ~y ) − (~n · ~j(ω, ~y )) ~n .

(10.1)

Come visto nel paragrafo 7.1.2, se la corrente `e periodica nel tempo anche il campo elettrico `e periodico, e la trasformata di Fourier pu`o allora essere sostituita da una serie di Fourier, ed `e immediato adattare le relazioni appena scritte a questo caso particolare. Per una corrente generica j µ l’analisi spettrale potrebbe essere basata sulla formula generale (10.1), ma siccome in questo capitolo siamo interessati principalmente alla radiazione emessa da una singola particella, preferiamo procedere in altro modo. L’analisi spettrale per una corrente generica verr`a sviluppata nella sezione 10.5. Dalle considerazioni appena svolte concludiamo comunque che per correnti aperiodiche possiamo porre,

Z



Z ∞ 1 ~ ~ E(t) = √ dω eiωt E(ω), 2π −∞ Z ∞ 1 ~ ~ E(ω) = √ dt e−iωt E(t), 2π Z ∞ −∞ Z ∞ 2 2 2 ~ ~ ~ |E(t)| dt = |E(ω)| dω = 2 |E(ω)| dω,

−∞

−∞

(10.2) (10.3) (10.4)

0

dove l’ultima riga rappresenta l’identit`a di Parseval. Se la corrente `e invece periodica, con periodo T e frequenza fondamentale ω0 = 2π/T , il campo elettrico pu`o essere sviluppato in serie di Fourier, ~ E(t) =

Z

T 0

~N , eiN ω0 t E

(10.5)

N =−∞ Z T

1 ~ dt, e−iN ω0 t E(t) T 0 ∞ ∞ X X 2 ~ ~ N |2 = 2 ~ N |2 . |E(t)| dt = |E |E ~N = E

1 T

∞ X

N =−∞

(10.6) (10.7)

N =1

Per scrivere l’ultima espressione in ciascun caso abbiamo sfruttato il fatto che il campo elettrico `e reale, quindi, ~ ∗ (ω) = E(−ω), ~ E 287

∗ ~N ~ −N , E =E

e che le frequenze vengono considerate positive. Inoltre, nella serie di Fourier abbiamo omesso il termine con N = 0. Il campo elettrico `e, infatti, proporzionale alla derivata temporale del potenziale vettore, vedi (7.11), ´ ∂ ³ ~ ~ , E(t) = ~n × (~n × A) ∂t ~ `e periodico, la (10.6) d`a, e siccome anche A ~0 = 1 E T

Z

T

~ dt = 0. E(t)

0

~ Facciamo notare che tutte le quantit`a indicate con E(·) andrebbero scritte pi` u corretta~ ~x), ma per non appesantire la notazione omettiamo di indicare esplicimente come E(·, ~ tamente la dipendenza da ~x. Dalla (10.1) vediamo, comunque, che E(ω, ~x) dipende da r −i ωr e ~ semplicemente attraverso il fattore . La grandezza E(ω, ~x) `e quindi essenzialmente r una funzione di ω e della direzione ~n. Ricordiamo ancora che qu`ı non stiamo considerando il campo elettrico esatto, ma il campo nella zona delle onde. Riprendiamo dunque la formula generale per la distribuzione angolare della potenza emessa, dW d 2ε 2 ~ = = r2 |E(t)| . dΩ dt dΩ Sistemi aperiodici. Per una corrente aperiodica la grandezza fisica rilevante `e l’energia totale emessa nell’unit`a di angolo solido tra t = −∞ e t = ∞. Se le particelle sono sottoposte a forze per un tempo limitato, l’accelerazione ha una durata finita, e anche l’energia totale emessa sar`a, quindi, finita. Utilizzando la (10.4) si ottiene allora, dε = dΩ

Z

∞ −∞

dW dt = r2 dΩ

Z



Z ~ |E(t)| dt = 2r 2

−∞



2

2 ~ |E(ω)| dω.

0

L’energia emessa nell’intervallo unitario di frequenze e nell’unit`a di angolo solido `e quindi data da, d 2ε 2 ~ = 2r2 |E(ω)| , dω dΩ

(10.8)

e lo spettro di frequenze presenti `e in generale un sottoinsieme “continuo” di R+ . Sistemi periodici. Per una corrente periodica l’energia totale emessa `e infinita, e la grandezza di rilievo `e allora la potenza media, ovvero, l’energia emessa durante un periodo

288

divisa il periodo. In questo caso utilizziamo la (10.7) e otteniamo, dW 1 = dΩ T

Z

T 0

1 dW dt = r2 dΩ T

Z

T

2 ~ |E(t)| dt = 2r2

0

∞ X

~ N |2 . |E

(10.9)

N =1

La potenza della radiazione emessa con la frequenza ωN = N ω0 nell’unit`a di angolo solido, `e quindi data da, dWN ~ N |2 . = 2r2 |E dΩ

(10.10)

Le formule (10.8) e (10.10) costituiscono il punto di partenza per l’analisi spettrale di un generico fenomeno radiativo. Si noti che esse richiedono solo la conoscenza del campo elettrico – nella zona delle onde.

10.2

Analisi spettrale nel limite non relativistico

Nel limite non relativistico le (10.8) e (10.10) possono essere valutate immediatamente, perch´e in questo caso il campo elettrico `e dato semplicemente in termini del momento di dipolo del sistema, vedi (7.39), ³ ´ 1 ~¨ − r) . ~ ~n × ~n × D(t E(t) = 4πr

(10.11)

Trattiamo separatamente i due tipi di corrente. ~ Corrente aperiodica. Definendo la trasformata di Fourier di D(t) in modo standard, 1 ~ D(ω) =√ 2π

Z



~ dt e−iωt D(t),

(10.12)

−∞

dalla (10.11) segue facilmente, si confronti con (10.1), ³ ´ ω 2 e−i ω r ~ ~ E(ω) =− ~n × ~n × D(ω) . 4πr La (10.8) d`a quindi,

¯2 ω 4 ¯¯ d 2ε ¯ ~ = 2 ¯~n × D(ω)¯ . dω dΩ 8π

(10.13)

Integrando sugli angoli risulta poi, dε ω4 ~ = |D(ω)|2 . dω 3π Infine l’integrale

R∞ 0

dε dω

dω fornisce l’energia totale emessa.

289

(10.14)

Frequenze caratteristiche: analisi qualitativa. Consideriamo ora come caso particolare una particella non relativistica che esegue un moto aperiodico. Dato che il suo momento ~ ~¨ di dipolo `e D(t) = e ~y (t), abbiamo D(t) = e ~a(t), e la trasformata di Fourier di questa ~ relazione d`a −ω 2 D(ω) = e ~a(ω), dove ~a(ω) indica la trasformata di Fourier di ~a(t). La (10.14) fornisce allora la distribuzione in frequenza, dε e2 = |~a(ω)|2 . dω 3π

(10.15)

Supponiamo ora che la forza F~ (t) agente sulla particella sia caratterizzata da un tempo F~(t) caratteristico T . Dato che ~a(t) = , per le propriet`a della trasformata di Fourier m possiamo allora concludere che |~a(ω)| `e una funzione apprezzabilmente non nulla solo per 1 valori di ω che si estendono circa fino a . Vale allora il seguente risultato generale circa T la distribuzione spettrale della radiazione emessa da una particella non relativistica in moto aperiodico: se la forza alla quale `e sottoposta la particella varia su scale temporali dell’ordine di T , allora la radiazione emessa `e concentrata principalmente in un intervallo di frequenze limitato superiormente da, ω∼

1 . T

(10.16)

Corrente periodica. Per una corrente periodica definiamo i coefficienti di Fourier, Z T 1 ~ dt, ~N = e−iN ω0 t D(t) (10.17) D T 0 e dalla (10.11) segue allora, 2 −i N ω0 r

~ N = − (N ω0 ) e E 4πr La (10.10) d`a quindi,

³ ´ ~N . ~n × ~n × D

¯2 (N ω0 )4 ¯¯ dWN ¯ ~ = ¯~n × DN ¯ . 2 dΩ 8π

(10.18)

Integrando sugli angoli risulta poi, WN = Infine la somma

P∞ N =1

(N ω0 )4 ~ 2 |D N | . 3π

(10.19)

WN uguaglia la potenza totale media W.

Per quanto riguarda le frequenze dominanti, per i moti periodici vale un risultato simile a quello visto per i moti aperiodici. Se la scala temporale su cui varia la forza esterna 290

`e dell’ordine del periodo, allora il sistema emette principalmente sulle prime armoniche superiori, cio`e, sulle frequenze, ωN = N ω 0 , con N dell’ordine dell’unit`a. Questo risultato `e illustrato nell’esempio del paragrafo 10.2.2. Moti armonici semplici. Consideriamo un sistema di particelle che compiono moti armonici semplici,

µ ~yr (t) = ~br sen

¶ µ ¶ 2π 2π t + ~cr cos t , T T

con lo stesso periodo T . Esempi di moti di questo tipo sono i moti circolari uniformi, e i moti di oscillazione sinusoidale in una direzione. Un tale sistema emette radiazione 2π sclusivamente sulla frequenza fondamentale ω0 = . Infatti, in questo caso la relazione T P ~¨ D(t) = r er ~ar (t) d`a, X 2 ~ DN = er ~arN , −ωN r

dove ~arN indica il coefficiente di Fourier N –esimo di ~ar (t). Ma siccome per un moto armonico semplice si ha ~arN = 0 per N 6= 1, nella (10.19) solo il termine W1 `e allora diverso da zero. Insistiamo sul fatto che i risultati qualitativi di questo paragrafo valgono nel limite non relativistico. 10.2.1

Bremsstrahlung a spettro continuo e catastrofe infrarossa

In questo paragrafo vogliamo illustrare i risultati del paragrafo precedente, nel caso di una particella non relativistica che viene accelerata da un campo elettrico esterno. Per essere precisi consideriamo una particella carica che attraversa una regione limitata in cui esiste un campo elettrico costante e uniforme. L’accelerazione `e allora diversa da zero solo per un periodo limitato, e la particella compie un moto aperiodico. Di conseguenza essa emette radiazione – Bremsstrahlung – a spettro continuo. Vogliamo determinare la forma dello spettro di emissione, e individuare in particolare le frequenze su cui la particella emette maggiormente. Confronteremo poi i risultati ottenuti con la previsione fatta nella (10.16). Senza perdita di generalit`a possiamo supporre che la particella entri nella zona del campo elettrico all’istante t = −T , e che esca da questa zona all’istante t = T . In questo 291

intervallo temporale la sua accelerazione vale allora, ~a =

~ eE , m

mentre fuori dall’intervallo essa `e zero. La (10.15) richiede allora di valutare la trasformata di Fourier, 1 ~a (ω) = √ 2π

Z



dt e −∞

−iωt

~ 1 eE √ ~a(t) = m 2π

Z

T −T

~ sen(ωT ) 2eE . dt e−iωt = √ ω 2π m

La (10.15) d`a allora, dε 2 e2 a2 sen2 (ωT ) = . dω 3π 2 ω2

(10.20)

π . Oltre T questo valore essa va rapidamente a zero, in accordo con il risultato generale (10.16).

Questa funzione ha un massimo per ω = 0, e si annulla la prima volta per ω =

Possiamo anche valutare l’energia totale emessa durante l’intera fase di accelerazione. Per fare questo possiamo integrare la (10.20) su tutte le frequenze, usando l’integrale, Z



³ sen x ´2 x

0

dx =

π , 2

oppure possiamo applicare la formula di Larmor W = e2 a2 /6π. Si ottiene, Z



∆ε = 0

dε dω = dω

Z

T

W dt = −T

e2 a2 T e2 |∆~v |2 = , 3π 12 π T

(10.21)

dove abbiamo introdotto la differenza tra le velocit`a iniziale e finale, ∆~v ≡ ~vf − ~vi = 2 T~a. Abbiamo quindi trovato un legame diretto tra l’energia irradiata, e la variazione della velocit`a della particella – causa della radiazione. Vediamo ora come si comporta la distribuzione spettrale nel limite in cui la durata del processo va a zero, T → 0, a parit`a di ∆~v . Dalla (10.20) segue, dε e2 |∆~v |2 sen2 (ωT ) = dω 6π 2 ω2T 2



e2 |∆~v |2 , 6π 2

e si otterrebbe quindi uno spettro “piatto”, in cui tutte le frequenze sono equiprobabili, ancora in accordo con la (10.16). D’altra parte in questo limite l’energia totale (10.21) divergerebbe. Da ci`o si desume che la schematizzazione dell’urto di una particella carica 292

come un processo istantaneo – usata spesso negli studi teorici, per via della sua semplicit`a – `e fisicamente inconsistente, perch´e l’energia emessa sarebbe infinita. Catastrofe infrarossa. Concludiamo la discussione di questo esempio con un commento su un fenomeno quantistico che viene chiamato “catastrofe infrarossa”. Abbiamo appena visto che l’energia totale emessa durante il processo `e finita. Teniamo ora in conto che l’emissione di radiazione elettromagnetica di frequenza ω a livello quantistico corrisponde all’emissione di fotoni con energia individuale ~ω

42

. Possiamo allora chiederci quanti

fotoni vengono emessi nell’intervallo di frequenza ω e ω + dω, e la risposta `e, dN 1 dε 2 e2 a2 sen2 (ωT ) = = . dω ~ω dω 3π 2 ~ ω3 Il numero di fotoni emessi tra le frequenze ω1 e ω2 `e allora dato da, Z Z ω2 2 e2 a2 ω2 sen2 (ωT ) dN N (ω1 , ω2 ) = dω = dω. 3π 2 ~ ω1 ω3 ω1 dω Come si vede il numero di fotoni “duri”, cio`e, di frequenza elevata, risulta finito in quanto l’integrale N (ω, ∞) `e finito. D’altra parte il numero di fotoni “soffici”, cio`e, di frequenza bassa, diverge perch´e per ω → 0 si ha, sen2 (ωT ) T2 ≈ , ω3 ω e N (0, ω) diverge. Questo vuol dire che nonostante l’energia totale irradiata sia finita, il numero di fotoni soffici emessi durante il processo di accelerazione `e infinito. Questo fenomeno fisico porta il nome di “catastrofe infrarossa”, in quanto legato alla presenza di infiniti fotoni con energie tendenti a zero. So noti, tuttavia, che solo un numero finito di questi fotoni `e osservabile sperimentalmente, perch´e qualsiasi apparato di misura ha una “sensibilit`a” finita, potendo rivelare solo i fotoni che hanno un’energia al di sopra di una certa soglia ∆ε. Dall’analisi svolta `e chiaro che la catastrofe infrarossa `e dovuta semplicemente all’accelerazione della particella, indipendentemente dalla forza che la causa, e in particolare essa accompagna allora qualsiasi processo d’urto che coinvolge particelle cariche. D’altro canto questo fenomeno `e legato strettamente al fatto che il mediatore dell’interazione 42

La nostra analisi classica della radiazione resta valida per lunghezze d’onda molto superiori alla lunghezza d’onda Compton, λ À λC = ~/mc, cio`e per ω ¿ mc2 /~, che vuol dire T À ~/mc2 ≈ 10−21 s. L’analisi della catastrofe infrarossa svolta nel testo riguarda il caso ω → 0, per cui la trattazione classica `e comunque valida.

293

elettromagnetica – il fotone – essendo privo di massa pu`o raggiungere energie ~ω arbitrariamente piccole. Concludiamo quindi che la catastrofe infrarossa non avviene nelle interazioni deboli, i cui mediatori sono massivi, mentre `e presente sia nelle interazioni gravitazionali che in quelle forti. Notiamo, tuttavia, che nelle interazioni forti, per via del fenomeno del confinamento, i gluoni soffici non si presentano come particelle “asintotiche” libere, perch´e adronizzano in pochissimo tempo formando particelle massive. Infine osserviamo che, essendo un fenomeno di basse energie, la catastrofe infrarossa considerata qu`ı a livello classico, si ripresenta in teoria quantistica di campo dove causa una seria di problemi, sia di carattere tecnico che concettuale, che in parte aspettano tuttora di essere risolti – come per esempio in Cromodinamica Quantistica. 10.2.2

Bremsstrahlung a spettro discreto

Consideriamo una particella non relativistica che compie un moto periodico di periodo T lungo un arco di circonferenza di raggio R, con legge oraria, ~y (t) = (R cosϕ(t), R senϕ(t), 0),

ϕ(t) = ϕ0 sen(ω0 t),

0 < ϕ0 < π/2,

dove ω0 = 2π/T `e la frequenza fondamentale, e ϕ0 `e l’elongazione. Sappiamo allora che questa particella emette radiazione con frequenze ωN = N ω0 . Vogliamo eseguire l’analisi spettrale di questo sistema, cercando in particolare di individuare le frequenze su cui la particella emette la maggior parte della radiazione. Per la potenza totale mediata su un ciclo possiamo usare la formula di Larmor, W=

e2 2 a, 6π

e un semplice conto fornisce, µ

e2 R2 ω04 W= 6π

¶ 1 2 3 4 ϕ + ϕ . 2 0 8 0

Per calcolare la potenza che la particella emette sulla frequenza ωN = N ω0 , occorre ~ valutare i coefficienti di Fourier del momento di dipolo D(t) = e ~y (t), ~N = 1 D T

Z

T

dt e 0

eR D(t) = T

Z

T

−i N ω0 t ~

dt e−i N ω0 t (cosϕ(t), senϕ(t), 0).

0

294

(10.22)

Funzioni di Bessel. Gli integrali di cui sopra possono essere espressi in termini delle funzioni di Bessel di ordine intero N , 1 JN (y) = 2π

Z



e

i(N x−y senx)

0

1 dx = π

Z

π

cos(N x − y senx)d x,

(10.23)

0

di cui elenchiamo ora qualche propriet`a. Esse soddisfano, JN (−y) = J−N (y) = (−)N JN (y).

(10.24)

Si ha inoltre, Z 2π 1 N ei(N x−y senx) cosx dx = JN (y), 2π 0 y Z 2π 1 ei(N x−y senx) senx dx = i JN0 (y). 2π 0

(10.25) (10.26)

La prima discende dall’identit`a, Z

2π 0

d i(N x−y senx) e dx = 0, dx

mentre la seconda `e immediata. Si hanno poi gli andamenti asintotici, r ³ ´ 2 π JN (y) ∼ cos y − (2N + 1) , per y → ∞, N fissato, πy 4 ³ ´ N 1 y , per y → 0, N fissato, JN (y) ∼ N! 2 ³ ´ 1 y N JN (y) ∼ , per N → ∞, y fissato. N! 2 Il coincidere degli ultimi due andamenti deve considerarsi una casualit`a. La valutazione degli integrali nella (10.22) `e allora immediata, µ ¶ eR 1 ~N = D JN (ϕ0 ) + JN (−ϕ0 ), (JN (ϕ0 ) − JN (−ϕ0 )), 0 . 2 i Per la potenza irradiata sulla frequenza N –esima risulta in definitiva, WN =

(N ω0 )4 ~ 2 e2 R2 (N ω0 )4 2 |D N | = JN (ϕ0 ), 3π 3π

e il teorema di Parseval assicura poi che, W=

∞ X N =1

295

WN .

(10.27) (10.28) (10.29)

Cerchiamo ora di capire quali sono i WN che contribuiscono maggiormente a questa somma. Per fare questo sfruttiamo gli andamenti asintotici delle funzioni di Bessel di cui sopra. Per N grandi abbiamo, WN N 4 J 2 (ϕ0 ) 1 = 1 2 N 3 4 ≈ 2N , N ϕ + 16 ϕ0 W 4 0

(10.30)

che vuol dire che le armoniche superiori sono comunque fortemente soppresse. Possiamo considerare inoltre il caso di elongazioni ϕ0 piccoli, e di elongazioni dell’ordine dell’unit`a. Per ϕ0 piccoli possiamo rapportare la potenza emessa sull’armonica fondamentale, alla potenza totale, W1 = W

¡ ¢ J12 (ϕ0 ) = 1 − ϕ20 + o ϕ40 , 1 2 3 4 ϕ + 16 ϕ0 4 0

dove abbiamo utilizzato lo sviluppo J1 (x) =

x x3 − + o(x5 ). 2 16

(10.31)

Per ϕ0 piccoli quasi tutta la potenza viene quindi emessa sull’armonica fondamentale. Ma anche scegliendo elongazioni ϕ0 dell’ordine dell’unit`a, la situazione resta qualitativamente la stessa. Per ϕ0 = 1, che corrisponde a un’elongazione di circa 60o , la (10.30) d`a, WN 16 4 2 = N JN (1), 7 W e usando per JN (1) i valori tabulati si ricava, W1 = 0.43, W

W1 + W2 = 0.91, W

W1 + W2 + W3 = 0.98. W

Si vede che praticamente tutta l’energia viene emessa sulle prime armoniche pi` u basse.

10.3

Analisi spettrale relativistica

In questa sezione ci occupiamo dello spettro di emissione di un generico sistema relativistico. Nel primo paragrafo deriveremo la formula fondamentale per lo spettro di emissione di una particella singola in moto arbitrario, vedi (10.40), (10.42), e nel paragrafo successivo useremo questa formula per determinare le frequenze caratteristiche della radiazione emessa da una generica particella ultrarelativistica. Nella sezione 10.4 la applicheremo, 296

invece, per eseguire l’analisi spettrale quantitativa della radiazione emessa da una particella in un ciclotrone relativistico. Nella sezione 10.5 deriveremo, infine, un’espressione per lo spettro di emissione di una corrente generica. 10.3.1

Spettro di emissione di una particella singola

In questo paragrafo vogliamo dunque derivare una formula per la distribuzione in frequenza della radiazione emessa da una particella carica in moto arbitrario. Il risultato dar`a l’energia emessa per unit`a di frequenza, in termini di un integrale semplice lungo la traiettoria della particella. Riprendiamo il campo elettrico asintotico di Lienard–Wiechert (9.2), ~ ~x) = e ~n × [(~n − ~v ) × ~a] . E(t, 4πr (1 − ~v · ~n)3

(10.32)

Per determinare la distribuzione in frequenza della radiazione dobbiamo inserire questa formula rispettivamente nelle (10.3) e (10.6), e usare le (10.8) e (10.10). Di nuovo trattiamo separatamente moti periodici e aperiodici. Moto periodico. Per un moto periodico si tratta di valutare, per ogni ~x fissato, il ~ N (~x) ≡ E ~N , coefficiente di Fourier E ~N = 1 E T

Z

T

~ ~x). dt e−iN ω0 t E(t,

(10.33)

0

Prima di procedere dobbiamo ricordarci che le variabili ~v e ~a che compaiono nella (10.32) non sono valutate all’istante t, ma all’istante ritardato t0 (t, ~x), dato dalla (9.4), t = t0 + r − ~n · ~y (t0 ).

(10.34)

Nell’integrale (10.33) conviene allora passare dalla variabile d’integrazione t alla variabile t0 . Siccome ~x `e tenuto fisso, la misura di integrazione cambia secondo la (9.5), dt = (1 − ~n · ~v ) dt0 .

(10.35)

Usando queste relazioni la (10.33) si scrive allora come un integrale lungo la traiettoria, Z e −iN ω0 r 1 T −iN ω0 (t0 −~n·~y(t0 )) ~n × [(~n − ~v ) × ~a] 0 ~ EN = e e · dt , (10.36) 4πr T 0 (1 − ~v · ~n)2 Si noti che la (10.34) assicura che, se t corre lungo un periodo, anche t0 corre lungo un periodo, perch´e la legge oraria ~y (t0 ) `e periodica. L’integrale nella (10.36) `e quindi di 297

nuovo tra 0 e T . Inserendo questa espressione nella (10.10), e chiamando la variabile d’integrazione di nuovo t, si ottiene per la distribuzione angolare della potenza emessa sulla frequenza ωN = N ω0 , dWN e2 = 2 dΩ 8π

¯ Z T ¯2 ¯1 ¯ ~ n × [(~ n − ~ v ) × ~ a ] −i N ω (t−~ n ·~ y ) 0 ¯ ¯ . e · dt ¯T ¯ (1 − ~v · ~n)2 0

Questa formula pu`o essere ulteriormente semplificata, se si usano le identit`a, · ¸ d ~n × (~n × ~v ) ~n × [(~n − ~v ) × ~a] , = (1 − ~v · ~n)2 dt (1 − ~v · ~n) d −i N ω0 (t−~n·~y) e = −i N ω0 (1 − ~v · ~n) e−i N ω0 (t−~n·~y) . dt Con un’integrazione per parti la (10.37) si riduce allora a, ¯2 ¯ Z ¯ dWN e2 (N ω0 )2 ¯¯ 1 T −i N ω0 (t−~n·~y) ¯ , e ~ v dt = ~ n × ¯ ¯ dΩ 8π 2 T 0

(10.37)

(10.38)

(10.39)

(10.40)

dove abbiamo usato che |~n × (~n × V~ )| = |~n × V~ |, per qualsiasi vettore V~ . Limite non relativistico. La (10.40) fornisce la distribuzione in frequenza della radia` zione emessa da una particella con velocit`a arbitraria, nota la sua legge oraria ~y (t). E immediato verificare che nel limite non relativistico questa formule si riduce alla (10.18), ricavata nel paragrafo 10.2. In questo limite il termine ~n · ~y nell’esponente della (10.40) d~y , un’integrazione per parti muta la (10.40) in, `e, infatti, trascurabile, e scrivendo ~v = dt ¯2 ¯ Z ¯ dWN e2 (N ω0 )4 ¯¯ 1 T −i N ω0 t ¯ . e ~ y dt ≈ ~ n × ¯ ¯ dΩ 8π 2 T 0 Questa espressione coincide con la (10.18), in quanto per una particella singola si ha, Z T Z T 1 e −i N ω t 0 ~ ~N = D e D(t) dt = e−iN ω0 t ~y dt. T 0 T 0 Moto aperiodico. Per un moto aperiodico si procede in modo del tutto analogo, partendo dalle (10.8), (10.3) e (10.32), e si trova facilmente che al posto di (10.37) ora si ottiene per la distribuzione in frequenza, ¯ ¯2 Z ∞ d 2ε e2 ¯¯ 1 ~n × [(~n − ~v ) × ~a] ¯¯ −iω(t−~ n·~ y) = 2 ¯√ dt¯ . e · dω dΩ 8π (1 − ~v · ~n)2 2π −∞

(10.41)

Tuttavia, l’integrazione per parti basata sulle (10.38), (10.39), con l’identificazione N ω0 ↔ ω, non pu`o essere eseguita in modo naiv nell’integrale presente nella (10.41). Il motivo 298

`e che il termine al bordo dell’integrazione per parti `e situato ora all’infinito temporale, e l’integrando non ammette limite per t → ±∞, per la presenza dei fattori oscillanti e−iω(t − ~n · ~y ) . Per ovviare a questa difficolt`a tecnica conviene regolarizzare l’integrale nella (10.41) introducendo un cut-off temporale L, Z ∞ Z L dt → dt, −∞

−L

ed eseguire l’integrazione per parti per L finito. Per L → ∞ il termine al bordo ancora non ammette limite, ma esso va a zero se questo limite viene eseguito nel senso delle distribuzioni nella variabile ω. Questa procedura `e quindi perfettamente lecita, purch´e anche l’integrale improprio risultante vada considerato come limite nel senso delle distribuzioni. Con questo caveat `e allora immediato vedere che le (10.38), (10.39) mutano la (10.41) nell’espressione pi` u semplice, ¯2 ¯ Z ∞ ¯ e2 ω 2 ¯¯ d 2ε 1 −i ω(t−~ n·~ y) ¯ , √ e ~ v dt = ~ n × ¯ ¯ dω dΩ 8 π2 2π −∞

(10.42)

analoga alla (10.40). Per illustrare come la (10.42) sia ben definita solo nel senso delle distribuzioni, verifid 2ε chiamo che per una particella in moto rettilineo uniforme, ~y (t) = ~v t, si ottiene = 0, dω dΩ in accordo con il fatto che una particella non accelerata non emette radiazione. Si noti che in questo caso la (10.41), che `e comunque ben definita, d`a il risultato corretto, perch´e ~a(t) = 0 identicamente. Volendo usare la (10.42) si tratta, invece, di valutare l’integrale, Z ∞ Z L −i ωt(1−~ n·~v ) 0 e ~v dt ≡ S − lim e−i ωt(1−~n·~v) ~v dt. L→∞

−∞

−L

Ricordando la rappresentazione della δ di Dirac, Z L 0 S − lim e−ik x dk = 2π δ(x), L→∞

−L

risulta dunque l’espressione ben definita nello spazio delle distribuzioni, Z ∞ 2π ~v e−i ωt(1−~n·~v) ~v dt = δ(ω). 1 − ~n · ~v −∞ Tuttavia, nella (10.42) questo integrale appare moltiplicato per ω, e siccome ω δ(ω) = 0, d 2ε risulta in effetti = 0. dω dΩ Usando la (10.41), infine, `e immediato vedere che nel limite non relativistico si riottiene la (10.13). 299

10.3.2

Frequenze caratteristiche nel limite ultrarelativistico

Vogliamo ora eseguire un’analisi qualitativa dello spettro emesso da una generica particella ultrarelativistica, v ∼ 1, in moto aperiodico. Ci chiediamo in particolare quali sono le frequenze su cui una particella ultrarelativistica emette in generale la maggior parte della radiazione. Ricordiamo che nel caso non relativistico la risposta a questa domanda `e data dalla (10.16), ovverosia, la particella emette la maggior parte della radiazione entro le frequenze, ω∼

1 , T

(10.43)

se T `e la scala temporale sulla quale la forza varia sensibilmente. Per analizzare la distribuzione in frequenza della radiazione emessa da una particella ultrarelativistica, possiamo sfruttare il fatto che una particella che viaggia con velocit`a molto elevata, devia poco dalla traiettoria rettilinea. L’angolo di scattering χ, che `e l’angolo tra la direzione incidente e quella uscente, sar`a quindi molto piccolo, cos`ı come `e piccola l’apertura angolare α del cono, entro il quale viene emessa la maggior parte √ della radiazione. Dalla sezione 9.3 sappiamo, infatti, che vale α ∼ 1 − v 2 . Eseguiremo l’analisi spettrale ultrarelativistica distinguendo i casi χ ¿ α, e α ¿ χ. L’angolo di scattering χ. Per dare una stima dell’angolo di scattering, supponiamo che la particella sia soggetta alla forza di Lorentz, d~p ~ + ~v × B), ~ = e(E dt

dε ~ = e ~v · E, dt

e che i campi esterni siano sensibilmente diversi da zero solo in una regione spaziale limitata, di dimensioni lineari L. Siccome la particella `e ultrarelativistica, essa percepir`a dunque questi campi per una durata caratteristica T ∼ L. Per le variazioni della quantit`a di moto e dell’energia tra lo stato iniziale e quello finale, otteniamo allora, ¯ ¯Z ∞ Z ∞ ¯ ¯ ~ dt ∼ e F T, ~ ~ ¯ ¯ ∆ε = e ~v · E (E + ~v × B) dt¯ ∼ e F T, |∆~p| = e ¯

(10.44)

−∞

−∞

dove abbiamo posto v ∼ 1, e indicato con F un valore caratteristico dei campi elettrico e magnetico. Dato che la particella viene deflessa poco, l’angolo di scattering `e dato dal modulo della differenza tra i versori finale e iniziale, χ ∼ |~nf − ~ni |. Siccome abbiamo

300

p~ ~v = , si ottiene allora, ε ¯ ¯ ¯ µ ¶¯ ¯ µ ¶¯ ¯ ~vf ~vi ¯ ¯ ~v ¯¯ ¯¯ p~ ¯¯ ¯ χ = ¯ − ¯¯ = ¯¯∆ = , ∆ vf vi v ¯ ¯ |~p| ¯ √ dove ~vi e ~vf sono le velocit`a iniziale e finale. Dato che |~p| = ε2 − m2 , e quindi ∆|~p| = ε ∆ε ∼ ∆ε, si ottiene, |~p| √ µ ¶ 1 − v2 p~ ∆~p p~ ∆ε ∆ = − ∼ (∆~p − ~v ∆ε) . |~p| |~p| |~p| 2 m Usando le (10.44) risulta quindi la stima, √ 1 − v2 e F T. χ∼ m

(10.45)

Si ottiene allora, χ eF T ∼ , α m

(10.46)

rapporto che `e indipendente dalla velocit`a della particella, ma dipende solo dalle caratteristiche del campo esterno. La (10.46) pu`o essere scritta anche come il rapporto tra la eF 1 “frequenza di ciclotrone” non relativistica , vedi (9.24), e la frequenza di un moto m T aperiodo non relativistico, vedi (10.16), µ ¶ eF χ m (10.47) ∼ µ ¶ . 1 α T Frequenze caratteristiche per χ ¿ α. Consideriamo ora il caso in cui χ ¿ α. In questa situazione la maggior parte della radiazione viene emessa all’interno del cono centrato in ~v di apertura α, il cui asse durante il moto praticamente non cambia. Pertanto `e sufficiente analizzare la radiazione emessa nell’immediata vicinanza della direzione di ~v , e porre quindi nella formula generale (10.41), ~v ~n ≈ , v

~n − ~v ≈ (1 − v) ~n,

~y (t) ≈ ~v t.

Si ottiene cos`ı, d2ε e2 ≈ 2 dω dΩ 8π

¯ ¯2 Z ∞ ¯ ~n ¯ e2 1 −iω t(1−v) ¯ ¯ ≈ √ × e ~ a (t) dt |~n × ~a(ω(1 − v))|2 , ¯1 − v ¯ 8π 2 (1 − v)2 2π −∞ 301

dove ~a(ω(1 − v)) `e la trasformata di Fourier di ~a(t), calcolata in ω(1 − v). Dato che la particella percepisce la forza esterna per un tempo limitato T , la sua accelerazione varia sensibilmente sulla stessa scala temporale T . Per le propriet`a della trasformata di Fourier la funzione ~a(ω(1 − v)) `e allora apprezzabilmente diversa da zero per valori di ω per cui 1 ω(1 − v) ∼ ω(1 − v 2 ) < . In termini dell’energia della particella la maggior parte della T radiazione viene quindi emessa entro le frequenze caratteristiche, ω∼

1 1 1 ³ ε ´2 , = T 1 − v2 T m

(10.48)

da confrontare con la (10.43). Se χ ¿ α, lo spettro di radiazione di una particella ultrarelativistica `e quindi spostato molto verso le frequenze alte. Da un punto di vista quantistico questo vuol dire che la particella emette principalmente fotoni “duri”, cio`e, molto energetici, mentre nel caso non relativistico la particella emette fotoni molto pi` u “soffici”, cio`e, poco energetici Frequenze caratteristiche per α ¿ χ. Se l’angolo di scattering `e grande rispetto ad α, la direzione di emissione cambia sensibilmente durante il moto, e la radiazione emessa in una data direzione ~n proviene solo da quel piccolo arco della traiettoria, lungo il quale √ la velocit`a della particella forma con ~n un angolo inferiore a α ∼ 1 − v 2 . Chiamando ∆x la lunghezza di questo arco, e ricordando che durante l’intero percorso di lunghezza T ∼ L, la direzione della traiettoria cambia di un angolo χ, avremo che lungo questo arco la direzione della velocit`a cambia di un angolo, ∆x χ. T Siccome questo angolo `e uguale ad α, otteniamo per la lunghezza dell’arco in questione la stima, ∆x ∼

α T ¿ T. χ

Dato che ∆x `e, dunque, molto minore di T , lungo questo arco i campi possono essere assunti costanti, e dato che inoltre l’arco `e piccolo, esso potr`a essere approssimato con un arco di circonferenza. Siccome, per di pi` u, abbiamo che v ∼ 1, su questo arco il moto sar`a pressoch´e circolare uniforme. Possiamo allora anticipare il risultato (10.65) della sezione 10.4, in cui si esegue un’analisi dettagliata della radiazione emessa da una 302

particella ultrarelativistica in moto circolare uniforme – in quel caso in presenza di un campo magnetico costante e uniforme B. Previa la sostituzione B → F , la (10.65) d`a allora le frequenze caratteristiche, ω∼

e F ³ ε ´2 . m m

(10.49)

Come si vede, queste frequenze mostrano la stessa dipendenza dall’energia della (10.48), ma il coefficiente di proporzionalit`a corrisponde ora alla “frequenza di ciclotrone” non eF 1 relativistica , al posto di . m T Data la (10.47) possiamo riassumere i risultati di questo paragrafo, affermando che un sistema carico ultrarelativistico emette radiazione con frequenze caratteristiche, ω ∼ ω∗

³ ε ´2 m

,

(10.50)

dove ω∗ `e la pi` u grande tra le “frequenze fondamentali”

10.4

eF 1 e . m T

La radiazione del ciclotrone

In questa sezione eseguiamo l’analisi spettrale e angolare della radiazione emessa da una particella carica in un ciclotrone, dedicando particolare attenzione al caso ultrarelativistico v ∼ 1. Adottando la notazione del paragrafo 9.2.2, ricordiamo che la frequenza di ciclotrone e la velocit`a della particella sono date rispettivamente da, ω0 =

eB √ eB 1 − v2 = , m ε

v = ω0 R,

dove R `e il raggio dell’orbita. Siccome la particella compie un moto periodico con periodo T = 2π/ω0 , il sistema emette radiazione sulle frequenze, ωN = N ω 0 . Conosciamo anche la formula per la potenza totale media, vedi (9.25), W=

e2 v 2 ω02 . 6π (1 − v 2 )2

(10.51)

Ciclotrone non relativistico. Prima di procedere ricordiamo le principali caratteristiche della radiazione emessa da una particella non relativistica, v ¿ 1. In questo caso il sistema 303

emette solo sulla frequenza fondamentale (non relativistica) ω0 ≈ eB/m, con distribuzione angolare, dW dW1 e2 v 2 ω02 (1 + cos2 ϑ), = = 2 dΩ dΩ 32π

(10.52)

dove ϑ `e l’angolo tra la direzione di emissione ~n, e l’asse del ciclotrone, vedi problema 7.1. Il rapporto fra l’intensit`a della radiazione emessa lungo ϑ = π/2 (nel piano dell’orbita), e l’intensit`a emessa lungo ϑ = 0 (ortogonalmente all’orbita) risulta allora, dW ³ π ´ Wk 1 ≡ dΩ 2 = . W⊥ 2 dW (0) dΩ

(10.53)

Integrando la (10.52) sugli angoli si ottiene poi la potenza totale, W = W1 =

e2 2 2 v ω0 , 6π

da confrontare con la (10.51). 10.4.1

Analisi spettrale

D’ora in poi consideriamo una particella con velocit`a arbitraria. Cominciamo l’analisi della radiazione, valutando esplicitamente i coefficienti spettrali, (10.40), ¯ ¯2 Z ¯ e2 (N ω0 )2 ¯¯ dWN 1 T −i N ω0 (t−~n·~y) ¯ . = e ~ v dt ~ n × ¯ ¯ dΩ 8π 2 T 0

(10.54)

Prendendo come asse z l’asse dell’orbita, traiettoria, velocit`a e accelerazione istantanea della particella sono date da, ~y (t) = R (cosϕ, senϕ, 0)

(10.55)

~v (t) = v (−senϕ, cosϕ, 0),

(10.56)

~a(t) = −ω02 ~y (t),

(10.57)

ϕ = ω0 t.

(10.58)

dove,

Per via dell’invarianza per rotazioni attorno all’asse z, per quanto riguarda la valutazione della (10.54) non `e restrittivo scegliere la direzione di emissione ~n nel piano (y, z). Possiamo allora scrivere, ~n = (0, senϑ, cosϑ), 304

(10.59)

dove ϑ `e l’angolo tra ~n e l’asse z. Notando che, ω0 ~n · ~y = v senϑ senϕ, possiamo riscrivere l’integrale lungo l’orbita che compare nella (10.40) come, 1 T

Z

T

e 0

−i N ω0 (t−~ n·~ y)

v ~v dt = 2π

Z



e−i N (ϕ−v senϑ senϕ) (−senϕ, cosϕ, 0) dϕ,

(10.60)

0

dove dall’integrale in t siamo passati a un integrale in ϕ. Utilizzando le propriet`a (10.25) e (10.26) delle funzioni di Bessel, `e allora immediato riconoscere che la (10.60) equivale a, µ ¶ Z 1 1 T −i N ω0 (t−~n·~y) 0 e ~v dt = v i jN (vN senϑ), jN (v N senϑ), 0 . T 0 vsenϑ Calcolando il prodotto esterno tra questo vettore e ~n, e inserendolo nella (10.54), otteniamo cos`ı le distribuzioni angolari spettrali cercate, ¢ dWN e2 (N ω0 )2 ¡ 2 2 02 = ctg ϑ jN (vN senϑ) + v 2 jN (vN senϑ) . 2 dΩ 8π

(10.61)

Come prima cosa analizziamo il loro comportamento nel limite non relativistico v ¿ 1. Dalle formule asintotiche (10.28) vediamo che per v → 0 si hanno gli andamenti leading, dWN ∼ e2 ω02 v 2N , dΩ e quindi in questo limite le armoniche con N ≥ 2 sono fortemente soppresse rispetto all’armonica fondamentale N = 1. D’altra parte, usando la (10.28) `e immediato vedere che il peso spettrale (10.61) per N = 1, nel limite non relativistico si riduce alla (10.52). 10.4.2

Lo spettro nel limite ultrarelativistico

Per eseguire un’analisi qualitativa dello spettro emesso da una particella ultrarelativistica, conviene integrare la (10.61) sugli angoli, si veda per esempio J. Schwinger et. al. 43 , ¶ µ Z Z 2N v dWN e2 N ω02 2 2 0 WN = dΩ = j2N (y) dy . (10.62) 2v j2N (2N v) − (1 − v ) dΩ 4πv 0 Un argomento qualitativo. Prima di procedere con l’analisi della (10.62) nel limite v ∼ 1, diamo un argomento qualitativo per stabilire l’ordine di grandezza delle frequenze, 43

J. Schwinger, L.L. DeRaad, K.A. Milton e W. Tsai, Classical Electrodynamics, Perseus Books, Reading (MA), 1998.

305

su cui la particella emette maggiormente. Ricordiamo dalla sezione 9.3 che, se v ∼ 1, allora in un dato istante la particella emette principalmente in un cono attorno alla direzione √ di volo, di apertura angolare α ∼ 1 − v 2 . Se la particella compie un moto circolare di periodo T = 2π/ω0 , allora la radiazione in una data direzione di osservazione proviene solo da una piccola porzione dell’orbita, ovvero da quella che viene percorsa dalla particella nel tempo, α ∆t ∼ T ∼ 2π



0

1 − v2 . ω0

Una tipica frequenza di emissione `e allora data, ω0 =

1 ω0 ∼√ . 0 ∆t 1 − v2

D’altra parte, al tempo di emissione ∆t0 corrisponde il tempo di osservazione, vedi (10.35), ∆t = (1 − ~n · ~v )∆t0 ∼ (1 − v)∆t0 ∼ (1 − v 2 )∆t0 , a cui corrisponde dunque la frequenza osservata, ω=

1 ω0 ∼ . ∆t 1 − v2

Concludiamo che le frequenze caratteristiche della radiazione del ciclotrone ultrarelativistico sono date da, ω∼

³ ε ´3 ω0 = ω , 0 (1 − v 2 )3/2 m

(10.63)

che corrispondono dunque a armoniche di ordine molto elevato, N∼

³ ε ´3 m

.

(10.64)

In termini del campo esterno le frequenze caratteristiche della radiazione sono allora date da, ω∼

eB ³ ε ´2 . m m

(10.65)

Analisi quantitativa. Torniamo ora alle espressioni quantitative (10.62). Per quello che abbiamo appena visto dobbiamo apsettarci che per velocit`a vicine alla velocit`a della luce, sono dominanti i pesi spettrali WN con N molto grande. In realt`a si pu`o vedere che l’andamento della successione (10.62) per grandi N , dipende sensibilmente dal valore, √ grande anch’esso, di 1/ 1 − v 2 . Attraverso un’analisi asintotica delle funzioni di Bessel 306

che compaiono nella (10.62) si trova, infatti, che per v ∼ 1, a parte fattori numerici, si ha 44

,  2 2 1/3 per 1 ¿ N ¿ (1−v12 )3/2 ,  e ω0 N , WN ≈  e2 ω 2 √N (1 − v 2 )1/4 e− 23 N (1−v2 )3/2 , per 1 ¿ N. 0 (1−v 2 )3/2

(10.66)

Vediamo dunque che per valori di N grandi ma inferiori a 1/(1 − v 2 )3/2 , i pesi spettrali crescono come N 1/3 , mentre per N molto maggiore di 1/(1 − v 2 )3/2 essi sono esponenzialmente soppressi. La particella emette dunque radiazione fino a frequenze dell’ordine di, ωN = N ω 0 ∼

ω0 , (1 − v 2 )3/2

a conferma della (10.63). Dato che nel limite ultrarelativistico si ha ω0 = v/R ∼ 1/R, per le lunghezze d’onda emesse si trova allora il valore caratteristico, λ=

³ m ´3 2π ∼R . ωN ε

In base a questa formula la radiazione emessa da LEP conteneva lunghezze d’onda molto corte dell’ordine di λ ∼ 10−3 nm, corrispondenti a raggi γ, mentre la radiazione di LHC sar`a piccata su lunghezze d’onda molto pi` u lunghe, dell’ordine di λ ∼ 10 nm, corrispondenti a raggi X molli. 10.4.3

Distribuzione angolare

Invece di analizzare la distribuzione angolare delle singole frequenze, analizziamo la distribuzione angolare totale. A questo scopo si dovrebbe risommare la serie, N X dWN dW = , dΩ dΩ N =1

cosa che risulta difficile da fare direttamente. In questo caso `e pi` u conveniente ricorrere alla (10.9), r2 dW = dΩ T 44

Z

T 0

Vedi per esempio J. Schwinger et. al., op. cit.

307

~ 2 dt. |E|

(10.67)

~ 2 , con E ~ dato come al solito dalla (10.32). Come prima cosa bisogna dunque valutare |E| Inserendo le (10.55)–(10.57) e la (10.59), con un semplice conto si ottiene, ~ 2= |E|

e2 v 2 ω02 (1 − v 2 ) cos2 ϑ + (v − senϑ cosϕ)2 · , 16π 2 r2 (1 − v senϑ cosϕ)6

(10.68)

dove ora ϕ = ω0 t0 = ω0 t0 (t, ~x). Di nuovo `e conveniente cambiare variabile d’integrazione e passare da t a ϕ, utilizzando le (10.34), (10.35). Siccome si ha, dt = (1 − ~n · ~v (t0 )) dt0 = la (10.67) diventa, dW r2 = dΩ 2π

Z



1 − v senϑ cosϕ dϕ, ω0

~ 2 (1 − v senϑ cosϕ) dϕ. |E|

0

Inserendo in questa formula la (10.68) si trova un integrale che pu`o essere valutato esplicitamente, e il risultato `e, 2

dW e2 v 2 ω02 1 + cos2 ϑ − v4 (1 + 3v 2 ) sen4 ϑ = · . dΩ 32π 2 (1 − v 2 sen2 ϑ)7/2

(10.69)

Per velocit`a piccole riotteniamo la distribuzione “continua” (10.52), che ha un massimo per ϑ = 0. Viceversa, per velocit`a elevate, v ∼ 1, dall’esame del denominatore della π dW ha un massimo pronunciato nelle vicinancze di ϑ = , cio`e, nel (10.69) si vede che dΩ 2 piano dell’orbita. Cerchiamo allora di individuare le direzioni vicine al piano dell’orbita, entro le quali viene emessa la maggior parte della radiazione. Le direzioni in questione sono quelle per cui il denominatore della (10.69) resta essenzialmente dello stesso ordine di grandezza del suo valore massimo, ovvero, per angoli ϑ per cui, 1 − v 2 sen2 ϑ ∼ 1 − v 2 . Ponendo α =

π − ϑ, ci`o succede se, 2

µ ¶ α2 α2 1 − v cos α ∼ 1 − v 1 − ∼ 1 − v2, ∼ 1 − v2 + 2 2 2

2

2

ovvero, per direzioni ~n che formano con il piano dell’orbita angoli α minori o uguali a, α∼



1 − v2.

Si noti che questi risultati qualitativi sono in accordo con l’analisi generale della distribuzione angolare nel limite ultrarelatvistico, svolta in sezione 9.3. 308

Infine calcoliamo il rapporto tra l’intensit`a emessa nel piano dell’orbita, a ϑ =

π , e 2

quella emessa lungo il suo asse, a ϑ = 0. Dalla (10.69) si trova facilmente, dW ³ π ´ Wk 1 4 + 3v 2 = dΩ 2 = . W⊥ 8 (1 − v 2 )5/2 dW (0) dΩ Nel limite non relativistico si riottiene la (10.53), mentre per velocit`a ultrarelativistiche si ottiene un rapporto molto grande. 10.4.4

Luce di sincrotrone

La radiazione emessa da un ciclotrone relativistico viene chiamata radiazione (o luce) di sincrotrone, perch`e fu osservata per la prima volta in un sincrotrone di elettroni, presso la “General Electric Company” di Schenectady, a New York, nel 1947. Da allora le previsioni quantitative (10.61) e (10.69) sono state verificate sperimentalmente in diversi sincrotroni, e le distribuzioni angolari e in frequenza misurate sono in ottimo accordo con queste formule. Mentre negli acceleratori ad alte energie questa radiazione rappresenta un effetto dissipativo, nei sincrotroni dedicati essa viene prodotta ad arte, ed utilizzata per le ricerche nei campi della materia condensata, della biologia e della medicina, che necessitano di fotoni molto energetici. Uno dei pregi di questa radiazione consiste nel fatto che lo spettro emesso `e in generale molto ampio, vedi (10.65), potendo coprire le regioni del visibile, dell’ultravioletto e dei raggi X. Attraverso particolari dispositivi sperimentali, i “wigglers” o gli “ondulatori”, si possono infatti selezionare dallo spettro la particolare banda di frequenze richiesta per le ricerche specifiche che si intendono svolgere. Luce di sincrotrone viene prodotta anche in ambito astronomico, ad esempio dal pianeta Giove e dalla nebulosa Granchio. La radiazione proveniente da Giove, che `e avvolto da un campo magnetico intenso, con B ∼ 1gauss, viene emessa da elettroni con energie comprese circa tra 3M eV < ε < 50M eV , che compiono quindi orbite di ciclotrone con raggi che arrivano fino a qualche centinaio di metri. Per un valore tipico di ε ∼ 5M eV la (10.65) d`a la frequenza caratteristica ω ∼ 109 /s, corrispondente ad onde radio, e secondo la (10.64) la radiazione comprende armoniche fino all’ordine N ∼ 1.000, previsioni che sono in buon accordo con l’osservazione. La radiazione proveniente dalla nebulosa Granchio viene, invece, emessa da elettroni che raggiungono anche energie dell’ordine di 309

ε ∼ 104 GeV , in presenza di un campo magnetico B ∼ 10−4 gauss. Gli elettroni pi` u energetici emettono quindi radiazione con frequenze caratteristiche molto elevate, ω ∼ 1018 /s, che corrispondono all’estremo ultravioletto, e sono presenti le armoniche fino all’ordine ³ ε ´3 N∼ ∼ (2 · 107 )3 ∼ 1022 . m

10.5

Spettro di emissione di una corrente generica

In questa sezione vogliamo determinare la distribuzione spettrale della radiazione prodotta da una corrente macroscopica j µ generica, non composta necessariamente da particelle puntiformi. Distingueremo di nuovo quadricorrenti periodiche, e quadricorrenti aperiodiche. 10.5.1

Corrente periodica

2π , essa ammette uno sviluppo in serie di ω0 Fourier nella coordinata temporale, e una rappresentazione in trasformata di Fourier nelle

Se la corrente `e periodica, con periodo T =

tre coordinate spaziali, Z ∞ X 1 d3 p ei(N ω0 t−~p·~x) JNµ (~p). j (x) = 3/2 (2π) N =−∞ µ

Eseguendo le antitrasformate si ottengono i coefficiente di Fourier, Z Z 1 1 T µ dt JN (~p) = d3 x e−i(N ω0 t−~p·~x) j µ (x). 3/2 T 0 (2π)

(10.70)

(10.71)

Possiamo utilizzare lo sviluppo (10.70) per valutare il potenziale e il campo elettrico nella zona delle onde, secondo le (7.9), (7.11). I pesi spettrali possono poi essere determinati usando le formule fondamentali dell’analisi spettrale (10.6), (10.10). Come primo passo dobbiamo inserire la (10.70) nella (7.9), Z Z ∞ X 1 3 ~ A = d p d3 y ei N ω0 (t−r+~n·~y) e−i~p · ~y J~N (~p) 4πr (2π)3/2 N =−∞ Z Z ∞ X 1 3 = d p d3 y ei N ω0 (t−r) e−i(~p−N ω0~n)·~y J~N (~p). 4πr (2π)3/2 N =−∞ L’integrale in d3 y d`a luogo a una δ di Dirac tridimensionale, Z d3 y e−i(~p−N ω0~n)·~y = (2π)3 δ 3 (~p − N ω0~n), 310

la presenza della quale permette a sua volta di eseguire l’integrale in p~. Risulta, √ Z ∞ 2π X ~ A = d3 p ei N ω0 (t−r) δ 3 (~p − N ω0~n) J~N (~p) 2r N =−∞ √ ∞ 2π X i N ω0 (t−r) ~ = e JN (N ω0~n). 2r N =−∞ Dalla (7.11) si ottiene allora per il campo elettrico, Ã ! √ ∞ X i 2π ~ E(t) = n × ~n × N ω0 ei N ω0 (t−r) J~N (~k) , 2r N =−∞ dove abbiamo posto ~k = N ω0~n. Confrontando questa espressione con la (10.5), si vede che i coefficienti di Fourier del campo elettrico sono dati da, √ i 2π ~N = E N ω0 e−iN ω0 r ~n × (~n × J~N (~k)). 2r Inserendo questi coefficienti nella (10.10), si trova infine una semplice formula per i pesi spettrali,

¯ ¯2 dWN ¯ 2¯ ~ ~ = π(N ω0 ) ¯~n × JN (k)¯ . dΩ

(10.72)

Questa formula viene presentata spesso in modo leggermente diverso, sfruttando la conservazione della quadricorrente. Usando la rappresentazione (10.70) si ottiene infatti, Z ∞ ³ ´ X i 3 0 ~ ∂µ j (x) = d p N ω J (~ p ) − p ~ · J (~ p ) ei(N ω0 t−~p·~x) = 0, 0 N N 3/2 (2π) N =−∞ µ

che comporta l’identit`a, JN0 (~p) =

p~ · J~N (~p) . N ω0

Ponendo p~ = ~k = N ω0~n, si ottiene allora, JN0 (~k) = ~n · J~N (~k), e quindi,

¯2 ¯ ¯ ¯ ∗µ ~ ~ ¯~n × JN (k)¯ = |J~N (~k)|2 − |~n · J~N (~k)|2 = −JN (~k)JN µ (~k).

La (10.72) pu`o allora essere posta nella forma alternativa, dWN = −π(N ω0 )2 JN∗µ (~k)JN µ (~k). dΩ 311

(10.73)

L’antenna lineare. Esemplifichiamo l’uso della (10.72), riderivando la formula (7.26) per la distribuzione angolare della radiazione emessa da un’antenna lineare. Riprendiamo la corrente dell’antenna (7.22), µ µ ¶¶ ~j(t, ~x) = I δ(x) δ(y) sen ω L − |z| cos(ωt) ~u, 2

I=

I0 ¡ ¢, sen ωL 2

(10.74)

dove ~u `e il versore lungo l’asse z. Siccome questa corrente `e una corrente monocromatica, 2π con frequenza ω e periodo T = , i coefficienti J~N (~p) nella (10.71) sono tutti nulli, tranne ω quello corrispondente ad N = 1. L’antenna emette quindi solo sull’armonica fondamentale ω1 = ω, e si ha,

¯2 ¯ dW1 dW ¯ ¯ = = π ω 2 ¯~n × J~1 (~k)¯ . dΩ dΩ

(10.75)

Per valutare J~1 (~k) dobbiamo inserire la (10.74) nella (10.71), e porre p~ = ~k = ω ~n. Si ottiene, µ µ ¶¶ L dt e cos(ωt) d x e δ(x) δ(y) sen ω − |z| 2 0 µ µ ¶¶ Z L/2 I ~u L i ω cosϑ z = dz e sen ω − |z| 2(2π)3/2 −L/2 2 µ µ ¶¶ Z L/2 L I ~u = dz cos (ω cosϑ z) sen ω −z , (10.76) (2π)3/2 0 2 I ~u T (2π)3/2

J~1 (~k) =

Z

Z

T

−iωt

3

iω~ n·~ x

dove ϑ `e l’angolo tra l’asse z e ~n. L’integrale in z `e elementare, e porta a, µ µ ¶ ¶ ωL I ~u ωL ~ ~ J1 (k) = cos cosϑ − cos . (2π)3/2 ω sen2 ϑ 2 2 Inserendo questa espressione nella (10.75) e notando che |~n × ~u| = senϑ, si riottiene la (7.26). Particella singola. Nel caso di una particella singola la (10.72) si deve ridurre alla (10.40). Per verificare questo `e sufficiente determinare i coefficienti di Fourier (10.71), per le sole componenti spaziali della corrente, vedi (2.41), ~j(x) = e ~v (t) δ 3 (~x − ~y (t)).

(10.77)

Inserendo questa espressione nella (10.71), ed eseguendo l’integrale su ~x, si ottiene, e J~N (~p) = T

Z

T 0

1 dt (2π)3/2

Z 3

d xe

−i(N ω0 t−~ p·~ x)

e ~v δ (~x − ~y ) = T

312

Z

T

3

dt 0

1 e−i(N ω0 t−~p·~y) ~v . (2π)3/2

Ponendo p~ = ~k = N ω0~n, risulta allora, Z

e J~N (~k) = (2π)3/2 T

T

dt e−i N ω0 (t−~n·~y) ~v .

0

Inserendo questa formula nella (10.72) si riottiene la (10.40). 10.5.2

Corrente aperiodica

Nel caso di un sistema carico aperiodico la corrente ammette una rappresentazione in trasformata di Fourier in tutte e quattro le variabili, e possiamo scrivere, Z Z 1 µ j (x) = dω d3 p ei(ω t−~p·~x) J µ (ω, p~), (2π)2 dove, 1 J (ω, p~) = (2π)2 µ

(10.78)

Z d4 x e−i(ω t−~p·~x) j µ (x).

(10.79)

Procediamo come sopra, inserendo la (10.78) nella (7.9). Come prima l’integrale su ~y d`a luogo a una δ 3 di Dirac, che permette poi di eseguire l’integrale su p~. Si ottiene, Z Z Z 1 3 ~ ~ p~) A = d y dω d3 p ei ω(t−r+~n·~y) e−i~p · ~y J(ω, 2 4πr (2π) Z 1 ~ ω~n). = dω ei ω(t−r) J(ω, 2r Dalla (7.11) si ottiene allora per il campo elettrico, µ ¶ Z i i ω(t−r) ~ ~ E(t) = n × ~n × dω ω e J(k) , 2r dove la variabile k µ di J~ `e definita da, k 0 = ω, ~k = ω ~n. Confrontando questa formula con la (10.2), si individua la trasformata di Fourier temporale del campo elettrico, √ i 2π ~ ~ E(ω) = ω e−iω r ~n × (~n × J(k)). 2r Inserendo questa espressione nella (10.8), si trova per la distribuzione spettrale della radiazione,

¯2 ¯ d 2ε ¯ 2¯ ~ = π ω ¯~n × J(k)¯ . dω dΩ

(10.80)

~ p~), che per p~ = ~k = ω~n Sfruttando il fatto che ∂µ j µ = 0, la (10.78) d`a ω J 0 (ω, p~) = p~ · J(ω, d`a, ~ J 0 (k) = ~n · J(k). 313

Di conseguenza la (10.80) pu`o essere scritta anche come, d 2ε = −π ω 2 Jµ∗ (k)J µ (k). dω dΩ

(10.81)

Come prima `e immediato fare vedere che nel caso di una particella singola, la (10.80) si riduce alla (10.42). Inserendo la (10.77) nella (10.79), ed eseguendo gli stessi passaggi di cui sopra si arriva infatti a, 1 e ~ √ J(k) = (2π)3/2 2π

Z



dt e−i ω(t−~n·~y) ~v .

(10.82)

−∞

Sostituendo questa espressione nella (10.80), si riottiene in effetti la (10.42). Tuttavia, come gi`a notato nel paragrafo 10.3.1, l’integrale presente nella (10.82) in generale non converge. Nella procedura qu`ı adottata l’origine di questa divergenza `e evidente: la (10.82) rappresenta la trasformata di Fourier della distribuzione ~j(x), e come tale deve essere eseguita nel senso delle distribuzioni. Un modo per farlo consiste nell’introdurre nella (10.82) un’opportuna regolarizzazione, per esempio restringendo l’integrale in t tra −L ed L, come illustrato nel paragrafo 10.3.1, e nell’eseguire poi il limite per L → ∞, nel senso delle distribuzioni.

314

11

L’effetto Cerenkov

Nel 1934 il fisico russo P.A. Cerenkov studi`o il fenomeno della luminescenza emessa da certe soluzioni liquide, se irradiate con raggi γ provenienti da sorgenti radioattive. Nel corso degli esperimenti, durati fino al 1938, si accorse che i raggi γ causano una radiazione molto debole anche in solventi puri, come l’acqua e il benzolo, dando luogo a una luce blu, vale a dire radiazione nello spettro visibile. Da un’analisi approfondita delle caratteristiche della luce emessa si rese conto che questo effetto non poteva essere un fenomeno di luminescenza, come assunto inizialmente. La radiazione osservata era infatti caratterizzata da una polarizzazione lineare ben definita, e veniva emessa solo in avanti, lungo un cono di direzioni che formavano un ben determinato angolo con la direzione dei raggi γ, entrambe propriet`a non possedute dalla luminescenza. La radiazione osservata aveva inoltre carattere universale, nel senso che le sue caratteristiche erano indipendenti dalle specifiche propriet`a delle soluzioni usate, come la temperatura e la loro particolare composizione. Ci si aspettava allora che anche la spiegazione teorica dell’effetto dovesse avere carattere universale. Questa spiegazione fu data dai fisici russi I.E. Frank e I.M. Tamm nel 1937, i quali assumevano che la radiazione osservata da Cerenkov non fosse causata direttamente dai raggi γ, ma da elettroni ad alta velocit`a, prodotti dai raggi γ attraverso l’effetto Compton. Secondo la loro teoria questa radiazione viene generata da elettroni che si trovano in moto rettilineo uniforme in un mezzo dielettrico, con una velocit` a superiore alla velocit` a della luce nel mezzo. Ricordiamo che un mezzo con costante dielettrica reale ε ha indice di √ c rifrazione n = ε, e che la velocit`a della luce nel mezzo vale . Per n > 1 essa risulta n dunque minore di c. In questa sezione analizzeremo in dettaglio i campi prodotti da una particella in moto rettilineo uniforme in un mezzo, sia per velocit`a minori che per velocit`a maggiori della velocit`a della luce nel mezzo, e spiegheremo cos`ı l’origine e le propriet`a della “radiazione Cerenkov”. Aspetti macroscopici e microscopici. La spiegazione dell’effetto Cerenkov data da Frank e Tamm si basa sulle equazioni di Maxwell in un mezzo dielettrico, che forniscono una

315

descrizione macroscopica della dinamica del campo elettromagetico. Come `e noto, queste equazioni rappresentano un metodo semplice per tenere conto delle cariche di polarizzazione che si creano in un mezzo, a causa delle cariche “libere”. Il campo elettromagnetico totale risulta, infatti, dalla sovrapposizione del campo prodotto dalla particella nel vuoto, e da quello prodotto dalle cariche di polarizzazione. Siccome una particella in moto rettilineo uniforme “nel vuoto” non d`a luogo a nessun campo di radiazione, a livello microscopico la radiazione di Cerenkov deve dunque originare dalle cariche di polarizzazione. In effetti, quello che succede a livello microscopico `e che l’elettrone durante il suo passaggio nel mezzo deforma le molecole facendo loro acquistare un momento di dipolo elettrico, il quale scompare immediatamente dopo il passaggio dell’elettrone. Le cariche che compongono i momenti di dipolo sono cos`ı sottoposti a un’accelerazione quasi–istantanea, e diventano quindi sorgenti impulsive di onde elettromagnetiche elementari, che si manifestano come radiazione Cerenkov. Tuttavia, non `e immediato determinare il campo macroscopico, valutando esplicitamente la sovrapposizione coerente di queste infinite onde elementari “microscopiche”. Viceversa, le equazioni di Maxwell in un mezzo costituiscono uno strumento molto efficace per valutare il campo elettromagnetico prodotto a livello macroscopico dalla particella, e dalle cariche di polarizzazione da essa indotte. Per semplicit`a parleremo comunque di “campo prodotto dalla particella” nel mezzo, e di “energia irradiata dalla particella”.

11.1

Campo di una particella in moto rettilineo uniforme in un mezzo

Equazioni di Maxwell in un mezzo dielettrico. Consideriamo un mezzo isotropo e omogeneo, con permeabilit`a magnetica uguale a quella del vuoto, µ = 1, e con costante dielettrica ε > 1 e reale. In questo modo trascuriamo l’assorbimento del mezzo, ipotesi giustificata per frequenze lontane dalle frequenze di risonanza. Per il momento assumiamo anche che non vi sia dispersione, ovvero, che ε sia indipendente dalla frequenza, rinviando la trattazione del caso realistico di un mezzo dispersivo alla sezione 11.4. Anche l’indice di rifrazione, n=



316

ε,

(11.1)

risulta allora indipendente dalla frequenza. In un mezzo dielettrico con queste caratteristiche le equazioni di Maxwell (2.28)–(2.31) diventano, −

n2 c 1 c

~ ~ ∂E ~ ×B ~ = j, +∇ ∂t c ~ ∂B ~ ×E ~ = 0, +∇ ∂t ~ ·E ~ = ρ, ∇ n2 ~ ·B ~ = 0, ∇

(11.2) (11.3) (11.4) (11.5)

dove ρ indica la densit`a di carica, e abbiamo momentaneamente ripristinato la velocit`a della luce. Si noti che queste equazioni si possono ottenere dalle (2.28)–(2.31) effettuando le sostituzioni, ~ → n E, ~ E

~ →B ~ B

c→

c , n

ρ→

ρ , n

~ ~j → j . n

(11.6)

Le identit`a di Bianchi (11.3) e (11.5) sono rimaste immutate, e quindi possiamo risolverle nel modo standard, ~ ~ = −∇A ~ 0 − 1 ∂A , E c ∂t ~ ~ ~ B = ∇ × A,

(11.7) (11.8)

~ sono ancora definiti modulo le trasformazioni di gauge Aµ → Aµ +∂ µ Λ. e i potenziali A0 e A In questo caso `e conveniente effettuare il gauge–fixing di Lorentz adattato, n2 ∂A0 ~ ~ + ∇ · A = 0. c ∂t ` allora immediato vedere che le (11.2), (11.4) si riducono a, E Ã ! µ 2 2 ¶ ~ n ∂ ρ j 2n Aµ ≡ − ∇2 Aµ = , . c2 ∂t2 n2 c

(11.9)

In assenza di cariche libere, j µ = 0, nel mezzo il campo elettromagnetico si propaga quindi c con la velocit`a . n Consideriamo ora una particella che si muove di moto rettilineo uniforme, quindi con p velocit`a ~v e quadrivelocit`a uµ = (c, ~v )/ 1 − v 2 /c2 costanti. Allora da (6.58) segue, Z 0 ~j = ρ ~v , ρ = eu δ 4 (x − u s) ds = e δ 3 (~x − ~v t), (11.10) 317

ed `e sufficiente risolvere le (11.9) per µ = 0, 2n A0 =

ρ . n2

(11.11)

La parte spaziale del quadripotenziale `e, infatti, data semplicemente da, 2 ~ = n ~v A0 . A c

(11.12)

In seguito supporremo che la particella si muova lungo l’asse delle z, quindi con traiettoria, ~y (t) = (0, 0, vt). In questo caso `e conveniente introdurre coordinate cilindriche, ~x ↔ (z, r, ϕ), dove r e ϕ sono coordinate polari bidimensionali, nel piano ortogonale alla traiettoria della particella. In particolare r indica allora la distanza di ~x dall’asse z. Corrispondentemente useremo i versori ~uz , ~ur e ~uϕ .

11.2

Il campo per v <

c n

Supponiamo ora che la velocit`a della particella sia minore della velocit`a della luce nel c mezzo, v < . In questo caso la (11.11) pu`o essere risolta con lo stesso metodo usato nel n paragrafo 6.3.1 per risolvere l’analoga equazione nel vuoto, 2A0 = ρ.

(11.13)

In quel caso si aveva n = 1 e v < c. Per ottenere la soluzione della (11.11) `e sufficiente e c eseguire nella soluzione (6.63) della (11.13) le sostituzioni e → 2 , c → . La componente n n 0 della (6.63) si scrive, A0 =

e e u0 1 p q = 2 2 4π (ux) − x 4π (z − vt)2 + ¡1 −

v2 c2

¢

, r2

e la soluzione della (11.11) risulta allora, A0 =

e 1 p , 2 4πn (z − vt)2 + (1 − v 2 n2 )r2

318

(11.14)

dove abbiamo posto di nuovo c = 1. Per i campi elettrico e magnetico le (11.7), (11.8) danno allora, ~ = E

e (1 − v 2 n2 )(~x − ~v t) , 4πn2 ((z − vt)2 + (1 − v 2 n2 )r2 )3/2

(1 − v 2 n2 ) v r ~uϕ ~ = e B , 4π ((z − vt)2 + (1 − v 2 n2 )r2 )3/2 (11.15)

e il vettore di Poynting diventa, ~=E ~ ×B ~ = S

³ e ´2 (1 − v 2 n2 )2 v r [r ~u − (z − vt) ~u ] z r · = Sz ~uz + Sr ~ur . 4πn ((z − vt)2 + (1 − v 2 n2 )r2 )3

(11.16)

Vediamo ora quali sono le propriet`a del campo ottenuto. Come nel vuoto, il campo elettromagnetico non presenta singolarit`a al di fuori della traiettoria, perch´e per v < 1/n il denominatore nelle (11.15) si annulla solo per ~x = ~v t. Inoltre, dalla (11.16) si vede che non c’`e flusso radiale netto di energia, perch´e “dietro” la particella – per z < vt – esiste un flusso radiale uscente, Sr > 0, mentre “davanti” – per z > v t – esiste un flusso radiale entrante, Sr < 0, e i due si compensano. In particolare, se calcoliamo il flusso di energia totale attraverso un cilindro concentrico con la traiettoria, di raggio r e basi situate in z1 e z2 , troviamo, Z

z2

∆ε = 2πr z1

Z



2πr dz Sr dt = v −∞

Z

Z

z2



dz z1

Sr dl = 0,

(11.17)

−∞

perch´e Sr `e una funzione antisimmetrica della variabile l = z − vt. 11.2.1

Analisi in frequenza

In vista del confronto con il caso v > 1/n `e utile eseguire anche una “analisi spettrale” del campo. In realt`a questa analisi ha senso se siamo in presenza di campi di radiazione, mentre il campo di una particella con velocit`a costante minore di quella della luce, a 1 grandi distanze decade come , vedi (11.15), e non costituisce quindi un campo di |~x|2 radiazione. Eseguiamo comunque la trasformata di Fourier temporale della (11.14), e A (ω) = √ 2π 4πn2 0

Z

∞ −∞

e−iωt p dt. (z − vt)2 + (1 − v 2 n2 )r2

(11.18)

Con semplici passaggi si ottiene, 0

A (ω) =

e (2π)3/2 n2 v

µ√ e

−i ωz/v

319

K

¶ 1 − v 2 n2 ωr , v

(11.19)

dove K(x) `e la funzione di Bessel modificata del secondo tipo di ordine 0, indicata comunemente con K0 (x), 1 K(x) = 2

Z

∞ −∞

ei x s √ ds = s2 + 1

Z



cos(x senh β) dβ. 0

La seconda rappresentazione si ottiene con il cambiamento di variabile, s = senh β. La funzione K(x). Per quello che segue `e utile dare un’altra rappresentazione ancora di K, che si ottiene usando l’analisi complessa. Si noti che K(−x) = K(x), per cui di seguito supporremo x > 0. Consideriamo la funzione di variabile complessa, f (z) = √

ei x z , z2 + 1

che `e analitica nel semipiano superiore, esclusa la semiretta z = i u con u ∈ [1, ∞] dove possiede un taglio. Allora si annulla l’integrale di linea, I f (z) dz = 0,

(11.20)

γ

in cui γ `e una curva chiusa composta 1) dall’asse reale, 2) da due quarti di circonferenza giacenti nel semipiano superiore e centrati nell’origine, con raggio R e aperture angolari rispettivamente 0 < ϕ < π/2 e π/2 < ϕ < π, 3) dalle due semirette z = ±ε + i u, con u ∈ [1, ∞], e infine, 4) da una semicirconferenza centrata in z = i e di raggio ε, rivolta verso il basso. Nel limite per R → ∞ e per ε → 0, gli integrali sui tre archi di circonferenza vanno a zero se x > 0, e nella (11.20) sopravvivono allora solo gli integrali lungo l’asse reale e lungo le due semirette. Risulta allora, Z ∞ Z ∞ ei x s e−x u √ √ ds − 2 du = 0. u2 − 1 s2 + 1 −∞ 1 Si conclude quindi che per x > 0 la funzione K pu`o essere scritta anche come, Z ∞ Z ∞ e−x u √ K(x) = du = e−x cosh β dβ, 2 u −1 1 0

(11.21)

dove abbiamo posto u = coshβ. Andamenti asintotici di K(x). La rappresentazione (11.21) `e in particolare conveniente per determinare gli andamenti asintotici di K, per x grandi e piccoli. Per grandi x usiamo il metodo del punto sella. Per x → ∞, nell’integrando in (11.21) contano i valori di β per cui cosh β `e minimo, cio`e, i valori di β vicino allo zero. Espandendo, cosh β = 1 +

1 2 β + o(β 4 ), 2

320

si trova allora,

Z



−x

K(x) = e

x

e−[ 2 β

2 +x o(β 4 )]

dβ.

0

√ Riscalando β → β/ x, risulta cos`ı, r µ µ ¶¶ Z e−x ∞ −[ 1 β 2 +o(β 4 )/x] π −x 1 K(x) = √ e 2 dβ = e 1+o . 2x x x 0

(11.22)

Per x → 0 la funzione K(x) diverge invece. Per determinare il tipo di divergenza, separiamo dall’integrale (11.21) la parte convergente. Per fare questo riscaliamo la variabile d’integrazione, u → u/x, e riscriviamo l’integrale come, Z ∞ Z 1 Z ∞ e−u e−u e−u √ √ √ K(x) = du = du + du. u2 − x 2 u2 − x 2 u2 − x 2 x x 1

(11.23)

L’ultimo integrale converge per x → 0, ed `e sufficiente valutare il penultimo, Z 1 Z 1 Z 1 −u e−u 1 e −1 √ √ √ du = du + du. u2 − x 2 u 2 − x2 u2 − x 2 x x x Di nuovo, per x → 0 l’ultimo integrale converge, perch´e la funzione (e−u − 1)/u `e regolare nell’intervallo [0, 1], ed `e sufficiente calcolare, µ ¶ Z 1 ³x´ 1 1 √ du = arccosh = − ln + o(x). x 2 u2 − x 2 x Per x che va a zero K diverge quindi logaritmicamente, K(x) = − ln x + C + o(x),

(11.24)

dove C `e una costante. Un’equazione differenziale per K(x). Le funzioni speciali vengono spesso anche definite attraverso le equazioni differenziali che esse soddisfano. L’equazione definente per K `e, per x 6= 0, K 00 +

1 0 K − K = 0. x

Verifichiamo che essa `e soddisfatta dalla (11.21), Z ∞µ 1 0 u2 00 √ K + K = − x u2 − 1 1 Z ∞µ u2 √ = − u2 − 1 1

¶ 1 u √ e−ux du x u2 − 1 √ ¶ 1 d u2 − 1 −ux e du. x du

Con un’integrazione per parti si ottiene allora di nuovo l’integrale (11.21). 321

(11.25)

In realt`a l’equazione differenziale lineare (11.25), essendo del secondo ordine ha due soluzioni indipendenti. Una `e K(x), e l’altra `e data dalla funzione, Z e K(x) =

1 −1

exu √ du = 1 − u2

Z

π

ex cosϑ dϑ,

(11.26)

0

che `e legata alla funzione di Bessel modificata del primo tipo di ordine 0, I0 (x), dalla e e e relazione K(x) = π I0 (x). Anch’essa `e pari, K(−x) = K(x), e i suoi andamenti asintotici per x > 0 sono, r e K(x) =

µ ¶¶ µ π x 1 e 1+o , 2x x

e K(x) = π + o(x),

(11.27)

da confrontare con le (11.22), (11.24). Si noti in particolare che, al contrario di K(x), la e funzione K(x), divergendo esponenzialmente per |x| → ∞, non costituisce una distribuzione temperata. Un’onda evanescente. Torniamo ora alla (11.19). Vediamo che A0 (ω) dipende da z attraverso il termine di “onda piana” e−ikz z , con vettore d’onda, kz =

ω . v

Questo termine descrive quindi un’onda che si propaga in direzione z con la velocit` a della ω particella, in quanto vz ≡ = v. Tuttavia, a grandi distanze dalla traiettoria, ovvero kz per grandi r, a causa dell’andamento asintotico (11.22), A0 (ω) si comporta come, ω√ −ik z − 1 − v 2 n2 r C z v A0 (ω) ∼ √ e , r

(11.28)

1 dove C `e una costante indipendente da ~x. Vediamo che A0 (ω) esibisce un fattore √ , r tipico per un’onda cilindrica 45 , che in questo caso viene per`o soppiantato dal fattore di ¡ √ ¢ decrescita esponenziale exp − ωv 1 − v 2 n2 r , che rappresenta una “onda evanescente”. Per rappresentare una vera “onda” questo esponenziale dovrebbe essere sostituito da un fattore oscillante del tipo exp (ikr r). Ritroviamo cos`ı che una particella in moto rettilineo c uniforme, con velocit`a costante minore di , non irradia onde elettromagnetiche. n √ Come spiegheremo in sezione 11.5, per le onde a simmetria cilindrica la presenza del fattore 1/ r `e richiesta dalla conservazione dell’energia. Per le onde sferiche l’andamento analogo, implicato sempre dalla conservazione dell’energia, `e invece 1/r. 45

322

11.3

Il campo per v >

c n

c , la soluzione della (11.11) non pu`o essere ottenuta con semplici sostituzioni dalla n (6.63), ma possiamo comunque applicare il metodo usato nel paragrafo 6.3.1. In seguito Se v >

porremo di nuovo c = 1. Introduciamo una funzione di Green adattata Gn soddisfacente, 2n Gn = δ 4 (x) = δ(t)δ 3 (x). La soluzione di questa equazione pu`o essere ottenuta dalla funzione di Green (6.43), ¡ ¢ t soddisfacente 2G = δ 4 (x), attraverso la sostituzione t → . Ricordando che δ nt = n n δ(t), si ottiene cos`ı, Gn =

1 H(t) δ(x2n ), 2πn

x2n ≡

t2 − |~x|2 . 2 n

In seguito useremo anche la notazione, a0 b0 − ~a · ~b. n2

(a b)n ≡ La soluzione della (11.11) `e allora data da,

1 1 A0 = 2 Gn ∗ ρ = 2 n n

Z Gn (x − y)ρ(y) d4 y.

Sostituendo la (11.10), con passaggi standard si ottiene, µ ¶ Z e u0 e u0 H(t − u0 s+ ) H(t − u0 s− ) 0 0 A = H(t − u s) δ(f (s)) ds = + , 2πn3 2πn3 |f 0 (s+ )| |f 0 (s− )|

(11.29)

purch`e la forma quadratica, f (s) ≡ u2n s2 − 2s(ux)n + x2n , abbia due zeri reali s± . In caso contrario A0 `e zero. Il valore dell’integrale nella (11.29) dipende quindi 1) dalla presenza di zeri reali di f (s), e 2) dal segno di t − u0 s± . Gli zeri sono dati da, s± =

(ux)n ±

e, |f 0 (s± )| = 2

p (ux)2n − u2n x2n , u2n

u2n =

1 − v 2 n2 < 0, (1 − v 2 )n2

p u0 p (ux)2n − u2n x2n = 2 (z − vt)2 − (v 2 n2 − 1)r2 . n 323

Vediamo che esistono zeri reali solo nella regione, (z − vt)2 > (v 2 n2 − 1)r2

r2 1 < , (z − vt)2 + r2 v 2 n2



(11.30)

che corrisponde a un cono doppio centrato nella posizione della particella, e con asse la sua traiettoria, di apertura angolare, sen α =

1 . vn

(11.31)

Al di fuori di questo cono doppio il campo `e quindi nullo. Stando all’interno del cono studiamo ora il segno di t − u0 s± . Da un semplice calcolo risulta, t − u0 s ± = −

n v 2 n2 − 1

³ v n (z − vt) ∓

p

´ (z − vt)2 − (v 2 n2 − 1)r2 .

Siccome il termine (v 2 n2 − 1) `e positivo, per z − vt > 0 si ha t − u0 s± < 0, e il campo `e nullo, mentre per, z − vt < 0,

(11.32)

si ha t − u0 s± > 0, e nella (11.29) contribuiscono tutti e due i termini. Concludiamo quindi che ad ogni istante il campo `e diverso da zero solo all’interno del cono centrato nella particella, coassiale conµla traiettoria e rivolto in direzione opposta al moto, di ¶ 1 apertura angolare α = arcsen . vn Singolarit`a del campo. Tenendo conto delle (11.30) e (11.32), dalla (11.29) risulta il potenziale,

√ £ ¤ 2 n2 − 1 2 H −(z − vt) − r v e p A0 = . (11.33) 4πn2 (z − vt)2 − (v 2 n2 − 1)r2 c Confrontando con il potenziale (11.14) del caso v < , si vede che le due espressioni n esibiscono formalmente le stesse dipendenze funzionali da ~x e t. Nella (11.33) compare in pi` u un fattore due, ma in compenso il campo `e nullo all’esterno del cono “all’indietro” di apertura α. Inoltre, sul bordo di questo cono, ovvero per, √ z = vt − r v 2 n2 − 1,

(11.34)

A0 diverge. Vedremo tra poco che questa singolarit`a non `e fisica, in quanto dovuta alla nostra schematizzazione di un mezzo non dispersivo. Siccome le (11.14) e (11.33) hanno la ~ eB ~ e il vettore di Poynting stessa dipendenza funzionale, a parte il fattore due i campi E 324

~ `e sono ancora dati dalle (11.15) e (11.16). Ma questa volta la componente radiale di S diversa da zero – e positiva – solo per z < vt (all’interno del cono), mentre `e nulla per z > vt. Ci aspettiamo dunque un flusso radiale uscente netto di energia elettromagnetica. Si noti come la forma del potenziale (11.33) sia analoga al fronte d’onda sonoro conico, che si crea quando un aereo viaggia con velocit`a supersonica, il cosiddetto “cono di Mach”. 11.3.1

Il campo nella zona delle onde e l’angolo di Cerenkov

Per indagare la presenza di radiazione elettromagnetica, eseguiamo di nuovo la trasformata di Fourier temporale di A0 . Per via della presenza della funzione di Heaviside in (11.33), ora abbiamo, e A (ω) = √ 2π 2πn2

Z



0

1 v

(z+r



v 2 n2 −1)

e−iωt

p

(z − vt)2 − (v 2 n2 − 1)r2

dt.

Traslando e riscalando la variabile t si arriva a, 0

A (ω) =

µ√

e

−i ωz/v

(2π)3/2 n2 v

e

L

¶ v 2 n2 − 1 ωr , v

dove la funzione complessa L(x) `e data da, Z ∞ −i x u Z ∞ e √ L(x) = du = e−i x cosh β dβ, 2−1 u 1 0

(11.35)

(11.36)

(2)

ed `e legata alla funzione di Haenkel di ordine zero H0 (x), dalla relazione L(x) = (2) π H (x). 2i 0

La seconda espressione nella (11.36) `e stata ottenuta attraverso il cambia-

mento di variabile, u = cosh β. Confrontando la (11.35) con la (11.19) vediamo che le due espressioni di A0 (ω) costituiscono una la continuazione analitica dell’altra, dalla regione 1 1 v < , alla regione v > . Formalmente vale infatti, vedi (11.21), n n L(x) = K(i x). Propriet` a della funzione L(x). A partire dalla (11.36), con le stesse tecniche del paragrafo 11.2.1 si possono derivare le propriet`a principali della funzione L(x). Notiamo che vale L∗ (x) = L(−x), condizione imposta dalla realt`a di A0 (t, ~x), sicch´e `e sufficiente limitarsi al semiasse x > 0. In questo caso si ottengono gli andamenti asintotici, r µ µ ¶¶ π −i(x+π/4) 1 L(x) = e 1+o , L(x) = − ln x + C + o(x), (11.37) 2x x 325

da confrontare con le (11.22), (11.24). Separando L in parte reale e parte immaginaria, L(x) = L1 (x) + iL2 (x),

L1 (−x) = L1 (x),

L2 (−x) = −L2 (x),

(11.38)

si vede quindi che per x → ∞ entrambe queste funzioni hanno un andamento oscillatorio, mentre per x → 0 solo L1 (x) esibisce una divergenza logaritmica, e L2 (x) `e regolare. L’equazione differenziale soddisfatta da L `e, invece, L00 +

1 0 L + L = 0, x

(11.39)

da confrontare con la (11.25). Siccome anche questa equazione `e reale, L1 ed L2 la soddisfano separatamente, e costituiscono quindi un insieme completo di soluzioni. La particolare combinazione delle due soluzioni che compare nella (11.35) rappresenta un’onda uscente in direzione radiale, vedi (11.40), la presenza della quale `e dettata dalla causalit`a. L’altra combinazione indipendente, la complessa coniugata L∗ = L1 − iL2 , corrisponderebbe invece a un’onda entrante. L’angolo di Cerenkov. Con l’aiuto della (11.37), nella zona delle onde, ovvero, per grandi r, la (11.35) assume la forma, A0 (ω) =

−iπ/4

e e √ · 2 2 2 4πn (v n − 1)1/4 v ω r

´ √ ω³ −i z + v 2 n2 − 1 r e v

C = √ e−i (kz z + kr r) , r

(11.40)

(11.41)

dove C `e una costante indipendente dalle coordinate, e abbiamo trascurato termini di ordine o(1/r3/2 ). Al contrario della (11.28) questa espressione rappresenta un’onda (cilindrica) vera e propria, con vettore d’onda ~k dato da, kz =

ω , v

kr =

ω√ 2 2 v n − 1, v

kϕ = 0.

La sua velocit`a di propagazione `e allora data da, 1 ω ω = , =p n kr2 + kz2 |~k| che `e la velocit`a della luce nel mezzo. La direzione di propagazione dell’onda `e invece individuata dall’angolo ϑC che ~k forma con la direzione del moto della particella, l’angolo 326

di Cerenkov, cos ϑC =

kz 1 = . vn |~k|

(11.42)

Tale angolo `e ben definito fino a quando risulta soddisfatta la condizione di Cerenkov 1 v > . Le direzioni di emissione giacciono quindi su un cono “in avanti”, coassiale con n la traiettoria della particella e di apertura ϑC , che viene chiamato cono di Cerenkov. L’angolo di Cerenkov `e legato all’angolo α di (11.31) dalla relazione di complementari`a, ϑC =

π − α. 2

La direzione della radiazione coincide, inoltre, con la direzione del vettore di Poynting sul bordo del cono in cui il campo `e diverso da zero. Valutando il numeratore della (11.16) √ ~ k ~k. In realt`a, come anticipato per z = vt − r v 2 n2 − 1, si vede infatti che risulta S ~ diverge, vedi sezione 11.4. sopra, sul bordo di questo cono il modulo di S Nell’acqua, che alle frequenze visibili ha un indice di rifrazione n = 34 , si ha emissione di radiazione Cerenkov se v > 34 , e quando v varia tra

3 4

e 1, l’angolo di emissione varia

tra ϑC = 0 e ϑC = arccos 43 = 41.4o .

11.4

Mezzi dispersivi

Molti mezzi dielettrici hanno un indice di rifrazione che nello spettro visibile `e praticamente costante, ma nei mezzi reali esso `e in generale una funzione della frequenza, n(ω). Si dice che il mezzo `e dispersivo. L’andamento della funzione n(ω) dipende molto dalle propriet`a atomiche del mezzo, in particolare dalla presenza di frequenze di risonanza. Le sue caratteristiche generali sono comunque,   n(ω) < 1, 

per ω > ωm , (11.43)

limω→∞ n(ω) = 1,

dove ωm `e un valore limite, che `e vicino alla frequenza di risonanza pi` u elevata. Per grandi ω si ha in particolare l’andamento asintotico n(ω) ≈ 1 − ωp2 /ω 2 , dove ωp `e la “frequenza di plasma” del mezzo. La banda di frequenze in cui n(ω) < 1 `e quindi limitata. Equazioni di Maxwell in un mezzo dispersivo. In un mezzo dispersivo la dinamica del campo elettromagnetico non `e pi` u descritta dalle (11.2)–(11.5), ovvero, dalle (11.9), ma 327

dalle “trasformate di Fourier temporali” di queste ultime, µ ¶ ³ ´ ρ(ω) ~ 2 2 2 µ − n (ω) ω + ∇ A (ω) = , j(ω) , n2 (ω)

(11.44)

dove ρ(ω) e ~j(ω) indicano rispettivamente le trasformate di Fourier temporali di ρ(x) e ~j(x). In caso di dispersione il potenziale vettore `e allora definito come l’antitrasformata, 1 A (x) ≡ √ 2π µ

Z



eiωt Aµ (ω) dt,

(11.45)

−∞

dove le Aµ (ω) risolvono, per definizione, le (11.47). In particolare Aµ (x) non soddisfa quindi pi` u un’equazione differenziale locale, come la (11.9). Il campo per un moto rettilineo uniforme. Per il moto rettilineo uniforme `e di nuovo sufficiente determinare la componente µ = 0 del quadripotenziale, perch´e dalla (11.10) segue che ~j(ω) = ρ(ω) ~v , e la (11.44) implica allora che, ~ A(ω) = n2 (ω)A0 (ω) ~v .

(11.46)

Eseguendo la trasformata di Fourier della (11.10) si ottiene, e ρ(ω) = √ 2π

Z



e−iωt δ(z − vt) δ 2 (~r) dt = √

−∞

e e−iωz/v δ 2 (~r), 2π v

e la componente µ = 0 della (11.44) diventa allora, ¡

¢ n2 (ω) ω 2 + ∇2 A0 (ω) = − √

e e−iωz/v δ 2 (~r). 2π v n2 (ω)

(11.47)

Ci siamo quindi ricondotti alla soluzione di questa equazione differenziale alle derivate parziali. In realt`a, ripercorrendo la procedura della sezione precedente, in particolare considerando la trasformata di Fourier temporale della (11.11), non `e difficile rendersi conto che la (11.47) `e risolta dalle (11.19), (11.35), rispettivamente per i valori di ω per cui n(ω) <

1 v

e n(ω) > v1 , purch´e si effettui nelle (11.19), (11.35) la sostituzione n → n(ω).

Per verificarlo esplicitamente ricordiamo che in coordinate cilindriche il laplaciano si scrive, ∇2 = ∂z2 + ∇2r ,

∇2r ≡ ∂r2 +

1 1 ∂r + 2 ∂ϕ2 , r r

e poniamo, A0 (ω) =

e (2π)3/2 v

n2 (ω) 328

e−i ωz/v I(ω, r),

(11.48)

dove assumiamo che I(ω, r) non dipenda da z e ϕ. La (11.47) si riduce allora a, µ ¶ ¢ 1 ω2 ¡ 2 2 2 ∂r + ∂r + 2 n (ω)v − 1 I(ω, r) = −2πδ 2 (~r). (11.49) r v Notando che per x 6= 0 le funzioni K e L soddisfano le equazioni differenziali (11.25), (11.39), vediamo che per r 6= 0 la (11.49) `e soddisfatta se poniamo, rispettivamente per e n(ω) > v1 , Ãp ! 1 − v 2 n2 (ω) I(ω, r) = K ωr , v

n(ω) <

1 v

Ãp I(ω, r) = L

! v 2 n2 (ω) − 1 ωr , v

(11.50)

in accordo con le (11.19), (11.35). Per rivelare, invece, la presenza della δ 2 (~r) nella (11.49), occorre ricordare che in x = 0 le funzioni L e K esibiscono le singolarit`a logaritmiche (11.24) e (11.37), sicch´e nelle vicinanze di r = 0 I(ω, r) si comporta come, I(ω, r) = − ln r + a + o(r), dove a `e una costante indipendente da r. Siccome la funzione di Green del laplaciano bidimensionale `e il logaritmo, vedi problema 6.4, ∇2r (ln r) = 2π δ 2 (~r), la parte singolare in r = 0 di ∇2r I(ω, r) risulta proprio, ¡

¢ ∇2r I(ω, r) sing = ∇2r (− ln r) = −2π δ 2 (~r).

Si conclude quindi che la I(ω, r) data in (11.50) soddisfa la (11.49) nel senso delle distribuzioni. Unicit`a della soluzione. Discutiamo brevemente l’unicit`a della soluzione (11.50), facendo vedere che l’equazione omogenea associata alla (11.49) non ammette soluzioni “fisi1 che”. Per n(ω) < questa equazione coincide con la (11.25), che ha come unica soluzione v e K, in quanto solo essa in x = 0 `e regolare, vedi (11.27). 46 Tuttavia, questa funzione diverge esponenzialmente per x → ∞, e quindi non `e accettabile come soluzione fisica. 1 1 Per n(ω) < la soluzione `e quindi unica. Per n(ω) > invece, l’equazione omogenea v v e non costituisce una “distribuzione temperata”, ovvero un elemento di S 0 , per In realt`a la funzione K via della divergenza esponenziale per x → ∞. Essa rappresenta, tuttavia, una “distribuzione”, ovvero un elemento di D0 , e come tale soddisfa la (11.25). 46

329

associata alla (11.49) `e data dalla (11.39), e l’unica soluzione di questa equazione `e la funzione L2 , che `e regolare in x = 0 e costituisce in effetti una distribuzione temperata, vedi (11.37), (11.38). Dato che A0 (t, ~x) `e reale, la (11.48) impone che I ∗ (ω, r) = I(−ω, r). 1 Siccome si ha L2 (−x) = −L2 (x), per n(ω) > la soluzione generale della (11.49) `e allora v data da, tralasciando gli argomenti, ³ a´ a I = L + a i L2 = 1 + L − L∗ , 2 2 dove a `e una costante reale arbitraria. Tuttavia, dall’andamento asintotico (11.37) si vede che L rappresenta un’onda uscente radialmente, mentre L∗ rappresenta un’onda entrante radialmente dall’infinito. La causalit`a impone allora la scelta a = 0, e la soluzione fisica `e di nuovo unica. Dispersione, fronti d’onda e singolarit`a. Riassumendo possiamo dire che in presenza di un mezzo dispersivo, il potenziale scalare di una particella in moto rettilineo uniforme `e dato da, vedi (11.45), (11.48) e (11.50), e A (t, ~x) = (2π)2 v

Z

0

dove,



e

−i

−∞

ω (z − v t) I(ω, r) v dω, n2 (ω)

¶  µ√ 2 2 1−v n (ω)   ω r , per n(ω) < v1 , K v µ√ ¶ I(ω, r) =  v 2 n2 (ω)−1  L ω r , per n(ω) > v1 . v

(11.51)

(11.52)

~ usando la (11.46), In modo analogo si determina l’espressione per A, ~ ~x) = e ~uz A(t, (2π)2

Z



e

−i

ω (z − v t) v I(ω, r) dω.

−∞

Per velocit`a piccole, ovvero, per v <

1 n(ω)

∀ ω, la (11.51) si riduce alla (11.14), che

costituisce un potenziale regolare per qualsiasi ~x 6= ~v t. Per un mezzo non dispersivo (n 1 costante), e v > , la (11.51) si riduce invece alla (11.33), e si crea un fronte d’onda n √ singolare per z − vt = −r v 2 n2 − 1. Illustriamo brevemente come questa singolarit`a emerge dalla rappresentazione integrale (11.51). In questo caso si ha I = L per ogni ω, e per grandi valori di ω la (11.37) fornisce l’andamento asintotico oscillante, ω r√ 2 2 −i v n −1 1 v I(ω, r) ∼ p e . |ω| 330

(11.53)

√ Si vede allora che per z − vt = −r v 2 n2 − 1, nella (11.51) per grandi ω i due fattori oscillanti si compensano tra di loro, e l’integrale in ω diverge: sul fronte d’onda A0 (t, ~x) `e quindi infinito. 1 solo per un insieme limitato di frequenze – come succede in un n(ω) qualsiasi mezzo reale, vedi le (11.43) – allora per ω sufficientemente grande si ha I = K. Viceversa, se v >

In questo caso l’andamento asintotico (11.53) `e sostituito da, vedi (11.22), |ω| r √ − 1 − v 2 n2 1 v I(ω, r) ∼ p e , |ω| e l’integrale nella (11.51) converge allora per ogni ~x 6= ~v t. In un mezzo reale A0 (t, ~x) `e dunque una funzione regolare in tutto lo spazio, qualsiasi sia la velocit` a della particella, e ~ ~x). non compare nessun fronte d’onda singolare. Risultati identici si ottengono per A(t, Per quello che segue sar`a comunque sufficiente conoscere esplicitamente le funzioni spettrali A0 (ω), date in (11.48).

11.5

Perdita di energia ed emissione di fotoni

Stabilita la presenza di radiazione, in questa sezione quantifichiamo l’energia irradiata dalla particella durante il suo passaggio nel mezzo. Per il carattere stazionario del fenomeno cercheremo l’energia emessa per unit`a di frequenza e per unit`a di spazio percorso, d 2ε . dz dω Prima di passare alla valutazione esplicita di questa grandezza a partire dai campi derivati nella sezione precedente, presentiamo una derivazione euristica. 11.5.1

Un argomento euristico

Partiamo dalla formula generale dell’analisi spettrale della radiazione emessa da una particella in moto aperiodico (10.42), e2 ω 2 d 2ε = dω dΩ 16 π 3

¯ Z ¯ ¯ ~n × ¯



−i ω(t−~ n·~ y)

e −∞

¯2 ¯ ~v dt ¯¯ .

(11.54)

Ricordiamo che questa formula `e valida nel vuoto, con indice di rifrazione uguale a 1, e per v < 1. Se la particella non `e accelerata risulta ovviamento 331

d 2ε dω dΩ

= 0.

L’espressione (11.54) si riferisce all’energia emessa nell’unit`a di frequenza, lungo tutta la traiettoria. Se un moto `e illimitato e l’accelerazione ha una durata infinita, allora questa grandezza in generale `e divergente. Per ottenere un valore finito – eventualmente nullo – consideriamo l’energia emessa durante un tempo finito, diciamo tra gli istanti −T e T . Per fare questo dobbiamo limitare l’integrale temporale che compare nella (11.54) tra gli estremi −T e T . Per determinare l’energia media emessa nell’unit`a di tempo dobbiamo successivamente dividere per 2T , e prendere il limite per T → ∞. Infine, dividendo il risultato cos`ı ottenuto per v, otteniamo un’espressione per l’energia emessa nell’unit`a di spazio percorso, ¯ ¯2 Z T ¯ d 3ε e2 ω 2 1 ¯¯ −i ω(t−~ n·~ y) ¯ . = lim ~ n × e ~ v dt ¯ ¯ dz dω dΩ 16 π 3 v T →∞ 2T −T

(11.55)

Se ~v `e costante abbiamo ~y = ~v t, e svolgendo i calcoli si ottiene, 1 2T

¯ Z ¯ ¯ ~n × ¯

T

−i ω(t−~ n·~ y)

e −T

¯2 ¯ ¡ ¢ sen2 ((1 − ~n · ~v ) ω T ) . ~v dt ¯¯ = 2 v 2 − (~n · ~v )2 · (1 − ~n · ~v )2 ω 2 T

(11.56)

Per eseguire il limite per T → ∞ `e sufficiente notare che si ha il limite in S 0 , sen2 (T x) = π δ(x), T →∞ T x2 lim

limite che si verifica facilmente applicando ambo i membri a una funzione di test. Usando questa relazione il limite della (11.56) diventa, 1 lim T →∞ 2T

¯ Z ¯ ¯ ~n × ¯

T −T

¯2 ¯ ¡ ¢ e−i ω(t−~n·~y) ~v dt ¯¯ = 2π v 2 − (~n · ~v )2 δ((1 − ~n · ~v ) ω) ¢ 2π ¡ 2 = v − 1 δ (1 − ~n · ~v ) . (11.57) ω

Ripristinando la velocit`a della luce e introducendo l’angolo ϑ tra ~v e la direzione di emissione ~n, la (11.55) diventa allora, e2 ω d 3ε = 2 dz dω dΩ 8π v c

µ

¶ ³ ´ v v2 − 1 δ 1 − cosϑ . c2 c

(11.58)

Per v < c l’argomento della δ non si annulla per nessun valore di ϑ e quindi non si ha emissione di energia, come conviene a una particella che si muove di moto rettilineo uniforme nel vuoto.

332

Continuazione analitica. La formula appena scritta, valida nel vuoto, ammette una ` infatti, sufficiente continuazione analitica naturale quando si `e in presenza di un mezzo. E, effettuare nella (11.58) le sostituzioni (11.6), per ottenere (n ≡ n(ω)) 47 , µ 2 2 ¶ ³ ´ d 3ε e2 ω v n vn = 2 −1 δ 1− cosϑ . (11.59) dz dω dΩ 8π v n c c2 c c Si vede che per v > esiste ora un cono di direzioni di emissione, formanti con la velocit`a n della particella un’angolo ϑ determinato da, cosϑ =

c , vn

angolo che coincide in effetti con l’angolo di Cerenkov (11.42). Grazie alla presenza della δ `e immediato effettuare l’integrale sugli angoli della (11.59). Siccome abbiamo, Z ³ Z 1 ³ ´ ´ vn vn 2π c δ 1− δ 1− cosϑ dΩ = 2π cosϑ dcosϑ = H(v n − c), c c vn −1 si ottiene, d 2ε e2 ω = dz dω 4πc2

µ

c2 1− 2 2 v n

¶ ,

se v >

c , n

(11.60)

c . La formula (11.60) `e stata derivata da Frank e Tamm nel 1937, in n spiegazione dell’effetto Cerenkov. Torneremo al suo significato nel prossimo paragrafo. e

d 2ε dz dω

11.5.2

= 0, se v <

La formula di Frank e Tamm

L’argomento del paragrafo precedente ha evidentemente carattere euristico e pu`o risultare pi´ u o meno convincente; esso `e comunque interessante per via degli strumenti che abbiamo utilizzato. In questo paragrafo daremo, invece, una derivazione della formula di Frank e Tamm a partire dai “principi primi”, ovvero a partire dall’analisi asintotica dei campi, svolta nella sezione precedente. Consideriamo allora l’energia totale ∆ε che la particella emette attraverso un cilindro coassiale con la traiettoria, di raggio r e lunghezza ∆z = z2 −z1 , durante l’intero percorso. Dai risultati della sezione precedente sappiamo che i campi dipendono da t e z solo attraverso la combinazione z − vt, vedi (11.51), e ∆ε `e quindi indipendente da z1 e z2 , e dipende solo da ∆z. Risulta allora, Z ∞³ Z ´ ~ ~ ∆ε = (2πr ∆z) E × B · ~ur dt = (2πr ∆z) −∞ 47



³

´ ~ ∗ (ω) × B(ω) ~ E · ~ur dω,

−∞

Non si confonda l’indice di rifrazione n con il modulo del versore ~n, che vale 1.

333

dove abbiamo usato il teorema di Parseval. Come vedremo tra poco, frequenze positive e negative contribuiscono in ugual maniera, e quindi l’energia emessa per unit`a di spazio percorso e per unit`a di frequenza `e data da, ³ ´ d 2ε ~ ∗ (ω) × B(ω) ~ = 4πr E · ~ur . dz dω

(11.61)

Per calcolare l’energia “emessa” dobbiamo prendere il limite per r → ∞. Vediamo quindi che per avere emissione di radiazione in simmetria cilindrica, a frequenza fissata i campi 1 devono decrescere all’infinito come √ , come “onde cilindriche”. r La valutazione esplicita della (11.61) `e facilitata dai risultati della sezione precedente. 1 Per v < i campi decadono esponenzialmente, vedi (11.28), e non c’`e emissione di n(ω) 1 energia. Per v > l’andamento del potenziale per grandi r `e stato determinato in n(ω) (11.40), ´ √ ω³ 2 n2 − 1 r −iπ/4 −i z + v e e √ · 2 2 e v . (11.62) A0 (ω) = 2 4πn (v n − 1)1/4 v ω r ~ ~ Il campi E(ω) e B(ω) si determinano facilmente eseguendo la trasformata di Fourier delle definizioni (11.7), (11.8), e ricordando la (11.46), ³ ´ ~ ~ 0 (ω) − i ω A(ω) ~ ~ + i ω n2 ~v A0 (ω), E(ω) = −∇A =− ∇ ~ ~ × A(ω) ~ ~ 0 = n2 ~v × E(ω). ~ B(ω) = ∇ = −n2~v × ∇A 1 ` quindi sufficiente calcolare E(ω), ~ E limitandosi ai termini di ordine √ . Nella valutazione r ~ 0 `e sufficiente derivare l’esponenziale in (11.62), perch´e la derivata di √1 porta a di ∇A r 1 termini di ordine 3/2 . Si ottiene cos`ı, r ³ ´ √ ~ 0 (ω) = − i ω ~uz + v 2 n2 − 1 ~ur A0 (ω), ∇A v ³ ´ √ iω√ 2 2 ~ E(ω) = v n − 1 ~ur − v 2 n2 − 1 ~uz A0 (ω), v

(11.63)

√ ~ B(ω) = i ω n2 v 2 n2 − 1 A0 (ω) ~uϕ .

(11.64)

~ ~ Polarizzazione. Dalle espressioni di E(ω) e B(ω) vediamo in particolare che i vettori di polarizzazione sono reali, a parte una fase overall. Concludiamo quindi che la radiazione 334

~ appartiene al piano Cerenkov `e linearmente polarizzata, e che la polarizzazione di E contenente la direzione della particella e la direzione di propagazione della radiazione – in accordo con le osservazioni fatte da Cerenkov. Infine, inserendo le (11.63), (11.64) nella (11.61) si ottiene, ¢3/2 0 d 2ε 4πr n2 ω 2 ¡ 2 2 = n v −1 |A (ω)|2 . dz dω v Calcolando dalla (11.62), |A0 (ω)|2 =

³ e ´2 1 √ , 2 4πn v ω r v 2 n2 − 1

si ottiene il risultato di Frank e Tamm, d 2ε e2 ω = dz dω 4πc2

µ 1−

c2 v 2 n2 (ω)

¶ ,

(11.65)

dove abbiamo ripristinato la velocit`a della luce e la dipendenza dell’indice di rifrazione da ω. Per determinare l’energia totale emessa per unit`a di spazio percorso, occorre integrare la (11.65) sulle frequenze, dε e2 = dz 4πc2

Z

µ

c2 ω 1− 2 2 v n (ω)

¶ dω,

c . n(ω) Siccome l’insieme di queste frequenze `e un insieme limitato, l’energia emessa `e sempre

dove per una velocit`a fissata l’integrale si estende su tutte le frequenze per cui v >

finita. Numero di fotoni emessi. Ricordando che radiazione di frequenza ω `e composta da fotoni di energia ~ω, possiamo anche determinare il numero N di fotoni che viene emesso per unit`a di spazio percorso, nell’intervallo unitario di frequenze. Dividendo la (11.65) per l’energia di un fotone risulta, d 2N e2 = dz dω 4πc2 ~

µ

c2 1− 2 2 v n (ω)

¶ ,

mentre il numero totale di fotoni emessi per unit`a di spazio percorso `e dato da, ¶ Z µ α c2 dN = 1− 2 2 dω, (11.66) dz c v n (ω) e2 1 dove abbiamo introdotto la costante di struttura fine α = = . Anche questo 4π~c 137 numero `e quindi finito. 335

A titolo di esempio stimiamo il numero di fotoni emessi nello spettro visibile, da una particella che viaggia con velocit`a prossima a quella della luce in acqua pura. Siccome 4 nell’ottico l’acqua ha un indice di rifrazione praticamente costante, n(ω) = , in questo 3 caso abbiamo, c2 9 7 1− 2 2 =1− = . v n (ω) 16 16 Considerando λ1 = 400nm e λ2 = 800nm, e ω1,2 = 2πc/λ1,2 , la (11.66) d`a allora, ¶ µ ¶ Z µ 7πα 1 dN α ω1 c2 1 dω = = 1− 2 2 − ≈ 250/cm. (11.67) dz c ω2 v n (ω) 8 λ1 λ2 Mentre la particella percorre un centimetro in acqua, essa emette dunque circa 250 fotoni con frequenze nello spettro visibile. Si noti che la (11.67) permette di dare la stima qualitativa generale, dN α 1 ≈ = , dz λ 137λ che indica che su una distanza di 137 volte la lunghezza d’onda, la particella emette circa un fotone.

11.6

Rivelatori Cerenkov

Un dispositivo sperimentale che si avvale dell’effetto Cerenkov per rivelare particelle elementari, viene chiamato “rivelatore Cerenkov”. In genere `e costituito da un contenitore riempito da un mezzo trasparente – il cosiddetto radiatore – per esempio acqua purissima, che funge da dielettrico polarizzabile. La luce provocata dal passaggio di una particella carica con velocit`a elevata viene raccolta da fotorivelatori. Dall’angolo di emissione, e dal numero di fotoni emessi in un intervallo di lunghezze d’onda, vedi (11.42) e (11.67), si determina la velocit`a della particella. Siccome la radiazione viene emessa su coni concentrici, si pu`o risalire inoltre alla direzione del moto della particella. Bench´e le potenzialit`a dell’effetto Cerenkov come base per un rivelatore fossero chiare sin dai primordi, `e solo l’avvento dei fotomoltiplicatori, capaci di rivelare con un’alta efficienza ed una risposta veloce anche piccole intensit`a di luce, che permise a John Valentine Jelley nel 1951 di sviluppare il primo dispositivo impiegato in un esperimento. Super–Kamionkande. In tempi recenti rivelatori Cerenkov sono stati impiegati nelle ricerche sulla fisica dei neutrini, effettuate dagli esperimenti “Kamiokande” e “Super– 336

Kamiokande” nelle miniere di Kamioka in Giappone. I neutrini interagiscono debolmente con la materia, ma `e possibile che un neutrino molto energetico interagisca con un atomo, e trasferisca buona parte della sua energia ad una particella carica, tipicamente un elettrone o un muone, che irradia a sua volta luce Cerenkov. Super–Kamiokande si avvale di un recipiente cilindrico di 40m di altezza e di diametro, contenente come radiatore 50.000 tonnellate di acqua purissima, la cui superficie `e disseminata di circa 11.000 fotomoltiplicatori. Gli esperimenti di Kamioka hanno conseguito scoperte importanti nel campo della fisica dei neutrini. Cos`ı nel 1987 Kamiokande rivel`o per la prima volta un flusso di neutrini proveniente dall’esplosione di una supernova, nella Grande Nube di Magellano, mentre nel 1988 osserv`o neutrini provenienti dal Sole. Nel 1998 gli esperimenti di Super–Kamiokande hanno invece fornito la prima evidenza sperimentale dell’oscillazione dei neutrini, fenomeno che `e possibile solo se i neutrini hanno una massa diversa da zero. I rivelatori Cerenkov hanno giocato un ruolo altrettanto essenziale nella scoperta dell’antiprotone con il Bevatrone di Berkeley nel 1955, e in quella del quark charm nei laboratori di Brookhaven nel 1974.

337

12

La reazione di radiazione

Riprendiamo le equazioni dell’Elettrodinamica per una particella singola, ∂µ F µν = j ν , dpµ = e F µν (y)uν , ds

(12.1) (12.2)

con le definizioni consuete, Z F

µν

µ

ν

ν

µ

=∂ A −∂ A ,

µ

j =e

uµ δ 4 (x − y) ds.

Dalle analisi svolte nei capitoli precedenti appare evidente che, escluso casi banali, questo sistema di equazioni accoppiate non pu`o essere risolto analiticamente, e difatti finora abbiamo affrontato la sua soluzione adottando implicitamente un approccio “riduzionistico”. Riassumiamolo brevemente. Come primo passo abbiamo determinato la soluzione esatta dell’equazione di Maxwell (12.1), assumendo nota la traiettoria y µ (s) della particella. Abbiamo trovato che il campo elettromagnetico risultante `e dato dalla somma del campo di Lienard–Wiechert (6.99), µν che d’ora in poi indicheremo con F µν , e di un arbitrario campo esterno libero Fin , µν F µν = F µν + Fin .

(12.3)

Se la particella si trovava in presenza di campi esterni noti, come i campi elettromagnetici negli acceleratori di particelle, oppure quello dell’onda piana che incide sull’elettrone nell’effetto Thomson, abbiamo determinato preliminarmente la traiettoria della particella µν risolvendo l’equazione di Lorentz (12.2), ponendo ivi F µν = Fin : cos`ı facendo abbiamo,

dunque, trascurato l’azione del campo di Lienard–Wiechert sulla particella stessa, ovvero, abbiamo trascurato “l’autocampo”. Avendo determinato la traiettoria della particella in questo modo, abbiamo calcolato il campo da essa creato risolvendo la (12.1), e lo abbiamo poi valutato a grandi distanze dalla stessa, per analizzare il quadrimomento trasportato dalla radiazione emessa. In alcuni casi siamo inoltre stati in grado di quantificare l’effetto dell’emissione di radiazione sul moto della particella, invocando la conservazione del quadrimomento. Abbiamo visto

338

che in generale questo effetto `e costituito da una diminuzione dell’energia della particella, e da una variazione della sua quantit`a di moto. Ricordiamo come esempi la forza di reazione nella diffusione Thomson, la diminuzione della velocit`a di una particella carica in un ciclotrone, e il collasso dell’atomo di idrogeno classico. Questo effetto secondario, chiamato “reazione di radiazione”, “forza di frenamento” o anche “forza di autointerazione”, scaturisce dall’azione del campo elettromagnetico F µν (x) creato dalla particella, sulla particella stessa. Per ragioni di localit`a questa azione pu`o avvenire solo nel punto x = y(s) ≡ y dove la particella si trova, e quindi deve coinvolgere il valore del campo F µν (y) in quel punto. Corrispondentemente, dalle (12.2) e (12.3) si vede che la forza di frenamento `e rappresentata proprio dal termine, e F µν (y) uν .

(12.4)

Tuttavia, come abbiamo anticipato varie volte, la grandezza F µν (y) – l’autocampo – `e sempre infinita! Pi` u precisamente, per ~x → ~y (t) si ha che l’istante ritardato t0 si approssima a t, vedi (6.94), e segue che

48

,

R = |~x − ~y (t0 )| ∼ |~x − ~y (t)| ≡ r. Dalle (6.100)–(6.102) si vede allora che nelle vicinanze della traiettoria domina il campo coulombiano, e che per ~x → ~y (t), ovvero, per xµ → y µ , il campo di Lienard–Wiechert (6.99) diverge come, F µν (x) ∼

1 . r2

(12.5)

Questa `e la ragione per cui abbiamo rinviato la trattazione sistematica della reazione di radiazione fino a questo capitolo. 48 In realt`a, quando ~x → ~y (t), la distanza R = |~x − ~y (t0 )| si identificata con la “distanza fisica” r = |~x − ~y (t)|, solo modulo una costante moltiplicativa. Risolvendo la condizione del ritardo (6.94) al primo ordine in r, si trova infatti, Ã ! p 2 + (~ 2 1 − v v · m) ~ ~ v · m ~ + ~x − ~y (t) t0 (t, ~x) = t − r + o(r2 ), m ~ ≡ . 1 − v2 r

Dato che R = |~x − ~y (t0 )| = t − t0 (t, ~x), si ottiene allora, Ã ! p ~v · m ~ + 1 − v 2 + (~v · m) ~ 2 R= r + o(r2 ). 1 − v2 Vicino alla linea di universo R differisce quindi da r per una costante moltiplicativa, di origine relativistica, che per`o non si annulla mai.

339

A parte la difficolt`a concettuale appena menzionata, appare chiaro che l’approccio riduzionistico adottato finora non pu`o che avere validit`a limitata, perch´e il moto della particella `e determinato non solo dalle forze esterne, ma anche dalla forza di frenamento, e in generale queste due forze devono essere prese in considerazione contemporaneamente. Nelle prossime sezioni affronteremo il problema della reazione di radiazione in modo sistematico, a partire dai principi primi, cio`e, dalle equazioni (12.1) e (12.2). Particelle puntiformi e divergenze ultraviolette. Le divergenze appena evidenziate si riflettono anche nella definizione dell’energia totale del campo elettromagnetico, come discusso nel caso della particella statica nel paragrafo 2.3.4. Nel caso generale, a causa della (12.5), vicino alla particella il tensore energia–impulso del campo elettromagnetico (2.69) diverge come, µν Tem ∼

1 , r4

che rappresenta una singolarit`a non integrabile in R3 . Per ogni t fissato gli integrali del R 0µ 3 µ quadrimomento totale, Pem = Tem d x, sono quindi divergenti. Questo problema verr`a affrontato e risolto nel capitolo 13, dove faremo vedere come si pu`o costruire un nuovo tensore energia–impulso, ben definito nello spazio delle distribuzioni, conservato e con quadrimomento totale finito. ` chiaro che l’origine di entrambe le patologie qu`ı descritte – forza di frenamento E divergente, e energia del campo elettromagnetico infinita – risiede nella struttura punti` infatti proprio la distribuzione puntiforme della carica forme della particella carica. E a dare luogo a un campo, che nelle immediate vicinanze della particella diverge come 1/r2 . In teoria quantistica, a causa del principio di indeterminazione, l’analisi di regioni molto piccole richiede energie molto elevate, ovvero, fotoni con frequenze molto grandi. Per questo motivo divergenze che occorrono a piccole scale spaziali vengono comunemente chiamate “divergenze ultraviolette“ – anche nell’ambito della fisica classica – mentre divergenze che emergono a distanze grandi vengono chiamate “divergenze infrarosse”. Le divergenze presenti nella forza di frenamento e nell’energia del campo elettromagnetico corrispondono quindi a divergenze ultraviolette, perch´e si percepiscono a distanze molto piccole dalla particella. D’altra parte una particella carica puntiforme non d`a luogo a nessuna singolarit`a infrarossa, perch`e all’infinito il campo decresce come 1/r2 , e l’integrale 340

del quadrimomento

R

0µ 3 Tem d x converge quindi a grandi distanze

49

.

Viceversa, una particella con una distribuzione pi` u regolare di carica, per esempio una distribuzione superficiale su una sfera rigida, creerebbe un campo elettromagnetico ovunque privo di singolarit`a. Tuttavia, una tale distribuzione sarebbe in conflitto con i principi della Relativit`a: il vincolo di rigidit`a richiederebbe forze interne a “distanza”, che violerebbero la causalit`a, e la compensazione della repulsione elettrostatica della distribuzione di carica, richiederebbe l’introduzione di nuove forze di legame, di origine non elettromagnetica. Volendo preservare i postulati della Relativit`a e l’economia inerente alla formulazione minimale dell’Elettrodinamica – che non prevede altre forze fuorch´e quelle di origine elettromagnetica – preferiamo mantenere le particelle puntiformi, e modificare invece l’equazione di Lorentz – sostituendola con l’equazione di Lorentz–Dirac (12.12).

12.1

Forze di frenamento: analisi preliminare

Prima di passare a un’analisi sistematica delle forze di frenamento facciamo qualche considerazione di carattere generale. Ci sono, infatti, molti casi in cui localmente le forze di frenamento possono essere trattate come una perturbazione, ed eventualmente trascurate. Con “localmente trascurabile” intendiamo il fatto che queste forze influenzano poco il moto instantaneo della particella. Questo succede, per esempio, se le forze di frenamento sono piccole rispetto alle forze esterne primarie, oppure se esse vengono compensate da opportune forze esterne aggiuntive – come le cavit`a a radiofrequenza in un ciclotrone, o i generatori di differenza di pontenziale che mantengono gli elettroni in un’antenna in stato di oscillazione. Forze di frenamento trascurabili. Analizziamo ora qualitativamente le condizioni fisiche in cui le forze di frenamento sono localmente trascurabili. Adottiamo il seguente criterio: la reazione di radiazione pu`o essere trascurata, se l’energia ∆ε persa dalla particella a causa dell’irraggiamento durante un intervallo temporale, `e piccola rispetto all’energia ∆ε0 fornita dalla forza esterna nello stesso intervallo temporale. Applichiamo il criterio nel limite non relativistico. Indichiamo con T la scala temporale caratteristiPer ogni t fissato, a grandi distanze F µν decresce come 1/r2 , purch`e la particella sia accelerata per un intervallo temporale finito. In caso contrario domina il campo di accelerazione, e F µν decresce come 1/r. 49

341

ca della forza esterna, ovvero, il tempo durante il quale la velocit`a della particella varia apprezzabilmente, ∆v ∼ v. Se a `e l’accelerazione della particella abbiamo dunque, ∆v ∼ a T ∼ v. Allora possiamo usare la formula di Larmor per stimare, ∆ε ∼

e2 a2 T, 6π

mentre l’energia comunicata dalla forza esterna alla particella nel tempo T `e, µ ¶ 1 2 ∆ε0 = ∆ m v ∼ m v ∆v ∼ m a2 T 2 . 2 Si ottiene allora, ∆ε e2 1 ∼ . ∆ε0 3πm T La quantit`a, τ=

e2 , 6πmc3

(12.6)

corrisponde a un tempo molto piccolo, che `e legato al raggio classico della particella dalla 2r0 relazione τ = . Per l’elettrone si ha, per esempio, 3c τ = 0.6 · 10−23 s. Abbiamo quindi, ∆ε τ ∼ . ∆ε0 T

(12.7)

Localmente la reazione di radiazione `e quindi trascurabile, fino a quando la scala temporale T sulla quale la forza esterna varia sensibilmente `e grande rispetto a τ . Al contrario, la reazione di radiazione non pu`o essere trascurata, se la forza varia molto violentemente, ovvero, se durante l’intervallo temporale piccolo τ essa subisce una variazione relativa apprezzabile. Torneremo sull’effetto di forze di questo tipo nel paragrafo 12.2.5, in connessione con il fenomeno della “preaccelerazione”. L’analisi appena svolta ha validit`a locale. Anche se le forze variano su scale temporali T À τ , esse possono comunque dare luogo ad effetti cumulativi apprezzabili. Cos`ı un elettrone in un ciclotrone non relativistico dopo un tempo sufficientemente grande si 342

arresta. D’altra parte, come abbiamo visto nel paragrafo 9.2.2, nel ciclotrone ultrarelativistico l’irraggiamento ha effetti importanti anche localmente, e pu`o portare all’arresto della particella in una frazione piccolissima di secondo. In questi casi la reazione di radiazione certamente non pu`o essere trascurata, e in certe situazioni essa pu`o diventare anche dominante rispetto alla stessa forza esterna. 12.1.1

Un argomento euristico per l’equazione di Lorentz–Dirac

Tornando all’equazione di Lorentz (12.2) e sostituendo la soluzione generale dell’equazione di Maxwell (12.3), si arriva a, dpµ µν = e F µν (y) uν + e Fin (y) uν . ds

(12.8)

Per rendere operativa questa equazione dovremmo valutare esplicitamente la forza di frenamento (12.4) – divergente. La valutazione di questa forza `e in realt`a indispensabile, per chiudere il sistema di equazioni che governano l’Elettrodinamica di una particella carica. Sostituito al posto di F µν il campo di Lienard–Wiechert, la (12.8) corrisponderebbe appunto a quattro equazioni del secondo ordine nelle incognite y µ (s), di cui tre indipendenti. L’intero problema dinamico dell’Elettrodinamica sarebbe cos`ı ricondotto alla soluzione di queste tre equazioni del secondo ordine: per quanto complicate esse siano, la legge oraria ~y (t) della particella sarebbe completamente determinata dai dati iniziali ~y (0) e ~v (0). In realt`a vedremo che, una volta eliminate le divergenze attraverso un’opportuna procedura di “rinormalizzazione”, in ultima analisi questa strategia non potr`a essere portata a termine. Prima di passare all’analisi esplicita della forza di frenamento (divergente), presentiamo un semplice argomento euristico per derivare una sua possibile espressione finita. A questo scopo ricordiamo che il quadrimomento irradiato dalla particella al tempo proprio s, e che raggiunge l’infinito, `e dato dalla formula relativistica di Larmor (9.8), µ dPrad e2 2 µ =− w u . ds 6π

(12.9)

Se il quadrimomento totale si deve conservare, allora ci dobbiamo aspettare che la particella ceda questa quantit`a di quadrimomento, subendo la forza di frenamento, e2 2 µ dpµ µν = w u + · · · + e Fin (y) uν , ds 6π 343

(12.10)

dove abbiamo indicato la presenza di eventuali termini addizionali. Infatti, indipendentemente dalla presenza o meno del campo esterno, il termine di Larmor non pu`o essere l’unico termine presente al membro di destra di questa equazione. Per convincersi di questo `e sufficiente contrarre l’equazione con uµ : il membro di sinistra si annulla allora, perch`e uµ wµ = 0, mentre quello di destra resta diverso da zero. In realt`a abbiamo gi`a anticipato la possibilit`a della presenza di termini addizionali, quando nel paragrafo 9.1.2 abbiamo discusso il significato della (12.9). L’analisi appena svolta dimostra che questi contributi addizionali sono necessariamente presenti, e non `e difficile avanzare un’ipotesi ` sufficiente notare l’identit`a, sulla loro forma. E dwµ = −w2 , uµ ds

(12.11)

che si ottiene derivando rispetto a s la relazione uµ wµ = 0, wµ wµ + uµ

dwµ = 0. ds

Allora `e immediato vedere che un completamento dell’equazione (12.10) – consistente con dpµ il vincolo uµ = 0 – `e costituito dall’equazione di Lorentz–Dirac 50 , ds µ ¶ dpµ e2 dwµ µν 2 µ = + w u + e Fin (y) uν . (12.12) ds 6π ds Insistiamo sul fatto che questa equazione non potr`a essere dedotta dalla (12.8), perch´e quest’ultima `e divergente. La conclusione dell’analisi preliminare di questa sezione `e che non `e possibile derivare un’equazione chiusa per la dinamica di una particella carica, a partire dalle equazioni di Maxwell e di Lorentz: la teoria deve quindi necessariamente essere modificata. Dall’analisi svolta si capisce anche che, volendo mantenere le equazioni di Maxwell – nella cui soluzione tra l’altro non abbiamo incontrato nessuna inconsistenza – dovremo modificare l’equazione di Lorentz.

12.2

L’equazione di Lorentz–Dirac

In questa sezione presenteremo una deduzione dell’equazione di Lorentz–Dirac, a partire da un’equazione di Lorentz modificata, in particolare “regolarizzata”, e analizzeremo le 50

Lorentz dedusse la versione non relativistica di questa equazione nel 1904, mentre Dirac ottenne la versione covariante (12.12) nel 1938.

344

sue propriet`a pi` u salienti. Per semplicit`a considereremo prima una particella singola, presentando la generalizzazione al caso di N particelle alla fine della sezione. Per l’equazione del moto per una particella carica consistente – in sostituzione dell’equazione di Lorentz – poniamo le seguenti richieste minimali, di ovvio significato: 1) Invarianza relativistica. 2) Assenza di termini divergenti nell’equazione. dpµ 3) Consistenza dell’equazione con l’identit`a uµ = 0. ds 4) Compatibilit`a con la conservazione del quadrimomento totale. In seguito ci occuperemo delle richieste 1) – 3), mentre la richiesta 4), non meno importante delle altre, verr`a affrontata nel capitolo 13. Incominciamo riprendendo l’espressione per il campo di Lienard–Wiechert (6.99), ³ ´ e µ ν µ ν ν F µν (x) = L u + L [(uL) w − (wL) u ] − (µ ↔ ν) . (12.13) 4π(uL)3 Ricordiamo che, Lµ (x) = xµ − y µ (λ),

(12.14)

e che le variabili cinematiche della particella, y(λ), u(λ), e w(λ), sono valutate al tempo ritardato proprio λ(x), definito da, (x − y(λ))2 = 0,

x0 > y 0 (λ).

(12.15)

Regolarizzazione e rinormalizzazione. La nostra strategia per ottenere un’equazione di Lorentz “finita”, a partire dall’equazione di Lorentz singolare (12.8), segue una procedura che viene applicata comunemente nelle teorie di campo quantistiche relativistiche, per curare le divergenze ultraviolette. Questa procedura prevede due passaggi, il primo `e costituito da una “regolarizzazione”, e il secondo da una “rinormalizzazione”. Vediamo come essa si attua in concreto. Come primo passo si introduce un regolarizzatore ε > 0, che nel presente caso avr`a le dimensioni di una lunghezza. Si introduce poi un campo di Lienard–Wiechert regolarizzato, F µν (x) → Fεµν (x), soggetto al limite puntuale, lim Fεµν (x) = F µν (x),

ε→0

345

(12.16)

con la richiesta che esso sia regolare sulla traiettoria. Richiediamo, cio`e, che la grandezza, Fεµν (y(s)), sia finita per ogni ε > 0, e per ogni s. Come secondo ingrediente della procedura sostituiamo la massa m della particella con il parametro mε , la cui forma verr`a specificata in seguito

51

. Non necessariamente dovr`a essere, e non sar`a, limε→0 mε = m.

La nostra proposta per la nuova equazione di Lorentz, in sostituzione della (12.8), `e allora,

¸ duµ µν µν lim mε − e Fε (y) uν − e Fin (y) uν = 0, ε→0 ds ·

(12.17)

purch´e si riesca a trovare un parametro mε , che elimini dall’equazione eventuali termini divergenti per ε → 0. Si noti che quest’ultima condizione `e molto restrittiva, perch´e per qualsiasi scelta di mε si riescono ad eliminare solo termini divergenti che sono proporzionali duµ a wµ = . Questo passaggio finale viene chiamato “rinormalizzazione”. ds Formulata in questo modo, se un tale mε esiste la nostra proposta soddisfa automaticamente le richieste 2) e 3). La richiesta 3) `e soddisfatta semplicemente perch´e nella (12.17) uν moltiplica sempre un tensore antisimmetrico. La richiesta 1) sar`a, invece, soddisfatta se la regolarizzazione (12.16) preserva l’invarianza di Lorentz. Con ci`o intendiamo che il campo Fεµν (x) si trasforma come un campo tensoriale sotto trasformazioni di Lorentz, per ogni ε > 0. 12.2.1

Derivazione dell’equazione

Implementeremo ora questo programma, scegliendo una specifica regolarizzazione che preserva l’invarianza di Lorentz. Una regolarizzazione Lorentz–invariante. Introduciamo un campo di Lienard–Wiechert regolarizzato mantenendo formalmente l’espressione (12.13), ma sostituendo la funzione λ(x) di (12.15), con l’espressione regolarizzata λε (x), definita da, (x − y(λε ))2 = ε2 , 51

x0 > y 0 (λε ).

(12.18)

A priori si potrebbe anche introdurre una carica regolarizzata eε , ma nel caso in questione non `e necessario.

346

Definiamo, cio`e 52 , Fεµν

¯ =F ¯ µν ¯

λ→λε

.

(12.19)

Questa regolarizzazione preserva l’invarianza di Lorentz, perch´e le condizioni (12.18) sono Lorentz–invarianti. Si ricordi, in particolare, che il cono luce futuro `e Lorentz–invariante. ` anche immediato vedere che F µν (y), dove sottintendiamo y µ ≡ y µ (s), `e ben definito E ε per ogni ε > 0. Infatti, valutando la (12.18) per xµ = y µ (s) abbiamo, (y(s) − y(λε ))2 = ε2 , che pone, al posto della soluzione λ = s del caso non regolarizzato, λε = s − ε + o(ε2 ). Si ottiene cos`ı, Lµε (y(s)) = y µ (s) − y µ (λε ) = ε uµ (s) + o(ε2 )



(uL)ε = ε + o(ε2 ) 6= 0.

1 della versione regolarizzata di (12.13) `e quindi finito lungo tutta la [(uL)ε ]3 traiettoria, e l’autocampo Fεµν (y) `e allora ben definito per ogni ε > 0 e per ogni s. Il prefattore

La regolarizzazione (12.19) ha l’ulteriore pregio di preservare la struttura causale del campo non regolarizzato. Dalla (12.18) si vede infatti che Fεµν (x) dipende dalle variabili cinematiche y, u e w della particella nel punto y(λε ), che `e connesso a x attraverso un segnale causale futuro, segnale che per ε > 0 si propaga con velocit`a strettamente minore della velocit`a della luce. Inoltre, non `e difficile dimostrare che vale λε (x) < λ(x), per ogni ε > 0. In questo modo il campo regolarizzato Fεµν (x) dipende dalle variabili cinematiche della particella a un istante ritardato precedente all’istante ritardato fisico t0 (x), ma non dalle variabili cinematiche ad istanti successivi a t0 (x). 52

Non `e difficile convincersi che questa regolarizzazione equivale a tutti gli effetti a sostituire la funzione di Green ritardata G, con la funzione di Green regolarizzata, ma ancora Lorentz invariante, Gε , data da, G=

1 H(x0 )δ(x2 ) 2π



Gε =

1 H(x0 )δ(x2 − ε2 ). 2π

Definendo Aµε = Gε ∗ j µ , `e infatti immediato dimostrare che vale, Fεµν = ∂ µ Aνε − ∂ ν Aµε .

347

Il campo regolarizzato del moto rettilineo uniforeme. Prima di applicare questa regolarizzazione a un moto generico, la illustriamo nel caso di una particella in moto rettilineo uniforme, con linea di universo, y µ (s) = uµ s,

wµ (s) = 0.

In questo caso possiamo determinare il campo di Lienard–Wiechert regolarizzato esattamente. Come primo passo determiniamo λε (x), risolvendo il vincolo (12.18), (x − uλ)2 = ε2



λε (x) = (ux) −

p (ux)2 − x2 + ε2 .

Secondo la (12.19) dobbiamo allora valutare la (12.13), sostituendo λ(x) → λε (x). Abbiamo, Lµε = xµ − uµ λε (x)



(uL)ε = (ux) − λε (x) =

p

(ux)2 − x2 + ε2 .

Siccome wµ = 0, la (12.13) d`a allora, Fεµν (x) =

x µ uν − x ν uµ e , 4π [(ux)2 − x2 + ε2 )]3/2

(12.20)

espressione manifestamente Lorentz–invariante. Per ε → 0 si riottiene evidentemente il campo creato da una particella in moto rettilineo uniforme, vedi (6.66). Ma il campo (12.20) `e ora ben definito anche sulla traiettora della particella, cio`e, per xµ = y µ (s) = uµ s. Il denominatore si riduce infatti a 4πε3 , mentre il numeratore va a zero, e quindi, Fεµν (y) = 0. Anche il limite limε→0 Fεµν (y) `e allora nullo. Questo significa che una particella che si µν = 0, non esercita nessuna autointemuove di moto rettilineo uniforme, quindi con Fin

razione. Questo risultato `e evidentemente in accordo con il fatto che una particella che non `e accelerata non emette radiazione. Dall’analisi appena svolta traiamo anche un’altra conclusione importante: per un moto arbitrario il limite (divergente) limε→0 Fεµν (y) deve necessariamente dipendere dalla quadriaccelerazione wµ e/o eventualmente dalle sue derivate, perch´e per un moto rettilineo uniforme esso `e zero. Rinormalizzazione della massa. Torniamo ora al caso generale. Per analizzare il limite in (12.17) dobbiamo determinare l’andamento dell’autocampo Fεµν (y), nel limite per ε → 348

0. Nel paragrafo 12.2.2 faremo vedere che per un moto generale questo limite non esiste, e che Fεµν (y) ammette invece lo sviluppo in serie di Laurent attorno a ε = 0, µ ¶ µ ν e e µ ν ν µ ν dw µν µ dw (u w − u w ) − −u Fε (y) = u + o(ε). 8πε 6π ds ds

(12.21)

Utilizzando questo risultato `e facile valutare la forza di frenamento regolarizzata, che compare in (12.17). Usando l’identit`a (12.11) si ottiene, µ ¶ e2 dwµ e2 µ µν 2 µ e Fε (y) uν = +w u − w + o(ε). 6π ds 8πε Come si vede, la forza di frenamento contiene un termine divergente per ε → 0, che `e duµ per`o proporzionale a . Grazie a questa circostanza, a meno di termini di ordine ε la ds (12.17) si scrive dunque, ¶ µ µ ¶ e2 duµ e2 dwµ µν 2 µ = + w u + e Fin uν . (12.22) mε + 8πε ds 6π ds Il termine divergente pu`o allora essere eliminato se si sceglie per la massa regolarizzata il valore, tendente a −∞, mε = m −

e2 , 8πε

dove identifichiamo m con la massa fisica finita della particella. Questa ridefinizione (infinita) della massa della particella rappresenta la “rinormalizzazione”. Dopo questa operazione la (12.22) si riduce in effetti all’equazione di Dirac–Lorentz (12.12). Questa equazione pu`o essere scritta anche come, µ µ ¶ dw e µν µ 2 µ w =τ + w u + Fin uν , ds m

(12.23)

dove il parametro τ , con le dimensioni di un tempo, `e lo stesso che compare nella (12.6), e2 τ = . Si vede che questo tempo `e massimo per la particella carica pi` u leggera, 6πmc3 ovvero, per l’elettrone. ` immediato generalizzaEquazioni di Lorentz–Dirac per un sistema di N particelle. E re l’equazione (12.12) a un sistema di N particelle cariche. In questo caso nell’equazione della particella r–esima bisogna tenere conto anche dei campi di Lienard–Wiechert Fsµν , creati dalle altre particelle. Si ottiene cos`ı, ¶ µ dpµr e2r dwrµ 2 µ = + wr ur + er Frµν (yr ) urν , dsr 6π dsr 349

(12.24)

dove il “campo esterno” agente sulla particella r–esima `e dato da, µν + Frµν = Fin

X

Fsµν .

(12.25)

s6=r

` chiaro che il campo F µν (x) non presenta nessuna singolarit`a in x = yr . E r Analizzeremo le caratteristiche principali dell’equazione di Lorentz–Dirac nel paragrafo 12.2.3. 12.2.2

Determinazione dell’autocampo regolarizzato

In questo paragrafo dimostriamo la formula (12.21). La valutazione di Fεµν (y(s)) richiede intanto di determinare per ogni s fissato il parametro λε , tale che, vedi (12.18), (y(s) − y(λε ))2 = ε2 .

(12.26)

Siccome per ε → 0 abbiamo che λε → s, `e conveniente porre, λε = s − ∆,

(12.27)

dove ∆ `e un parametro positivo che per ε → 0 va a zero. Pi` u precisamente, inserendo la (12.27) nella (12.26) e sviluppando in serie si ottiene, · µ ¶ ¸2 1 2 3 y(s) − y(s) − ∆ u(s) + ∆ w(s) + o(∆ ) = ∆2 + o(∆4 ) = ε2 , 2 e quindi, ∆ = ε + o(ε3 ).

(12.28)

Invece di analizzare il limite di Fεµν (y(s)) per ε → 0, possiamo allora usare la (12.27) e analizzarne il limite per ∆ → 0. Per quello che segue sar`a sufficiente sapere che ∆ ugaglia ε, modulo termini cubici. In definitiva si tratta quindi di sviluppare l’espressione, · ´¸ e 1 ³ µ ν µν µ γ ν γ ν Fε (y(s)) = L u + L Lγ [u w − w u ] − (µ ↔ ν) , 4π (uL)3 λ=s−∆ in serie di Laurant attorno a ∆ = 0, dove in questa formula `e sottointeso che, Lµ = y µ (s) − y µ (λ). 350

(12.29)

Siccome nella (12.29) a denominatore compare il termine (uL)3 , ed Lµ `e di ordine ∆, `e necessario espandere il numeratore fino al terzo ordine in ∆. Definendo uµ ≡ uµ (s), wµ ≡ wµ (s) e

dwµ ds



dwµ (s) ds

otteniamo gli sviluppi,

Lµ = y µ (s) − y µ (λ) = ∆ uµ − uµ (λ) = uµ − ∆wµ + wµ (λ) = wµ − ∆

1 2 µ 1 3 dwµ ∆w + ∆ + o(∆4 ), 2 6 ds

1 2 dwµ ∆ + o(∆3 ), 2 ds

dwµ + o(∆2 ), ds

usando i quali `e facile espandere i vari termini che compaiono nella (12.29) fino all’ordine desiderato, (uL) = uµ (λ)Lµ = ∆ + o(∆3 ), µ ¶ ν µ 1 2 µ ν 1 3 µ ν ν µ ν µ µ dw ν dw L u (λ) − L u (λ) = − ∆ (u w − u w ) + ∆ u −u , 2 3 ds ds µ ¶ ν γ γ ν γ ν γ ν ν γ γ dw ν dw [u w − w u ] (λ) = u w − u w − ∆ u −u , ds ds ¶ µ µ ν ν dw µ γ ν γ ν 2 µ ν ν µ 3 µ dw −u . L Lγ [u w − w u ] (λ) − (µ ↔ ν) = ∆ (u w − u w ) − ∆ u ds ds Inserendo queste espressioni nella (12.29) si ottiene in definitiva, µ ¶ ν µ e e µν µ ν ν µ µ dw ν dw Fε (y(s)) = (u w − u w ) − u −u + o(∆), 8π∆ 6π ds ds

(12.30)

dove, data la (12.28), ∆ pu`o essere sostituito di nuovo con ε. Il risultato `e quindi la (12.21). 12.2.3

Caratteristiche dell’equazione di Lorentz–Dirac

Il ruolo dell’equazione. Insistiamo sul fatto che l’equazione di Lorentz–Dirac non `e stata “dedotta” dalle equazioni dell’Elettrodinamica, ma che ne abbiamo data una deduzione euristica: in ultima analisi essa deve venire postulata. La sua giustificazione ultima discende, invece, dal fatto che, come spiegheremo nel capitolo 13, essa viene imposta dalla conservazione del quadrimomento totale del sistema particelle + campi. Non per niente Dirac bas`o la sua deduzione dell’equazione su argomenti di conservazione. Finora abbiamo determinato il moto di una particella carica, tenendo conto solo della forza esterna e/o della forza di interazione con le altre particelle cariche, vedi il termine 351

Frµν (yr ) nella (12.24). In base al moto cos`ı derivato abbiamo determinato la radiazione emessa e, infine, tramite la formula di Larmor abbiamo analizzato gli effetti della forza di frenamento, trattandola come una perturbazione. Questa procedura approssimata deve essere ora sostituita, in linea di principio, dalla soluzione del sistema di equazioni accoppiate dato in (12.24) – autointerazioni comprese. Forza di frenamento e termine di Schott. Il vettore, µ ¶ e2 dwµ µ 2 µ Γ = +w u , 6π ds

(12.31)

in (12.12) rappresenta la quadriforza di frenamento, ed `e composto da due termini. Il secondo termine `e il termine di Larmor, la cui presenza `e stata ipotizzata in sezione 12.1, sfruttando la conservazione del quadrimomento. Il primo termine, detto “termine dell’energia di Schott”, `e invece necessario per assicurare la consistenza della forza di frenamento con l’identit`a uµ (dpµ /ds) = 0, cio`e, la nostra richiesta 3). Ricordiamo, infatti, che la (12.11) assicura che vale identicamente, uµ Γµ = 0. Bilancio del quadrimomento. Abbiamo appena visto che il termine di Schott non origina da una legge di conservazione, ma da una richiesta di consistenza algebrica. Corrispondentemente facciamo notare che questo termine non contribuisce al bilancio del quadrimomento totale, 1) in un processo di scattering, per cui wµ → 0 per s → ±∞ e, 2) durante un moto quasi–periodico. In entrambi i casi si ha, infatti, µ ∆PSchott

e2 = 6π

Z

f i

¢ dwµ e2 ¡ µ ds = wf − wiµ = 0. ds 6π

La variazione totale del quadrimomento della particella `e quindi dovuta soltanto al termine di Larmor – come supposto in tutte le nostre analisi precedenti – e evidentemente al campo µν esterno Fin , ovverosia, in presenza di pi` u particelle, a Frµν .

Conflitto con il determinismo e condizioni supplementari. Pur non contribuendo al bilancio del quadrimomento totale, il termine di Schott ha effetti locali sul moto della particella, che in generale non possono essere trascurati. Per di pi` u questo termine `e in conflitto con il determinismo newtoniano, perch´e contiene la derivata terza delle coordinate ~y (t) 352

rispetto al tempo: dunque il moto non `e pi` u univocamente determinato, note ~y (0) e ~v (0). Date queste condizioni iniziali sarebbero, infatti, possibili infiniti moti diversi, a seconda dell’accelerazione iniziale ~a(0). Questa circostanza, oltre a essere in contrasto con l’osservazione, svuoterebbe l’equazione del moto del suo potere predittivo. Concludiamo, quindi, che non tutte le soluzioni dell’equazione di Lorentz–Dirac possono corrispondere a moti realizzati in natura, ed occorre allora imporre opportune condizioni supplementari, atte a selezionare i moti fisicamente ammessi, senza inficiare l’invarianza di Lorentz. Se supponiamo che i campi esterni vanno a zero all’infinito spaziale con sufficiente rapiditi`a, allora esistono delle condizioni supplementari che si offrono in modo naturale. Se all’infinito i campi svaniscono `e, infatti, naturale aspettarsi che per tempi grandi l’accelerazione tenda a zero, e che la velocit`a tenda a un valore limite, diverso dalla velocit`a della luce. Imponiamo dunque le seguenti condizioni supplementari lim wµ (s) = 0,

53

,

lim uµ (s) = uµ∞ .

s→+∞

s→+∞

(12.32)

Non imponiamo condizioni analoghe per s → −∞, per un motivo che sar`a chiaro tra poco. Si noti che nel linguaggio tridimensionale queste condizioni equivalgono a, lim ~a(t) = 0,

t→+∞

lim ~v (t) = ~v∞ ,

t→+∞

|~v∞ | < 1.

(12.33)

Sotto opportune condizioni di regolarit`a, la richiesta dell’annullamento asintotico dell’accelerazione implica la costanza asintotica della velocit`a, sicch´e la seconda condizione in (12.32) risulta ridondante. Esploreremo le conseguenze fisiche di queste condizioni supplementari nelle soluzioni esplicite dei prossimi paragrafi. Un determinismo alternativo del terzo ordine? Una strategia alternativa all’imposizione delle (12.32) – pi` u pragmatica e “sperimentale”, ma anche pi` u rinunciataria – potrebbe essere la seguente. Supponiamo di misurare all’istante iniziale non solo posizione e velocit`a, ma anche l’accelerezione della particella. Con questi tre dati iniziali l’equazione di Lorentz–Dirac determinerebbe il moto della particella allora univocamente, e si potrebbe cos`ı predire la sua posizione ad ogni istante successivo. Oltre a essere in conflitto con il 53

Difatti queste condizioni sono soddisfatte anche per i “moti limitati”. In un acceleratore, per esempio, una particella non pu`o essere alimentata da un campo elettrico per un tempo infinito, e irraggiando perde quindi energia fino a quando non raggiunge una velocit`a nulla o costante.

353

determinismo newtoniano, questo determinismo “del terzo ordine” fallisce, tuttavia, per motivi sperimentali. Illustriamolo nell’esempio della particella libera. Per accertare se essa si muove di moto rettilineo unifome, l’osservatore misura la velocit`a della particella in vari istanti, ma alla fine potr`a solo fornire un valore massimo, seppur molto piccolo, per l’accelerazione. Tuttavia, dalla soluzione generale dell’equazione di Lorentz–Dirac per la particella libera, vedi (12.40), si vede che per una qualsiasi accelerazione iniziale diversa da zero, la particella accelera violentemente, e la sua velocit`a tende a quella della luce. L’osservatore concluderebbe, quindi, che teoria ed esperimento sono in disaccordo. L’unico modo per verificare la teoria consisterebbe nell’eseguire misure con errori nulli, ottenendo per l’accelerazione il valore zero, ma questo non `e possibile. L’equazione di Lorentz–Dirac e il principio variazionale. Una volta sostituita l’equazione di Lorentz – che sappiamo discendere attraverso il principio variazionale dall’azione (4.7) – con l’equazione di Lorentz–Dirac, resta la domanda se anche quest’ultima possa essere dedotta da un’opportuna azione. La questione `e rilevante in quanto l’esistenza di un’azione assicurerebbe, grazie al teorema di Noether, l’esistenza di un tensore energia– impulso conservato e simmetrico. Il fatto che non esiste nessuna azione canonica da cui l’equazione di Lorentz–Dirac possa essere dedotta – il motivo essendo essenzialmente la comparsa della derivata terza delle coordinate – mette cos`ı in dubbio la conservazione del quadrimomento e del momento angolare totali in Elettrodinamica classica. Per illustrare il µν problema consideriamo una particella singola in un campo esterno Fin = ∂ µ Aνin − ∂ ν Aνin ,

nel qual caso si tratterebbe di trovare un’azione che riproduce l’equazione (12.12). In assenza della forza di frenamento l’azione sarebbe data dalla (4.7). D’altra parte, per riprodurre la forza di frenamento (12.31), che contiene un termine lineare nella derivata terza delle y µ , nell’azione devono comparire termini quadratici nelle y µ , con complessivamente tre derivate. Imponendo anche l’invarianza relativistica e l’invarianza per riparametrizzazione della linea d’universo, la forma pi` u generale dell’azione sarebbe allora, ¶ Z Z Z µ 3 dy µ d2 yµ µ µ d yµ 2 + by ds, (12.34) I = −m ds − e Ain dyµ + e a ds ds2 ds3 dove a e b sono costanti adimensionali. A questo punto notiamo, per`o, che il primo termine nella parentesi uguaglia a uµ wµ , che `e zero identicamente, mentre il secondo termine pu`o 354

essere ricondotto al primo attraverso un’integrazione per parti, yµ

d3 yµ d µ dy µ d2 yµ d µ = (y w ) − = (y wµ ) . µ 3 2 ds ds ds ds ds

Nell’azione questo termine d`a quindi luogo a un termine al bordo, che non contribuisce alle equazioni del moto. L’azione (12.34) fornisce dunque l’equazione del moto dpµ /ds = µν eFin uν , e non l’equazione di Lorentz–Dirac.

L’assenza di un’azione da cui l’equazione di Lorentz–Dirac possa essere dedotta comporta, in particolare, che un eventuale tensore energia–impulso conservato debba essere costruito “a mano”, problema che verr`a affrontato nel capitolo 13. 12.2.4

La particella carica libera: soluzione esatta

In alcuni casi semplici l’equazione di Lorentz–Dirac pu`o essere risolta esattamente, un esempio essendo quello della particella libera. In questo caso si tratta di risolvere la µν (12.23) con Fin = 0,

µ µ

w =τ

¶ dwµ 2 µ +w u . ds

(12.35)

Limite non relativistico e soluzioni “runaway”. Prima di affrontare la soluzione generale di questa equazione, la risolviamo nel limite non relativistico. Per fare questo dobbiamo sviluppare la (12.35) in serie di potenze di 1/c, ed arrestarci all’ordine pi` u bas` sufficiente considerare le tre equazioni funzionalmente indipendenti, ovvero, quelle so. E spaziali, che possono essere scritte come, τ w ~=√ 1 − v2

µ

¶ dw ~ 2 + w ~v , dt

(12.36)

dove, w ~=√

1 d ~a ~v · ~a ~v √ = + ~v , 2 1−v (1 − v 2 )2 1 − v 2 dt 1 − v 2

w2 = −

a2 − (~a × ~v )2 , (1 − v 2 )3

vedi problema 2.1. Moltiplicando l’espressione di w ~ scalarmente per ~v si ottiene, ~v · w ~=

~v · ~a , (1 − v 2 )2

e cos`ı possiamo esprimere ~a in termini di w, ~ ~a = (1 − v 2 ) (w ~ − (~v · w) ~ ~v ) . 355

e2 Sostituendo per w ~ la (12.36), e ricordando che si ha τ = , si ottiene l’equazione di 6πmc3 Newton tridimensionale, q 2 µ ¶ µ ¶ ¶ e2 1 − vc2 µ dw dw ~ v2 ~ 1 1 2 m ~a = − 2 ~v · ~v + 2 1 − 2 w ~v , (12.37) 6πc3 dt c dt c c dove abbiamo ripristinato la velocit`a della luce. Come si vede, nell’espansione non relativistica il contributo dominante proviene dal termine di Schott, che `e di ordine 1/c3 , mentre il termine di Larmor d`a luogo a contributi di ordine 1/c5 . Tenendo nella (12.37) solo il termine dominante, e ricordando che w ~ = ~a + o(1/c2 ), concludiamo che nel limite e2 d~a , ovvero, non relativistico la (12.35) si riduce semplicemente a m~a = 6πc3 dt ~a = τ

d~a . dt

(12.38)

La soluzione generale di questa equazione `e, ~ et/τ ~a(t) = C



¡ ¢ ~ et/τ − 1 + ~v0 , ~v (t) = τ C

~ `e un arbitrario vettore costante. Si riscontra quindi un fenomeno anomalo: pur dove C trovandosi in assenza di forze esterne, la particella accelera, e per t → +∞ la sua velocit`a tende a pi` u infinito, mentre non si riscontra nessuna anomalia per t → −∞. Queste soluzioni, chiamate “runaway solutions”, non sono quindi fisicamente accettabili e devono essere scartate. Se si impongono le condizioni supplementari (12.33), si vede che le uniche ~ = 0. Otteniamo quindi, soluzioni che le soddisfano sono quelle per cui C ~v (t) = ~v0 , corrispondente a un moto rettilineo uniforme – come si conviene a una particella libera. La situazione appena vista `e prototipica: il ruolo delle condizioni supplementari sar`a, infatti, sempre quello di eliminare le soluzioni che fisicamente non sono accettabili. Nei prossimi paragrafi vedremo, tuttavia, che in presenza di interazione le soluzioni dell’equazione di Lorentz–Dirac che soddisfano anche le (12.32), pur non esibendo un comportamento anomalo di tipo runaway, sono in conflitto con la causalit`a. Soluzione relativistica esatta. Abbiamo appena visto che in approssimazione non relativistica l’equazione di Lorentz–Dirac comporta moti per cui la velocit`a della particella 356

aumenta indefinitamente, comportamento che di per s`e invalida l’approssimazione stessa. Cerchiamo allora di risolvere l’equazione (12.35) esattamente. Per trovare la sua soluzione generale `e conveniente eseguire il cambiamento di variabile, d λ d = . ds τ dλ

s → λ(s) = e s/τ , Indicando la derivata

d con un primo “ 0 ”, si ha, dλ ¢ λ dwµ 1 ¡ wµ = uµ0 , = 2 λ2 uµ00 + λ uµ0 , τ ds τ

e la (12.35) si riduce allora a, u00µ + (u0 u0 ) uµ = 0,

(u0 u0 ) ≡ u0ν uν 0 .

(12.39)

Per risolvere questa equazione notiamo che l’identit`a u2 = 1, implica che (uu0 ) = 0. Contraendo la (12.39) con uµ0 si ottiene allora, 0 = (u0 u00 ) =

1 0 0 0 (u u ) 2



(u0 u0 ) = −K 2 ,

con K costante positiva. Risostituendo questo risultato nella (12.39) si ottiene l’equazione del repulsore armonico, con soluzione generale, uµ = Aµ eKλ + B µ e−Kλ ,

wµ =

¢ λ K ¡ µ Kλ A e − B µ e−Kλ , τ

(12.40)

dove Aµ e B µ sono vettori costanti. Infine, per soddisfare il vincolo u2 = 1, questi vettori devono essere vincolati dalle relazioni, A2 = 0 = B 2 ,

1 A µ Bµ = . 2

(12.41)

Come si vede, le soluzioni (12.40) esibiscono di nuovo un comportamento di tipo runaway, in quanto per s → +∞, che corrisponde a λ → +∞, tutte le componenti della quadrivelocit`a divergono. Per grandi s l’energia, per esempio, cresce come, ³ ³ s ´´ 0 0 . ε(s) = m u (s) ∼ m A exp K exp τ Allo stesso modo divergono tutte le componenti di uµ e wµ . Corrispondentemente per s → +∞ la velocit`a della particella tende alla velocit`a della luce, la velocit`a asintotica essendo data da,

~ ~u A = , s→+∞ u0 ~ |A|

~v∞ = lim ~v = lim s→+∞

357

|~v∞ | = 1.

Di nuovo vediamo che per s → −∞, che corrisponde a λ → 0, la quadrivelocit`a ammette invece limite finito, lim uµ (s) = Aµ + B µ ,

s→−∞

sicch´e per s → −∞ la velocit`a tende a un valore minore della velocit`a della luce. Si noti ~ = 0 e/o B ~ = 0 sono proibite dalle (12.41). che le scelte A Imponiamo allora di nuovo le condizioni supplementari (12.32). Dalle (12.40) si vede che le uniche soluzioni per cui wµ (s) tende a zero per s → +∞, sono quelle corrispondenti a, K=0

wµ (s) = 0, ∀ s,



che comporta uµ (s) = Aµ + B µ = costante. Concludiamo che le uniche soluzioni dell’equazione di Lorentz–Dirac per la particella libera, compatibili con le (12.32), corrispondono a moti rettilini uniformi, in accordo con l’esperienza. Nel prossimo paragrafo vedremo, invece, che in presenza di forze esterne la situazione sar`a alquanto pi` u problematica. 12.2.5

Moto in campo costante: preaccelerazione

Analizzeremo ora il moto di una particella soggetta a un campo elettrico indipendente dal tempo e unidirezionale, esteso a una regione spaziale limitata. Considereremo soli moti che avvengono lungo la stessa direzione del campo. Questo esempio, per quanto semplice possa sembrare, esibisce tutti gli aspetti problematici inerenti all’equazione di Lorentz–Dirac in presenza di una generica forza esterna. µν In questo caso il campo esterno Fin consiste di un campo elettrico, diciamo in direzione

~ = (0, 0, E), e di un campo magnetico nullo. Per il momento non facciamo nessuna z, E ipotesi sulla dipendenza di E da z, a parte la solita condizione asintotica, lim E(z) = 0.

z→±∞

` allora consistente assumere che il moto avvenga lungo l’asse delle z. Definendo, E u ≡ u3 , e indicando la derivata

d con un primo “ 0 ”, abbiamo allora, ds

uµ = (u0 , 0, 0, u),

(u0 )2 − u2 = 1, 358

wµ = (u00 , 0, 0, u0 ).

Riferendoci alla (12.23) la quadriforza esterna diventa allora, ¡ ¢ µν uν = eEu, 0, 0, eEu0 . e Fin Siccome la variabile u0 `e una funzione di u – che diventa l’unica incognita del sistema – `e sufficiente scrivere la componente z dell’equazione di Lorentz–Dirac, come unica equazione funzionalmente indipendente. Dato che si ha, u00 =

uu0 d√ 1 + u2 = √ , ds 1 + u2

segue, w2 = u002 − u02 = −

u02 , 1 + u2

e la componente z della (12.23) si scrive allora, µ ¶ u u02 F 0 00 u =τ u − + u0 , 2 1+u m

F ≡ e E,

(12.42)

` conveniente cambiare incognita u(s) → γ(s), secondo, dove F `e la forza esterna. E u0 = cosh γ,

u = sinh γ,

che dopo semplici passaggi riduce la (12.42) a, γ 0 = τ γ 00 +

F . m

(12.43)

Per quello che segue `e utile riscrivere γ 0 come, du 1 du γ 0 = ds = , du u0 ds dγ che equivale quindi a, γ0 =

du w3 = 0. dt u

(12.44)

Aanalizzamo ora le caratteristiche della soluzione generale della (12.43). Siccome all’infinito spaziale il campo esterno va a zero, per s → +∞ l’equazione si riduce semplicemente a, γ 0 = τ γ 00



γ 0 = Ces/τ

⇒ 359

γ = Cτ es/τ + B.

(12.45)

La quadrivelocit`a u(s) = sinh γ(s) diverge quindi di nuovo violentemente per s → +∞, anche se la forza all’infinito va zero, e le (12.32) impongono di nuovo C = 0. Per E(z) = 0 identicamente, riotteniamo in particolare le soluzioni della particella libera (12.40). Tuttavia, per E 6= 0 non `e pi` u cos`ı ovvio in che modo possiamo imporre le condizioni supplementari (12.32), e che effetto tali condizioni avranno sulle soluzioni che le soddisfano. Campo esterno uniforme. Per fare un esempio concreto supponiamo che il campo elettrico sia diverso da zero solo in un intervallo dell’asse z, e che sia ivi costante. Sar`a allora, F (s) = e E χ[a,b] (s), dove abbiamo introdotto la funzione caratteristica dell’intervallo [a, b], ed E `e costante. Per una forza esterna siffatta `e facile scrivere la soluzione generale (“integrale primo”) della (12.43), γ0 =

¢ F eE ¡ + H(a − s) e(s−a)/τ − H(b − s) e(s−b)/τ + C es/τ , m m

(12.46)

con C costante arbitraria. Per s → +∞ si conferma l’andamento asintotico (12.45), in quanto per s > b le funzioni di Heaviside si annullano entrambe. ` ora facile imporre le (12.32), che in questo caso si riducono a, E lim w3 = 0,

lim u0 = u0∞ .

s→+∞

s→+∞

Per via della (12.44) questo significa che deve essere, lim γ 0 = 0,

s→+∞

e l’unico valore di C per cui ci`o succede risulta essere ancora C = 0. Usando la (12.44) e introducendo la quantit`a di moto p = mu, la (12.46) si riduce allora a, dp = F + Ff r , dt

(12.47)

dove, ¢ ¡ Ff r = eE H(a − s) e(s−a)/τ − H(b − s) e(s−b)/τ , rappresenta la forza di frenamento. La (12.47) `e da interpretarsi a tutti gli effetti come l’equazione di Newton della particella, che tiene conto anche della reazione di radiazione. 360

Si vede che la forza di frenamento `e diversa da zero ∀ s < a, e la particella subisce quindi una “preaccelerazione” lungo un intero tratto dell’asse z, in cui la forza esterna `e nulla. Questo fenomeno `e chiaramente in conflitto con la causalit`a in quanto “l’effetto”, cio`e, l’accelerazione, precederebbe la “causa”, cio`e, la forza esterna. D’altra parte la forza di frenamento Ff r – responsabile della preaccelerazione – `e sensibilmente diversa da zero solo negli intervalli [a, a − τ ] e [b, b − τ ]. Questa forza distorce quindi apprezzabilmente la forza esterna solo se b − a ∼ τ , cio`e, se il campo esterno varia apprezzabilmente su scale temporali piccolissime, dell’ordine di τ . Da questa soluzione esatta dell’equazione di Lorentz–Dirac vediamo che (l’inevitabile) riduzione dell’equazione dal terzo al secondo ordine, comporta una violazione della causalit`a – sotto forma di una preaccelerazione – su una scala temporale dell’ordine di τ . Nella prossima sezione faremo vedere che questa conclusione ha carattere completamente generale, e discuteremo in particolare la possibilit`a di osservare questa rottura di causalit`a sperimentalmente.

12.3

L’equazione integro–differenziale di Rohrlich

In questa sezione vogliamo analizzare le propriet`a generali del sottoinsieme di soluzioni dell’equazione di Lorentz–Dirac, che soddisfano anche le condizioni supplementari (12.32). Abbiamo visto che queste ultime sono necessarie per eliminare le soluzioni runaway, e per rendere l’equazione di Lorentz–Dirac nuovamente compatibile con il determinismo newtoniano. Con le condizioni “iniziali” y µ (0) = y0µ ,

54

,

uµ (0) = uµ0 ,

lim wµ (s) = 0,

s→+∞

(12.48)

l’equazione (12.23) ammette, infatti, un’unica soluzione. Vediamo allora quali sono le caratteristiche delle soluzioni che soddisfano questi dati iniziali, in particolare la condizione asintotica sull’accelerazione. Un metodo standard per imporre concretamente una condizione iniziale su un’equazione differenziale di ordine n, consiste nel trasformare l’equazione differenziale in un’equazione integro–differenziale di 54

L’unicit`a della soluzione `e garantita sotto opportune ipotesi di regolarit`a della forza esterna. In particolare in (12.48) abbiamo omesso la condizione dell’esistenza della velocit`a asintotica – vedi (12.32) – in quanto implicata, sotto opportune condizioni, dall’annullamento della quadriaccelerazione asintotica.

361

ordine n − 1, che ingloba automaticamente la condizione iniziale. In generale ci sono vari modi per operare questa riduzione; noi seguiremo qu`ı il metodo di F. Rohrlich

55

, che ha

il particolare pregio di preservare l’invarianza di Lorentz a vista. Riprendiamo dunque l’equazione di Lorentz–Dirac (12.23), riscrivendola nella forma, µ ¶ dwµ e2 2 µ µν µ m w −τ = w u + e Fin uν ≡ F µ . (12.49) ds 6π µν Siccome e Fin uν `e la forza esterna, e il termine di Larmor

e2 6π

w2 uµ `e responsabile dell’e-

missione del quadrimomento totale, interpretiamo F µ come la quadriforza totale effettiva. Un argomento qualitativo. Prima di procedere diamo un argomento qualitativo – ma generale – per la presenza inevitabile di un effetto di preaccelerazione, in una generica soluzione dell’equazione di Lorentz–Dirac. Siccome τ `e piccolo possiamo, infatti, riscrivere la (12.49) come, m wµ (s − τ ) ≈ F µ (s), oppure, m wµ (s) ≈ F µ (s + τ ).

(12.50)

L’accelerazione all’istante s sarebbe quindi determinata dalla forza effettiva all’istante avanzato s0 ∼ s + τ , di nuovo in conflitto con la causalit`a. Riduciamo ora l’equazione differenziale del terzo ordine (12.49), a un’equazione integro– differenziale del secondo ordine, imponendo la condizione asintotica su wµ in (12.48). A questo scopo moltiplichiamo l’equazione per e−s/τ e la riscriviamo nella forma, −m τ

d ¡ −s/τ µ ¢ e w (s) = e−s/τ F µ (s). ds

Integrando tra un generico istante s e un istante finale b otteniamo, ¡

m e

−s/τ

µ

w (s) − e

−b/τ

¢ 1 w (b) = τ

Z

b

µ

e−λ/τ F µ (λ) dλ.

s

Per imporre la condizione, lim wµ (b) = 0,

b→+∞ 55

F. Rohrlich, Classical charged particles, Addison–Wesley, Massachusetts, 1965.

362

(12.51)

eseguiamo nella (12.51) il limite per b → +∞, ottenendo 56 , Z 1 ∞ −λ/τ µ −s/τ µ me w (s) = e F (λ) dλ. τ s Dopo il cambiamento di variabile λ = ατ + s, si ottiene l’equazione integro–differenziale di Rohrlich,

Z



µ

m w (s) =

e−α F µ (s + τ α) dα.

(12.52)

0

Questa equazione `e ora del secondo ordine nelle derivate di y µ (s) – altamente non lineare in quanto F in generale `e una funzione complicata di y, u e della stessa w – che ammette, tuttavia, soluzione unica, note le condizioni iniziali y0 e u0 . L’equazione presuppone implicitamente l’esistenza dell’integrale a secondo membro nella (12.52). Abbiamo gi`a anticipato che il pregio principale di questa equazione `e la sua Lorentz– invarianza manifesta. Uno dei suoi difetti, invece, sta nel fatto che difficilmente essa pu`o essere usata per analizzare in concreto l’effetto della forza di frenamento sul moto della particella. Per esempio, nel caso della particella libera la forza effettiva si riduce a Fµ =

e2 6π

w2 uµ , ma non `e immediato risolvere la (12.52) esplicitamente – nemmeno in

questo caso semplice. Si pu`o, tuttavia, verificare che tra le soluzioni generali (12.40), le µν uniche che soddisfano la (12.52) con Fin = 0, sono quelle per cui K = 0.

12.3.1

Preaccelerazione e violazione della causalit` a

Eseguiamo ora un’analisi qualitativa delle soluzioni dell’equazione di Rohrlich. Come prima cosa osserviamo che l’accelerazione nel punto s non dipende solo dal valore della forza effettiva F µ in s, ma anche dai suoi valori in tutti gli istanti successivi s0 = s + τ α. Di nuovo riscontriamo, quindi, una violazione della causalit`a sotto forma di una preaccelerazione. Tuttavia, grazie alla presenza del fattore di damping e−α , che nell’integrale sopprime i contributi provenienti dai valori di α À 1, gli istanti che contribuiscono maggiormente all’accelerazione in s, sono quelli dell’ordine di s0 ∼ s + τ , in accordo con la (12.50). 56

Si noti che per una soluzione generica il termine e−b/τ wµ (b) diverge per b → +∞, nonostante la presenza del termine di smorzamento e−b/τ , perch´e wµ (b) diverge pi` u fortemente dell’esponenziale. Si veda in proposito la soluzione per la particella libera (12.40), nel qual caso, wµ (b) ∼ K · exp(b/τ ) · exp[K(exp(b/τ ))].

363

Per quantificare l’effetto della violazione della causalit`a riscriviamo la (12.52) nel modo seguente, m wµ (s) = F µ (s) + ∆F µ (s), Z ∞ µ ∆F (s) ≡ e−α [F µ (s + τ α) − F µ (s)] dα.

(12.53) (12.54)

0

Abbiamo cos`ı diviso la forza risultante in due contributi: il primo, F µ (s), rappresenta la forza “nominale” e dipende solo da s. Il secondo invece, ∆F µ (s), codifica la violazione della causalit`a. In particolare, confrontando la (12.53) con la (12.49) vediamo che questo ultimo eguaglia proprio il termine di Schott, ∆F µ (s) = m τ

dwµ . ds

La violazione della causalit`a sar`a quindi riscontrabile sperimentalmente, se ∆F µ `e apprezzabile rispetto a F µ . Per stimare ∆F µ notiamo che, come visto sopra, nell’integrale (12.54) i valori di α rilevanti sono dell’ordine dell’unit`a. Possiamo quindi porre F µ (s + τ α) ∼ F µ (s + τ ), e dare la stima, Z ∞ µ e−α [F µ (s + τ ) − F µ (s)] dα = F µ (s + τ ) − F µ (s). ∆F (s) ≈

(12.55)

0

∆F µ eguaglia, quindi, la variazione di F µ su una scala temporale dell’ordine di τ . Se questa variazione `e piccola rispetto a F µ , allora la violazione della causalit`a sar`a inosservabile. Di nuovo vediamo che il fenomeno della preaccelerazione risulta osservabile solo se i campi esterni variano in modo apprezzabile durante il tempo τ = 0.6 · 10−23 s. Si noti che in questo tempo la luce percorre lo spazio c τ ∼ r0 , pari al raggio classico della particella. Violazione della causalit` a e Meccanica Quantistica. Analizziamo ora l’effetto di campi variabili cos`ı rapidamente a livello quantistico

57

. Per campi che variano su una scala

temporale generica ∆T , il principio di Heisenberg predice un’indeterminazione in energia ~ dell’ordine di ∆ε ∼ . D’altra parte, la scala energetica alla quale si innesca la pro∆T duzione di coppie virtuali particella/antiparticella `e data da ∆ε ∼ 2m. Per raggiungere questa soglia `e allora necessario che i campi varino su una scala temporale dell’ordine di, ∆T ∼

~ 4π~ e2 ∼ 2 ∼ 137 τ. 2m e 6πm

57

L’analisi quantistica che segue va pensata svolta nel sistema di riferimento in cui la particella `e istantaneamente a riposo, dove valgono le leggi della Meccanica Quantistica non relativistica. In particolare, il tempo proprio s si identifica allora con il tempo t.

364

Per poter osservare una violazione della causalit`a in Elettrodinamica classica servirebbero, invece, campi che variano su una scala temporale τ , scala che `e di un fattore 137 pi` u piccola di ∆T ! Campi siffatti danno dunque luogo alla produzione di coppie, e si trovano quindi gi`a in forte regime quantistico. Concludiamo che la rottura classica della causalit`a `e schermata da effetti quantistici: nel regime in cui la violazione della causalit`a si manifesterebbe, l’Elettrodinamica classica non `e pi` u valida, e la rottura della causalit`a quindi inosservabile. A una conclusione analoga si arriva considerando una particella che si muove sotto l’effetto di una forza esterna, che le imprime una frequenza ω. In questo caso si ha, da (12.55), ∆F µ (s) ∼ τ

dF µ (s) ∼ τ ω F µ (s). ds

∆F µ (s) `e quindi apprezzabile rispetto a F µ (s) solo se la frequenza `e molto grande, del1 2π l’ordine di ω ∼ , ovverosia, dato che λ = , se la lunghezza d’onda della radiazione τ ω emessa `e molto piccola, dell’ordine di λ ∼ r0 . D’altra parte, l’ordine di grandezza delle lunghezze d’onda alle quali l’Elettrodinamica classica cessa di valere, `e rappresentato dalla lunghezza d’onda Compton, λC =

~ ∼ 137 r0 . m

Per lunghezze d’onda di questo ordine di grandezza incomincia a manifestarsi la natura quantistica del campo elettromagnetico, cio`e, la sua composizione in termini di fotoni. Per poter osservare la violazione della causalit`a servirebbero, invece, lunghezze d’onda dell’ordine di λ ∼ r0 , che sono di un fattore 137 pi` u piccole di λC . Per lunghezze d’onda cos`ı corte il campo elettromagnetico si trova gi`a in pieno regime quantistico, ed eventuali effetti acausali sono di nuovo inosservabili. Riassumendo possiamo quindi affermare che l’equazione di Lorentz–Dirac, ovverosia, la sua versione integro–differenziale di Rohrlich, d`a luogo a una violazione della causalit`a, che rende l’Elettrodinamica classica inconsistente. Tuttavia, da un punto di vista fenomenologico questa violazione avviene su scale di distanze, energie e tempi per cui l’Elettrodinamica classica non `e pi` u valida, e deve essere sostituita dalla teoria quantistica relativistica dei campi. 365

12.4

Il problema relativistico a due corpi

In questa sezione analizziamo il bilancio del quadrimomento nel problema a due corpi relativistico. Ci limiteremo a considerare due particelle cariche che percorrono orbite aperte, essendo sottoposte alla sola interazione elettromagnetica reciproca. Nel limite non relativistico queste orbite sono iperboli. Limite non relativistico. Riassumiamo prima la descrizione della dinamica di questo sistema nel limite non relativistico, v1,2 ¿ 1. Indicando le leggi orarie con ~y1,2 ≡ ~y1,2 (t), in questo caso le particelle obbediscono alle equazioni del moto e leggi della potenza, d~p1 ~ 2 (~y1 ), = e1 E dt d~p2 ~ 1 (~y2 ), = e2 E dt

dε1 ~ 2 (~y1 ), = e1 ~v1 · E dt dε2 ~ 1 (~y2 ), = e2 ~v2 · E dt

(12.56) (12.57)

dove i campi elettrici (di Lienard–Wiechert) non relativistici sono dati da, ~ 1 (~x) = e1 ~x − ~y1 , E 4π |~x − ~y1 |3

~ 2 (~x) = e2 ~x − ~y2 . E 4π |~x − ~y2 |3

~ 2 (~y1 ) + e2 E ~ 1 (~y2 ) = 0, e quindi si conserva la Vale il principio di azione e reazione e1 E quantit`a di moto totale p~1 + p~2 . Per quanto riguarda l’energia risulta invece, µ ¶ e1 e2 d(ε1 + ε2 ) d dεp =− ≡− , dt dt 4π|~y1 − ~y2 | dt

(12.58)

e si conserva l’energia “meccanica” ε1 + ε2 + εp . Siccome l’energia potenziale εp a t = ±∞ si annulla, si conserva pure l’energia cinetica totale ε1 + ε2 , tra t = −∞ e t = +∞. Indicando con “∆” la variazione tra questi due istanti asintotici abbiamo quindi, ∆pµ ≡ ∆(pµ1 + pµ2 ) = 0.

(12.59)

Diffusione relativistica. Consideriamo ora lo stesso processo a livello relativistico. In questo caso le (12.56), (12.57) devono essere sostituite dalle equazioni, vedi (12.24), ¶ µ e21 dw1µ dpµ1 2 µ = + w1 u1 + e1 F2µν (y1 ) u1ν , (12.60) ds1 6π ds1 µ ¶ e22 dw2µ dpµ2 2 µ = + w2 u2 + e2 F1µν (y2 ) u2ν , (12.61) ds2 6π ds2 µν dove F1,2 (x) sono i campi di Lienard–Wiechert prodotti dalle due particelle. In questo caso

non vale pi` u il principio di azione e reazione, e di conseguenza la (12.59) risulta violata. 366

Come sappiamo, il quadrimomento totale delle due particelle non si conserva durante il processo di diffusione a causa dell’emissione di radiazione – che nel limite non relativistico viene trascurata. In quanto segue vogliamo trovare la generalizzazione relativistica della (12.59). Per velocit`a arbitrarie le orbite delle particelle non sono pi` u iperboli, ma asintoticamente l’accelerazione `e ancora nulla, perch´e a grandi distanze la forza di mutua interazione svanisce

58

. Avremo quindi, lim uµ (s) = uµ± ,

lim wµ (s) = 0,

s→±∞

s→±∞

(12.62)

per entrambe le particelle. Integrando le (12.60), (12.61) tra s = −∞ e s = +∞, il termine di Schott allora non contribuisce, e risulta, Z Z e21 µ 2 µ ∆p1 = w1 u1 ds1 + e1 F2µν (y1 ) u1ν ds1 , 6π Z Z e22 µ 2 µ w2 u2 ds2 + e2 F1µν (y2 ) u2ν ds2 . ∆p2 = 6π

(12.63) (12.64)

Occupiamoci ora degli integrali che coinvolgono la forza di interazione reciproca. Esprimendo il tensore di Maxwell in termini del potenziale vettore abbiamo, Z Z µν e1 F2 (y1 ) u1ν ds1 = e1 [∂ µ Aν2 (y1 ) − ∂ ν Aµ2 (y1 )] u1ν ds1 Z Z dAµ (y1 ) µ ν = e1 ∂ A2 (y1 )u1ν ds1 − e1 ds1 ds1 Z = e1 ∂ µ Aν2 (y1 )u1ν ds1 − e1 (Aµ (∞) − Aµ (−∞)) Z = e1 ∂ µ Aν2 (y1 )u1ν ds1 , (12.65) dove abbiamo sfruttato il fatto che il potenziale vettore all’infinito spaziale si annulla. Per valutare il termine rimasto conviene usare l’espressione per il potenziale di Lienard– Wiechert data in (6.86), Aν2 (x)

e2 = 2π

Si ottiene, ∂

µ

Aν2 (x)

e2 = π

Z uν2 H(x0 − y20 ) δ((x − y2 )2 ) ds2 .

Z (xµ − y2µ ) uν2 H(x0 − y20 ) δ 0 ((x − y2 )2 ) ds2 ,

58 `

E sottinteso che selezioniamo le soluzioni “fische” delle (12.60), (12.61), che soddisfano le condizioni supplementari (12.32).

367

in quanto la derivata della funzione di Heaviside non contribuisce, e quindi, Z Z Z e1 e2 µ ν e1 ∂ A2 (y1 )u1ν ds1 = ds1 ds2 (y1µ − y2µ ) (u2 u1 ) H(y10 − y20 ) δ 0 ((y1 − y2 )2 ). π Sommando le (12.63) e (12.64), per la variazione del quadrimomento totale delle due particelle tra t = −∞ e t = +∞ si ottiene allora, Z Z e21 e22 µ 2 µ ∆p = w1 u1 ds1 + w22 uµ2 ds2 + (12.66) 6π 6π Z Z ¡ ¢ e1 e2 ds1 ds2 (y1µ − y2µ ) (u2 u1 ) H(y10 − y20 ) − H(y20 − y10 ) δ 0 ((y1 − y2 )2 ), π versione relativistica della (12.59). Al membro di destra abbiamo il contributo dei due termini di Larmor, che rappresentano la radiazione emessa dalle due particelle singolarmente. Ma poi compare un ulteriore termine, proporzionale a e1 e2 ed originante quindi dalle forze di mutua interazione, che `e dovuto all’interferenza tra i campi di radiazione delle due particelle. Per analizzare la natura delle varie correzioni relativistiche contenute nella (12.66) `e pi` u conveniente tornare alle equazioni di partenza (12.60) e (12.61), ed eseguirne un’espansione non relativistica. In questo modo saremo anche in grado di confrontarle direttamente con le (12.56), (12.57). 12.4.1

Espansione non relativistica

Di seguito eseguiremo un’espansione non relativistica in potenze di 1/c, delle equazioni (12.60) e (12.61). Dalle espansioni del paragrafo 12.2.4 sappiamo che le forze di frenamento cominciano con termini di ordine 1/c3 , e conosciamo anche la loro forma. Limitandoci a termini fino all’ordine 1/c3 , le componenti spaziali delle (12.60) e (12.61) si scrivono allora, d~p1 e21 d~a1 ~ = + F21 , dt 6πc3 dt

(12.67)

e22 d~a2 ~ d~p2 = + F12 , dt 6πc3 dt

(12.68)

dove abbiamo definito le forze di interazione, µ ¶ µ ¶ ~v1 ~v2 ~ ~ ~ ~ ~ ~ F21 = e1 E2 (y1 ) + × B2 (y1 ) , F12 = e2 E1 (y2 ) + × B1 (y2 ) . c c 368

(12.69)

Per quanto riguarda, invece, le leggi della potenza occorre valutare la componente 0 della forza di frenamento Γµ , vedi (12.31). In questo caso contribuiscono sia il termine di Larmor, che quello di Schott, 0

Γ

e2 1 q = 3 6πc 1−

µ

dw0 + w2 dt v2 c2 µ ¶ e2 d~a 1 = +o 5 . ~v · 3 6πc dt c



e2 = 6πc3

µ

d (~v · ~a) − |~a|2 dt



µ +o

1 c5



Arrestandoci all’ordine 1/c3 , le componenti µ = 0 delle (12.60), (12.61) si riducono allora a, dε1 e21 d~a1 ~ 2 (y1 ), = ~v1 · + e1 ~v1 · E 3 dt 6πc dt

(12.70)

dε2 e22 d~a2 ~ 1 (y2 ). = ~ v · + e2 ~v2 · E 2 dt 6πc3 dt

(12.71)

Si verifica facilmente che le (12.70), (12.71) sono conseguenze delle (12.67), (12.68), in quanto dalla relazione algebrica ε2 = c2 p2 + m2 c4 segue che, ε

d~p dε = c2 p~ · dt dt



dε d~p = ~v · . dt dt

Espansione non relativistica di potenziali e campi. Dalle formule scritte si vede che, per consistenza dell’approssimazione, `e necessario espandere il campo elettrico fino ai termini di ordine 1/c3 , e il campo magnetico fino ai termini di ordine 1/c2 . Dovremmo quindi sviluppare i campi di Lienard–Wiechert (6.107), (6.108) in serie di potenze di 1/c, arrestandoci agli ordini richiesti. Dal punto di vista tecnico questa operazione risulta complicata dal fatto che `e necessario sviluppare in serie di potenze di 1/c anche il tempo ritardato t0 (t, ~x). Difatti, per eseguire l’espansione non relativistica dei campi `e pi` u conveniente esprimere questi ultimi in termini dei potenziali di Lienard–Wiechert (6.93), ~ ~ = −∇A ~ 0 − 1 ∂A , E c ∂t

~ =∇ ~ × A, ~ B

(12.72)

e sviluppare dunque i potenziali. Dobbiamo allora espandere A0 fino ai termini di ordine ~ fino ai termini di ordine 1/c2 . Infine, invece di usare per il quadripotenziale la 1/c3 , e A formula (6.93), `e pi` u conveniente ripartire dalla rappresentazione integrale (6.48), ¶ µ Z 1 1 |~x − ~z| µ 3 µ A = dz j t− , ~z , (12.73) 4πc |~x − ~z| c 369

dove per una singola particella la corrente `e data da, j µ (t, ~x) = e V µ (t) δ 3 (~x − ~y (t)),

V µ (t) = (c, ~v (t)) .

Incominciamo espandendo la (12.73) in serie di potenze di 1/c, arrestandoci al terzo ordine, µ

A

1 = 4πc 1 = 4πc

µ

Z 3

dz Z

j µ (t, ~z) 1 ∂ dz − |~x − ~z| 4πc2 ∂t

Z

3

1 ∂2 + 8πc3 ∂t2 e = 4πc

3 µ z) j µ (t, ~z) 1 ∂j µ (t, ~z) 1 ∂ 2 j µ (t, ~z) 1 2 ∂ j (t, ~ − + 2 |~x − ~z| − |~ x − ~ z | 2 3 3 |~x − ~z| c ∂t 2c ∂t 6c ∂t

µ

Z

d3 z j µ (t, ~z)

1 ∂3 d z |~x − ~z| j (t, ~z) − 24πc4 ∂t3 3

µ

Z d3 z |~x − ~z|2 j µ (t, ~z)

¶ V µ 1 ∂V µ 1 ∂2 1 ∂3 ¡ 2 µ¢ µ − + 2 2 (rV ) − 3 3 r V , r c ∂t 2c ∂t 6c ∂t

dove abbiamo posto, ~r = ~x − ~y (t),

r = |~r|.

I potenziali, fino all’ordine richiesto, sono allora dati da, µ ¶ e 1 1 ∂ 2r 1 ∂ 3 r2 0 A = + − 3 3 , 4π r 2c2 ∂t2 6c ∂t ~ = A

e 4π

µ

~v ~a − 2 cr c

¶ .

Si noti che in A0 `e assente il contributo di ordine 1/c. Ricordiamo che le formule appena scritte costituiscono le espansioni non relativistiche dei potenziali di Lienard–Wiechert (6.93). Per determinare il campo elettrico occorre calcolare, µ ¶ e 1 ∂ 2 rb 1 d~a ~r 0 ~ −∇A = − − 3 , 4π r3 2c2 ∂t2 3c dt µ µ ¶ ¶ ~ e 1 ∂A 1 ∂ ~v 1 d~a = − − − 3 , c ∂t 4π c2 ∂t r c dt dove abbiamo posto, ~r rb = . r 370

(12.74)

(12.75)



Usando, ∂b r (b r · ~v ) rb − ~v = , ∂t r

∂r = −b r · ~v , ∂t

per valutare le derivate nelle (12.74), (12.75), le (12.72) danno allora, µ µ ¶ ¶ e ~r 1 ∂ ~v + (b r · ~v )b r 2 d~a ~ E = − + 3 4π r3 2c2 ∂t r 3c dt e = 4π ~ = B

µ

µ ¶ ¶ 1 (3(b r · ~v )2 − v 2 ) rb 2 d~a ~r − ~a + (b r · ~a) rb + + 3 , r3 2c2 r r 3c dt

e ~r ~v × 3 . 4πc r

(12.76)

(12.77)

(12.78)

~ il termine di ordine 1/c2 `e assente, perch´e ~a `e indipendente da ~x. Si noti che in B ~ si riconosce all’ordine pi` In E u basso il termine coulombiano, l’ordine 1/c2 comprende una correzione relativistica di tipo cinetico al campo coulombiano, mentre il termine di ordine 1/c3 rappresenta la radiazione, come vedremo tra poco. Insistiamo sul fatto che le (12.77), (12.78) costituiscono le espansioni non relativistiche dei campi di Lienard–Wiechert (6.107), (6.108). Determinazione di ∆pµ . Dati questi campi possiamo ora analizzare il trasferimento di quadrimomento dalle particelle al campo elettromagnetico durante il processo di diffusione. Consideriamo prima la quantit`a di moto. Valutando i campi (12.77) e (12.78) lungo le traiettorie delle due particelle, possiamo determinare la forza d’interazione totale F~12 + F~21 , usando le (12.69). Il campo coulombiano si cancella, e dopo un semplice conto si ricava che questa forza si pu`o scrivere come una derivata totale, µ ¶ 2 e1 e2 d 1 ~ ~ ~ · (~v1 + ~v2 )]m ~ ) + 3 (~a1 + ~a2 ) , F12 + F21 = − 2 (~v1 + ~v2 + [m 4π dt 2c r12 3c

(12.79)

dove abbiamo posto, r12 = |~y2 − ~y1 |,

m ~ =

~y2 − ~y1 . |~y2 − ~y1 |

Sommando le (12.67) e (12.68), e integrando tra t = −∞ e t = +∞ si trova allora, Z ∞³ ´ ~ ~ ∆ (~p1 + p~2 ) = F12 + F21 dt = 0, −∞

perch´e per t → ±∞ si ha ~a1,2 → 0, e 1/r12 → 0. Durante il processo di diffusione la quantit`a di moto totale delle due particelle dunque non cambia, nonostante si abbia 371

d(~p1 + p~2 )/dt 6= 0. Questo risultato `e evidentemente in accordo con il fatto che in approssimazione non relativistica, ovvero, in approssimazione di dipolo, la radiazione non trasporta quantit`a di moto, vedi paragrafo 7.3.2. Con ci`o abbiamo in particolare verificato che il membro di destra della parte spaziale dell’equazione (12.66) `e di ordine 1/c4 . Passiamo ora all’analisi del trasferimento di energia, sommando le (12.70) e (12.71). Usando la (12.76) si dimostra facilmente che la somma delle “potenze relative” si pu`o scrivere come, εp e1 e2 ~ 2 (y1 ) + e2 ~v2 · E ~ 1 (y2 ) = − de e1 ~v1 · E + dt 6πc3

¶ µ d~a2 d~a1 , ~v1 · + ~v2 · dt dt

(12.80)

dove abbiamo definito l’energia potenziale modificata, µ ¶ e1 e2 1 εep = 1 + 2 (~v1 · ~v2 + (m ~ · ~v1 )(m ~ · ~v2 )) . 4πr12 2c Nella (12.80) il termine di ordine zero `e il potenziale coulombiano non relativistico, vedi (12.58), i termini di ordine 1/c2 corrispondono a una correzione cinematica al potenziale coulombiano, mentre i termini di ordine 1/c3 rappresentano gli effetti dell’interferenza tra le radiazioni emesse dalle due cariche. Sommando le (12.70), (12.71) si ottiene in definitiva, d 1 d (ε1 + ε2 + εep ) = (e1~v1 + e2~v2 ) · (e1~a1 + e2~a2 ). 3 dt 6πc dt Integrando questa relazione tra t = −∞ e t = +∞, e sfruttando il fatto che all’infinito vale ancora εep → 0, si ottiene per la variazione dell’energia totale delle due particelle, 1 ∆(ε1 + ε2 ) = 6πc3

Z

d 1 dt (e1~v1 + e2~v2 ) · (e1~a1 + e2~a2 ) = − dt 6πc3

Z dt |e1~a1 + e2~a2 |2 . (12.81)

Abbiamo eseguito un’integrazione per parti, sfruttando di nuovo il fatto che per t → ±∞, si ha ~a1,2 → 0. Si noti che il risultato (12.81) `e in accordo con la formula (7.44), che d`a la potenza emessa da un generico sistema carico sotto forma di radiazione, in approssimazione di dipolo: in assenza di forze esterne l’energia totale del sistema “cariche + campo” si deve, infatti, conservare. Confrontando la (12.81) con la componente 0 della (12.66) si vede, infine, che i termini di Larmor vengono riprodotti correttamente nel limite non relativistico, mentre il termine di interferenza – la seconda riga nella (12.66) – `e dato 372

da, e1 e2 − 3πc3

Z dt (~a1 · ~a2 ),

modulo termini di ordine 1/c4 . Lagrangiana al secondo ordine. Per concludere osserviamo che la dinamica di un sistema di due particelle cariche – vedi le equazioni (12.67), (12.68) – tenendo conto delle correzioni relativistiche fino all’ordine 1/c2 pu`o essere dedotta dalla lagrangiana, ¶ µ 1 2 2 1 2 2 1 v14 1 v24 e1 e2 1 L = m 1 v1 + m 2 v2 + m 1 2 + m 2 2 − 1 − 2 (~v1 · ~v2 + (m ~ · ~v1 )(m ~ · ~v2 )) . 2 2 8 c 8 c 4πr12 2c La verifica `e lasciata per esercizio. Osserviamo, comunque, che i termini di ordine v 4 /c2 R Rp discendono dallo sviluppo dell’azione libera, −mc ds = −mc2 1 − v 2 /c2 dt, fino all’ordine 1/c2 . I termini del tipo v 2 /c2 r12 riproducono, invece, le correzioni di ordine 1/c2 alle forze (12.69), dove i campi elettrico e magnetico sono dati dalle (12.77), (12.78). Infine facciamo notare che i termini di ordine 1/c3 nelle equazioni (12.67), (12.68), non possono essere dedotti da una lagrangiana, il motivo essendo che questi termini sono lineari nelle derivate terze delle coordinate. Considerando una singola particella l’equazione da riprodurre sarebbe, m~a =

e2 d~a + ··· 6πc3 dt

Per motivi dimensionali la lagrangiana dovrebbe allora avere la forma, µ ¶ 1 e2 d~a 2 L = mv + 3 k1 ~v · ~a + k2 ~y · + ···, 2 c dt dove k1 e k2 sono costanti adimensionali. Tuttavia, i termini tra parentesi corrispondono a una derivata totale, d d~a = k1 ~v · ~a + k2 ~y · dt dt

µ

¶ k1 − k2 2 v . k2 ~y · ~a + 2

L d`a quindi luogo all’equazione del moto della particella libera. Riscontriamo di nuovo il fatto che l’equazione di Lorentz–Dirac non pu`o essere derivata da un principio variazionale, vedi paragrafo 12.2.3.

373

12.5

Problemi

12.1 Si dimostri che nel limite non relativistico l’equazione di Lorentz–Dirac (12.23), e la sua versione integro–differenziale (12.52), si riducono rispettivamente a, d~a ~ + e E, m ~a = m τ dt Z ∞ ~ + τ α) dα, m ~a(t) = e e−α E(t

(12.82)

0

~ `e il campo elettrico esterno. dove E a) Si dimostri che la seconda `e soluzione implicita della prima. ~ sia diverso da zero solo in una regione limitata dello spazio, e che b) Si supponga che E sia ivi costante e uniforme. Si determini esplicitamente il membro di destra della (12.82), e si discuta la violazione della causalit`a nell’equazione di Newton che ne risulta.

374

13

Un tensore energia–impulso privo di singolarit` a

Nel capitolo precedente abbiamo visto che il campo creato da una particella diverge nelle vicinanze della stessa come, F µν ∼

1 , r2

r = |~x − ~y (t)|,

e di conseguenza il tensore energia–impulso, µν = F µα Fα ν + Tem

1 µν αβ η F Fαβ , 4

(13.1)

1 . r4

(13.2)

diverge come, µν Tem ∼

Nel caso particolare di una particella statica nell’origine, per cui ~y (t) = 0, si ha, ~ = e ~x , E 4π r3

~ = 0, B

(13.3)

e, vedi (2.76)–(2.78), 1 ³ e ´2 1 , 2 4π r4 = 0, µ ¶ xi xj 1 ³ e ´2 1 ij δ −2 2 . = 2 4π r4 r

00 Tem =

(13.4)

0i Tem

(13.5)

ij Tem

(13.6)

µν Due problemi di Tem . L’andamento singolare (13.2) comporta due patologie, legate

tra di loro. La prima, gi`a menzionata nel capitolo 12, consiste nel fatto che gli integrali R 0µ 3 µ del quadrimomento totale Pem = Tem d x, sono divergenti. Nel caso particolare della particella statica si ha, Z εem =

00 Tem

1 ³ e ´2 d x= 2 4π 3

Z

1 3 d x = ∞, r4

Z i Pem

=

0i 3 Tem d x = 0,

(13.7)

e diverge solo l’energia, ma per una particella in moto arbitrario diverge anche la quantit`a di moto. Ovviamente divergono anche gli integrali del quadrimomento su un qualsiasi volume finito V contenente la particella. Si noti, comunque, che nelle analisi dei bilanci energetici svolte nei capitoli precedenti, il problema dell’energia infinita non `e mai intervenuto direttamente. La potenza irradiata coinvolge, infatti, il campo elettromagnetico a 375

grandi distanze dalla particella, dove esso `e regolare. D’altra parte la potenza irradiata si riferisce a differenze di valori di energia, e si pu`o supporre che nelle differenze le divergenze si cancellino. In effetti, quello che risulta osservabile in natura sono le differenze dei valori dell’energia di un sistema fisico, e non la sua energia stessa. Tuttavia, se si vuole dare un significato preciso all’affermazione “il quadrimomento si conserva”, `e necessario che il quadrimomento sia una grandezza finita. µν Il secondo problema consiste nel fatto che le componenti del tensore Tem non sono

distribuzioni temperate, ovvero, elementi di S 0 (R4 ): mentre le componenti di F µν sono distribuzioni, i loro prodotti, che compaiono nella (13.1), non lo sono. Ricordiamo che in generale prodotti di distribuzioni non definiscono distribuzioni. L’andamento (13.2) rappresenta, infatti, una singolarit`a non integrabile in R4 . Non essendo le componenti µν di Tem distribuzioni, le loro derivate non sono definite, e la domanda quanto valga la µν quadridivergenza ∂µ Tem `e quindi priva di senso, e la questione della conservazione del

quadrimomento dunque malposta. Si noti, in proposito, che l’espressione formale derivata µν per la quadridivergenza di Tem in (2.72), µν ∂µ Tem

=−

X

Z er

F νµ (yr )urµ δ 4 (x − yr ) dsr ,

(13.8)

r

`e, in realt`a, divergente. Il coefficiente F νµ (yr ) comprende, infatti, l’autocampo di Lienard– Wiechert della particella r–esima, che sappiamo essere divergente. Vediamo cos`ı che la µν dimostrazione della conservazione del tensore–energia impulso totale Tem +Tpµν , presentata

nel paragrafo 2.4.3, aveva solo validit`a formale, essendo per di pi` u basata sull’equazione di Lorentz orginale – che ora sappiamo pure divergere. Scopo di questo capitolo `e la costruzione di un tensore energia–impulso totale T µν , le cui componenti siano distribuzioni, che sia Lorentz covariante, a divergenza nulla e che ammetta integrali di quadrimomento finiti. La costruzione di per s`e risulter`a semplice, ma la dimostrazione che il tensore cos`ı costruito abbia le propriet`a richieste `e un po’ complicata, e verr`a riportata solo per il campo generato da una particella in moto rettilineo uniforme. Nella prossima sezione presentiamo la strategia che sta alla base della costruzione, e diamo un argomento euristico per la costruzione esplicita. In sezione 13.2 dimostriamo la 376

validit`a dell’approccio nel caso di una particella in moto rettilineo uniforme, e in sezione 13.3 presentiamo la sua generalizzazione ad un sistema di N particelle.

13.1

Linee guida della costruzione

Per costruire un tensore energia–impulso con le propriet`a desiderate a partire dalla (13.1), seguiamo una procedura simile a quella del capitolo 12, consistente di una regolarizzazione seguita da una rinormalizzazione. Consideriamo una particella singola, e mettiamo a zero µν il campo esterno Fin , supposto regolare, perch´e la sua presenza `e ininfluente per quanto

riguarda le singolarit`a del tensore energia–impulso. Il campo elettromagnetico totale `e allora dato dal solo campo di Lienard–Wiechert F µν di (12.13). Regolarizzazione. Dato che le singolarit`a di F µν sono localizzate nei punti dove si trovano le particelle, possiamo adottare ancora la regolarizzazione che abbiamo usato per dedurre l’equazione di Lorentz–Dirac, che tra l’altro preserva l’invarianza relativistica. Ripartiamo allora dal campo di Lienard–Wiechert regolarizzato, vedi (12.19), Fεµν

¯ =F ¯ µν ¯

λ→λε (x)

,

che costituisce, in effetti, una distribuzione regolare. Pi` u precisamente, le componenti di questo campo sono funzioni di classe C ∞ (R4 ), per ogni ε > 0. Illustriamo questa propriet`a per una particella statica nell’origine. Per il moto rettilineo uniforme il campo regolarizzato `e stato valutato nella (12.20), che per uµ = (1, 0, 0, 0) si riduce a, ~x ~ε = e E , 2 4π (r + ε2 )3/2

~ ε = 0. B

(13.9)

Questi campi sono effettivamente di classe C ∞ (R4 ), e come tali sono regolari in tutto lo spazio, compreso il punto ~x = 0, dove si trova la particella. In particolare, l’energia totale del campo elettromagnetico regolarizzato `e finita. Al posto di (13.7) abbiamo, infatti, εem,ε

1 = 2

Z

1 ³ e ´2 2 3 ~ |E ε | d x = 2 ε 4π

Z

³ e ´2 3π 2 r2 3 d x= . (r2 + 1)3 4π 8ε

(13.10)

Per valutare l’integrale abbiamo eseguito il cambiamento di variabili ~x → ε ~x e usato, Z

r2 3π 2 3 d x = . (r2 + 1)3 4 377

Si noti che per ε → 0 l’energia regolarizzata diverge di nuovo, come 1/ε. Tornando a un moto y µ (s) arbitrario notiamo che, essendo Fεµν una distribuzione regolare di classe C ∞ , risultano distribuzioni di Classe C ∞ anche i suoi prodotti. Possiamo allora definire un tensore energia–impulso elettromagnetico regolarizzato, ponendo, Tεµν ≡ Fεµα Fε α ν +

1 µν αβ η Fε Fε αβ . 4

(13.11)

Le componenti di questo tensore appartengono a S 0 per ogni ε > 0. Inoltre, per ogni xµ 6= y µ (s) esiste il limite puntuale, µν lim Tεµν (x) = Tem (x).

ε→0

Tuttavia, tale limite non esiste se eseguito nella topologia di S 0 , a causa delle singolarit`a µν presenti per xµ = y µ (s), e infatti Tem ∈ / S 0 ! Queste propriet`a sono molto evidenti nel caso

statico

59

.

Rinormalizzazione. Prima di poter eseguire il limite per ε → 0 nella topologia di S 0 , occorre quindi individuare e sottrarre “la parte divergente” di Tεµν , che indichiamo con Tbεµν . Questa sottrazione rappresenta la “rinormalizzazione”. Al tensore Tbεµν , che viene anche chiamato “controtermine”, richiediamo le seguenti propriet`a: 1) Deve essere un tensore sotto trasformazioni di Lorentz. 2) Deve essere supportato sulla traiettoria della particella, cio`e, Tbεµν (x) = 0, se xµ 6= y µ (s). 3) Deve essere simmetrico e a traccia nulla, come lo `e il tensore regolarizzato Tεµν , cio`e, ηµν Tbεµν = 0. 4) Deve essere tale che esista il tensore limite, ´ ³ 0 µν bµν . Θµν ≡ S − lim T − T em ε ε ε→0

(13.12)

Identifichiamo Θµν em con il tensore energia–impulso elettromagnetico rinormalizzato, che µν . sostituisce a tutti gli effetti il tensore originale, mal definito, Tem 59

Nel caso statico si ha, Tε00 =

1 ~ 2 1 ³ e ´2 r2 |Eε | = , 2 2 4π (r2 + ε2 )3

che per ε → 0 converge, per ogni ~x 6= 0, puntualmente a, 1 ³ e ´2 1 00 Tem = . 2 4π r4 Ma questa espressione non costituisce una distribuzione.

378

5) Tbεµν deve essere tale che il tensore energia–impulso totale del sistema campo + particella sia conservato, µν T µν ≡ Θµν em + Tp ,

∂µ T µν = 0,

dove per Tpµν manteniamo la forma standard (2.70). La richiesta 1) assicura che Θµν e un tensore sotto trasformazioni di Lorentz, dato che em ` anche Tεµν lo `e. La richiesta 2) `e motivata dai seguenti due fatti. Primo, nel complemento µν della traiettoria della particella il tensore energia–impulso totale originale Tem + Tpµν `e µν regolare e conservato. Secondo, la forma di Tem nel complemento della traiettoria `e

ben testata dal punto di vista fenomenologico, come abbiamo visto per esempio dalla 0i ~ × B) ~ i , che `e responsabile dell’irraggiamento. La procedura di componente Tem = (E µν rinormalizzazione non deve, dunque, cambiare il valore di Tem nel complemento della

traiettoria. Questo vuol dire che il supporto del controtermine deve essere la linea di universo della particella, e Tbεµν deve quindi essere una combinazione lineare della δ di Dirac e delle sue derivate, supportate sulla traiettoria. La richiesta 3) segue dal fatto che la parte divergente di un tensore simmetrico a traccia nulla, `e ancora un tensore simmetrico a traccia nulla. Il significato delle richieste 4) e 5) `e, invece, evidente. Si pu`o, infine, vedere che le richieste 1)–5) determinano il tensore Tbεµν univocamente, moduli termini di ordine o(ε) nella topologia di S 0 . Ci`o assicura in particolare l’unicit` a del tensore Θµν em , come definito in (13.12). Costruzione esplicita: un argomento euristico. Cerchiamo ora di sfruttare queste richieste per determinare euristicamente la forma di Tbεµν . Per la propriet`a 2) questo tensore deve essere proporzionale a δ 3 (~x − ~y (t)), o meglio, alla grandezza Lorentz–invariante, Z p δ 4 (x − y(s)) ds = 1 − v 2 (t) δ 3 (~x − ~y (t)). Inoltre, dato che Tεµν `e proporzionale alla carica al quadrato, tale dovr`a essere anche Tbεµν . Per la richiesta 4) il controtermine deve poi cancellare le parti divergenti di Tεµν , e quindi deve divergere per ε → 0. Visto l’esempio (13.10), ci aspettiamo che queste divergenze compaiano come poli in 1/ε. Includiamo allora in Tbεµν un fattore 1/ε. Queste considerazioni ci portano quindi a ipotizzare la forma, Z 1 ³ e ´2 µν b Tε = H µν δ 4 (x − y(s)) ds, ε 4π 379

dove H µν `e un tensore simmetrico e a traccia nulla. Essendo definito lungo la linea di universo, questo tensore deve dipendere dalle quantit`a cinematiche y µ (s), uµ (s), wµ (s) etc., e pu`o coinvolgere eventualmente le derivate spazio–temporali ∂µ . Inoltre, Tbεµν deve avere le stesse dimensioni di Tεµν , e dato che ε ha le dimensioni di una lunghezza, H µν deve essere adimensionale. Siccome uµ `e l’unica quantit`a cinematica adimensionale, H µν deve allora essere necessariamente della forma a uµ uν + b η µν , con a e b costanti. Ma dovendo essere anche a traccia nulla, si conclude che, µ ¶ 1 µν µν µ ν H =C u u − η , 4 per qualche costante numerica C. Si noti che contributi ad H µν del tipo y µ wν + y ν wµ − 1 µν ρ η y wρ , 2

oppure y µ ∂ ν + y ν ∂ µ − 12 η µν y ρ ∂ρ , che sarebbero pure adimensionali, simmetrici

e a traccia nulla, sono esclusi perch´e non invarianti sotto traslazioni, y µ → y µ + aµ . Le nostre richieste porterebbero allora alla seguente proposta per il tensore energia– impulso rinormalizzato, ¶ ¸ · Z µ 1 µν 4 C ³ e ´2 µν 0 µ ν µν δ (x − y(s)) ds , Θem = S − lim Tε − u u − η ε→0 ε 4π 4

(13.13)

dove l’unica quantit`a indeterminata `e la costante C. Questa costante dovrebbe essere fissata imponendo la richiesta 4), cio`e, che Tbεµν cancelli le parti divergenti di Tεµν , e la richiesta 5), cio`e, che il tensore energia–impulso totale risultante sia conservato. In effetti si pu`o dimostrare il risultato non banale che con la scelta, C=

π2 , 2

si riescono a soddisfare entrambe queste richieste. Siccome la dimostrazione di questo fatto per una particella in moto arbitrario `e abbastanza complicata

60

, ci limitiamo a

svolgerla nel caso di una particella libera.

13.2

Costruzione di Θµν em per la particella libera

Una particella libera si muove di moto rettilineo uniforme e genera i campi determinati in sezione 6.3. Data la Lorentz–invarianza della procedura appena congetturata, se essa 60

Si veda, K. Lechner and P.A. Marchetti, Variational principle and energy–momentum tensor for relativistic Electrodynamics of point charges, Ann. Phys. 322 (2007) 1162-1190, (hep-th/0602224).

380

ha successo in un sistema di riferimento particolare, allora ha automaticamente successo ` allora sufficiente considerare una particella statica in qualsiasi sistema di riferimento. E nell’origine, con ~y (t) = 0. Conosciamo gi`a i campi regolarizzati di una particella statica, vedi (13.9), e usando le (2.76)–(2.78) `e allora immediato scrivere le componenti del tensore energia–impulso regolarizzato (13.11), 1 ³ e ´2 r2 , 2 4π (r2 + ε2 )3 = 0, 1 ³ e ´2 δ ij r2 − 2 xi xj = . 2 4π (r2 + ε2 )3

Tε00 =

(13.14)

Tε0i

(13.15)

Tεij

(13.16)

Si noti che ηµν Tεµν = 0. Anche il controtermine in (13.13) `e facile da valutare, perch´e si R ha uµ = (1, 0, 0, 0), e δ 4 (x − y(s)) ds = δ 3 (~x). Inserendo le (13.14)–(13.16) nella (13.13), dovremmo allora, prima di tutto, stabilire l’esistenza dei limiti, ¶ µ 1 ³ e ´2 0 r2 3C 3 00 Θem = · S − lim − δ (~x) , ε→0 2 4π (r2 + ε2 )3 2ε Θ0i em = 0, µ ij 2 ¶ δ r − 2 xi xj C ij 3 1 ³ e ´2 0 ij · S − lim − δ δ (~x) , Θem = ε→0 2 4π (r2 + ε2 )3 2ε

(13.17) (13.18) (13.19)

per un’opportuna costante C. 13.2.1

Esistenza di Θµν em

Nella valutazione dei limiti che seguono risulter`a spesso necessario portare il limite sotto il segno di integrale, operazione non sempre lecita. A questo proposito `e utile il teorema della convergenza dominata, che enunciamo senza dimostrazione. Teorema della convergenza dominata. Sia data una successione di funzioni {fn } ∈ L1 ≡ L1 [RD ] tale che, a) esista il limite puntuale (quasi ovunque rispetto alla misura di Lebesgue in RD ), lim fn (x) = f (x),

n→∞

e, b) esista una funzione positiva g ∈ L1 , tale che (quasi ovunque rispetto alla misura di Lebesgue in RD ), |fn (x)| ≤ g(x), 381

∀ n.

Allora f ∈ L1 , e le fn convergono ad f nella topologia di L1 , L1 − lim fn = f. n→∞

Corollario. Il teorema assicura che la successione {fn } converge nella topologia di L1 . Ci`o `e sufficiente per poter portare il limite sotto il segno di integrale. Abbiamo, infatti, la maggiorazione, ¯ Z ¯ ¯Z ¯Z Z ¯ ¯ ¯ ¯ D D D ¯ fn d x − f d x¯ = ¯ (fn − f ) d x¯ ≤ |fn − f | dD x = ||fn − f kL1 . ¯ ¯ ¯ ¯ Siccome per n → ∞ si ha che fn → f in L1 , l’ultimo membro della maggiorazione converge a zero, e quindi converge a zero anche il primo. Abbiamo allora, Z Z Z D D lim fn d x = f d x = lim fn dD x, n→∞

n→∞

dove abbiamo usato la definizione di f . Concludiamo che, se le fn soddisfano le ipotesi del teorema della convergenza dominata, allora possiamo scambiare i segni di limite e di integrazione. Nei casi di nostro interesse al posto dell’indice discreto n avremo l’indice “continuo” ε. Inoltre, siccome il limite puntuale – ipotesi a) – esister`a sempre banalmente, per assicurare la validit`a del teorema si tratter`a di trovare una maggiorante g “uniforme”, ovvero, indipendente da ε, come richiesto dall’ipotesi b). µν Esistenza di Θ00 em . Cominciamo la dimostrazione dell’esistenza di Θem , dimostrando

l’esistenza del limite che definisce la componente Θ00 e, la densit`a di energia. In em , cio` particolare vorremo ottenere una definizione operativa per questa distribuzione, ovverosia, una definizione che ci permetta di determinare esplicitamente l’energia contenuta in un volume qualsiasi. Secondo la definizione del limite nel senso delle distribuzioni, dobbiamo dimostrare che per un’opportuna costante C esiste il limite ordinario, ·Z ¸ 3C r2 ϕ(~x) 3 1 ³ e ´2 00 lim d x− ϕ(0) , Θem (ϕ) ≡ 2 4π ε→0 (r2 + ε2 )3 2ε per ogni funzione di test ϕ ∈ S(R3 )

61

. Sottraendo e aggiungendo ϕ(0) nel numeratore

dell’integrando, e notando che si ha l’integrale, Z 3 π2 r2 3 d x = , (r2 + ε2 )3 4ε 61

Lo spazio delle funzioni di test da usare sarebbe S(R4 ), ma nel caso statico la dipendenza dal tempo `e banale e pu`o essere omessa.

382

otteniamo, Θ00 em (ϕ)

1 ³ e ´2 = lim 2 4π ε→0

·Z

r2 (ϕ(~x) − ϕ(0)) 3 3 d x+ 2 2 3 (r + ε ) 2ε

µ

¶ ¸ π2 − C ϕ(0) . 2

(13.20)

Il limite per ε → 0 dell’integrale a secondo membro `e ora finito. Per farlo vedere separiamo nella regione d’integrazione gli r piccoli da quelli grandi, Z 2 Z Z r (ϕ(~x) − ϕ(0)) 3 r2 (ϕ(~x) − ϕ(0) − xi ∂i ϕ(0)) 3 r2 (ϕ(~x) − ϕ(0)) 3 d x = d x+ d x. (r2 + ε2 )3 (r2 + ε2 )3 (r2 + ε2 )3 r<1 r>1 (13.21) Nel primo integrale abbiamo sottratto un termine che `e nullo, in quanto si annulla l’inR tegrale sugli angoli ni dΩ, dove ni = xi /r. Nel primo integrale possiamo ora portare il limite sotto il segno di integrale, usando il teorema della convergenza dominata. Abbiamo infatti la maggiorazione uniforme, ¯ 2 ¯ ¯ r (ϕ(~x) − ϕ(0) − xi ∂i ϕ(0)) ¯ |ϕ(~x) − ϕ(0) − xi ∂i ϕ(0))| ¯ ¯≤ ≡ g(~x) ∈ L1 (R3 ), ¯ ¯ (r2 + ε2 )3 r4 dove `e sottointeso che per r > 1 poniamo g = 0. La maggiorante g sta in L1 (R3 ), perch´e il numeratore ϕ(~x) − ϕ(0) − xi ∂i ϕ(0) si annulla come r2 , per r → 0. In questo caso particolare la maggiorante coincide con il modulo della funzione limite. Per portare il limite sotto il segno di integrale nel secondo integrale della (13.21), `e sufficiente usare la maggiorazione,

¯ 2 ¯ ¯ r (ϕ(~x) − ϕ(0)) ¯ 2 ||ϕ|| 3 ¯ ¯ ¯ (r2 + ε2 )3 ¯ ≤ r4 ≡ g(~x) ∈ L1 (R ),

dove con ||ϕ|| intendiamo l’estremo superiore del modulo di ϕ in R3 , ed `e sottinteso che g = 0 per r < 1. Portando nella (13.21) i limiti sotto i segni di integrale, otteniamo allora il limite finito, Z 2 Z Z ϕ(~x) − ϕ(0) − xi ∂i ϕ(0) 3 ϕ(~x) − ϕ(0) 3 r (ϕ(~x) − ϕ(0)) 3 d x= d x+ d x. lim 2 2 3 4 ε→0 (r + ε ) r r4 r<1 r>1 (13.22) Concludiamo che per ottenere un limite finito nella (13.20), `e necessario e sufficiente scegliere, C=

π2 . 2

Se nel primo integrale della (13.22) facciamo precedere l’integrazione su r dall’integrazione sugli angoli, il terzo termine non contribuisce, e la somma dei due integrali si pu`o scrivere 383

di nuovo come un integrale unico su tutto R3 . La densit`a di energia rinormalizzata si pu`o allora scrivere semplicemente come, Θ00 em (ϕ)

1 ³ e ´2 = 2 4π

Z

ϕ(~x) − ϕ(0) 3 d x, r4

(13.23)

dove, per costruzione, l’integrazione sugli angoli deve precedere l’integrazione su r (“convergenza condizionata”). In modo completamente analogo si dimostra che, per lo stesso valore di C, esiste anche il limite (13.19), e che risulta, Θij em (ϕ)

1 ³ e ´2 = 2 4π

Z

¢ 3 ϕ(~x) − ϕ(0) ¡ ij 2 i j δ r − 2 x x d x. r6

(13.24)

Nella dimostrazione conviene fare uso degli integrali invarianti del problema 2.6, scrivendo xi xj = ni nj r2 . Abbiamo quindi concluso la dimostrazione dell’esistenza del limite (13.13), secondo la richiesta 4). 13.2.2

Conservazione di Θµν em

Affrontiamo ora la richiesta 5), cio`e, la conservazione del tensore energia–impulso. Per una particella in moto rettilineo uniforme, il quadrimomento del campo elettromagnetico si deve conservare separatamente, perch´e il quadrimomento della particella `e costante. Dobbiamo quindi dimostrare che vale, ∂µ Θµν em = 0. La componente ν = 0 di questa equazione `e banalmente soddisfatta, perch´e Θi0 em = 0, e Θ00 em non dipende dal tempo. Resta quindi da verificare la componente ν = j, che si riduce a, ∂i Θij em = 0,

(13.25)

equazione non ovvia. Si vede, quindi, che anche per la particella libera la conservazione del tensore energia–impulso rinormalizzato non `e garantita a priori. Per dimostrare che e pi` u conveniente usare la Θij em soddisfa la (13.25), invece di usare direttamente la (13.24) ` definizione originale (13.19), e sfruttare il fatto che la derivata `e un’operazione continua in S 0 . Ci`o ci permette di scambiare i limiti con le derivate. Ponendo C = π 2 /2 e prendendo 384

la divergenza della (13.19), si ottiene allora, ¶ µ µ ij 2 ¶ 1 ³ e ´2 0 δ r − 2 xi xj π2 ij 3 ∂i Θem = · S − lim ∂i − ∂j δ (~x) . ε→0 2 4π (r2 + ε2 )3 4ε

(13.26)

Siccome il primo termine `e una distribuzione regolare, le sue derivate possono essere calcolate nel senso delle funzioni, µ ij 2 ¶ µ ¶ δ r − 2 xi xj xj ε 2 ε2 ∂i = −6 2 = ∂j . (r2 + ε2 )3 (r + ε2 )4 (r2 + ε2 )3 La (13.26) pu`o allora essere riscritta come, µ · ¸¶ 1 ³ e ´2 ε2 π2 3 ij 0 ∂i Θem = ∂j S − lim − δ (~x) . ε→0 (r 2 + ε2 )3 2 4π 4ε Abbiamo di nuovo scambiato le derivate con il limite. Questo passaggio `e lecito, purch´e il limite della distribuzione tra parentesi quadre esista. In realt`a questo limite `e zero. Per dimostrarlo occorre fare vedere che per ogni ϕ ∈ S, `e zero il limite per ε → 0 della quantit`a, Z 2

ε

ϕ(~x) π2 dx 2 − ϕ(0) = ε2 (r + ε2 )3 4 ε

Z

3

ϕ(~x) − ϕ(0) dx = (r2 + ε2 )3 3

Z d3 x

ϕ(ε~x) − ϕ(0) , (13.27) ε (r2 + 1)3

dove abbiamo usato l’integrale, Z

d3 x π2 = . (r2 + ε2 )3 4 ε3

Nell’ultimo integrale della (13.27) possiamo ora portare il limite sotto il segno di integrale, sfruttando il teorema della convergenza dominata. In questo caso la successione integranda, fε (~x) ≡

ϕ(ε~x) − ϕ(0) , ε (r2 + 1)3

pu`o essere maggiorata usando la stima, Z

1

ϕ(ε~x) − ϕ(0) = ε~x ·

~ ∇ϕ(ε~ x α) dα



|ϕ(ε~x) − ϕ(0)| ≤ 3 εr ||∂ϕ||,

0

dove con ||∂ϕ|| intendiamo l’estremo superiore dei moduli delle derivate parziali di ϕ in R3 . Abbiamo allora la maggiorazione uniforme, ipotesi b), |fε (~x)| ≤

3r||∂ϕ|| ≡ g(~x) ∈ L1 [R3 ]. (r2 + 1)3 385

D’altra parte la successione fε ammette il limite puntuale ∀ ~x, ipotesi a), lim fε (~x) =

ε→0

xi ∂i ϕ(0) ≡ f (~x). (r2 + 1)3

Portando dunque nella (13.27) il limite sotto il segno di integrale risulta, µ Z ¶ Z Z i ϕ(~x) π2 ϕ(ε ~x) − ϕ(0) 2 3 3 3 x ∂i ϕ(0) lim ε dx 2 − ϕ(0) = d x lim = d x = 0, ε→0 ε→0 (r + ε2 )3 4 ε ε (r2 + 1)3 (r2 + 1)3 (13.28) dove la conclusione deriva dal fatto che, scrivendo xi = ni r, l’integrazione sugli angoli d`a R dΩ ni = 0. Segue la (13.25). Concludiamo che il tensore energia–impulso definito dalle (13.17)–(13.19) soddisfa, ∂µ Θµν em = 0. 13.2.3

(13.29)

Una definizione operativa dell’energia elettromagnetica

La costruzione del paragrafo 13.2.1 ha fornito in particolare una definizione operativa per la densit`a di energia Θ00 em – la (13.23) – che permette di determinare esplicitamente l’energia contenuta in un arbitrario volume V . Indichando con χV (~x) la funzione caratteristica del volume V , la (13.23) ci dice, infatti, come calcolare l’energia contenuta in V , Z Z 1 ³ e ´2 χV (~x) − χV (0) 3 00 3 00 d x. εem,V = Θem d x = Θem (χV ) = 2 4π r4 V Da questa formula, ma equivalentemente anche dalla (13.17), vediamo che l’energia cos`ı definita ha le seguenti propriet`a: 1) εV `e finita ∀ V , il cui bordo non contenga l’origine, cio`e, la particella. ¡ e ¢2 R 00 3 00 2) Se V non contiene l’origine, allora εV = V Tem d x, dove Tem = 12 4π

1 . r4

2

e 3) Se VR `e una palla di raggio R centrata nell’origine, allora εem,VR = − 8πR .

4) Se VeR indica il complemento di VR in R3 , allora εem,VeR =

e2 . 8πR

5) εem,R3 = 0, cio`e, l’energia totale del campo elettromagnetico di una particella statica `e zero, cos`ı come `e zero pure la sua quantit`a di moto totale, vedi la (13.18). Abbiamo quindi,

Z µ Pem



3 Θ0µ em d x = 0.

(13.30)

6) L’energia cos`ı definita riproduce, in particolare, la sottrazione che si opera di solito “a mano” nel caso di un sistema di cariche non relativistiche, vedi problema 2.8. 386

Moto rettilineo uniforme generico. Grazie all’invarianza di Lorentz della nostra procedura, tutti questi risultati si estendono automaticamente a un moto rettilineo uniforme generico. Possiamo allora riassumere le conclusioni di questo paragrafo come segue. Per un moto rettilineo uniforme il tensore energia–impulso Θµν em dato in (13.13), con C = π 2 /2, definisce una distribuzione Lorentz–covariante, simmetrica, e conservata, νµ Θµν em = Θem .

∂µ Θµν em = 0, Gli integrali a tempo fissato,

Z µ Pem,V

= V

3 Θµ0 em d x,

esistono finiti per ogni V , e rappresentano il quadrimomento del campo elettromagnetico contenuto nel volume V . Se in un dato istante la particella non `e contenuta in V allora si ha,

Z µ Pem,V

= V

µ0 3 Tem d x,

coincidente con il quadrimomento fornito dal tensore energia–impulso originale. Il quadrimomento totale del campo della particella `e zero, Z µ Pem

13.3

=

3 Θµ0 em d x = 0.

Costruzione generale

In questa sezione presentiamo, senza dimostrazione, la generalizzazione dei risultati delle sezioni precedenti al caso di un sistema di N particelle in moto arbitrario. Consideriamo N particelle puntiformi che interagiscono tra di loro, e con un campo µν esterno Fin . Ciascuna di queste particelle produce allora un campo di Lienard–Wiechert,

che indichiamo con Frµν , r = 1, · · · , N . Il campo elettromagnetico totale del sistema `e dunque dato da, µν F µν = Fin +

X

Frµν .

(13.31)

r

Ciascuno dei campi di Lienard–Wiechert pu`o essere regolarizzato secondo la (12.19), dando luogo al campo Frµνε . Come campo elettromagnetico totale regolarizzato del sistema 387

definiamo allora, µν Fεµν = Fin +

X

Frµνε .

r

Definiamo poi il tensore energia–impulso regolarizzato come, Tεµν = Fεµα Fε α ν +

1 µν αβ η Fε Fε αβ . 4

Il tensore energia–impulso rinormalizzato segue allora dalla ricetta (13.13), " # ¶ ´2 Z µ 2 X³ 1 π e r µν 0 uµr uνr − η µν δ 4 (x − yr ) dsr . Θµν em = S − lim Tε − ε→0 2 ε r 4π 4

(13.32)

Si noti che il controtermine `e dato semplicemente dalla somma dei controtermini delle singole particelle. Questa scelta discende dal fatto che le mutue interazioni tra le particelle, corrispondenti ai prodotti dei campi di Lienard–Wiechert di particelle differenti, danno luogo in Tεµν a singolarit`a integrabili di tipo 1/r2 , che sono ben definite nel senso delle distribuzioni. In particolare si dimostrano i seguenti due teoremi, si veda la nota 60. Teorema A. Il limite distribuzionale in (13.32) esiste, qualsiasi siano le traiettorie delle particelle. Inoltre, il quadrimomento totale del campo elettromagnetico, Z µ 3 Pem ≡ Θµ0 em d x, `e finito, purch´e l’accelerazione delle particelle svanisca con sufficiente rapidit`a per t → −∞. Teorema B. Per traiettorie arbitrarie delle particelle – non soggette a nessuna equazione del moto – la divergenza di Θµν e data da, em , come definito in (13.32), ` ¶ ¶ X Z µ e2 µ dwν r r 2 ν νµ µν + wr ur + er Fr (yr )urµ δ 4 (x − yr ) dsr , ∂µ Θem = − 6π ds r r dove abbiamo definito, µν Frµν = Fin +

X

(13.33)

Fsµν .

s6=r

Questa relazione `e la controparte – ben definita – della relazione formale (13.8). Confrontando le due relazioni, e tenendo conto della (13.31), si vede che `e come se nella (13.8) la νµ forza di frenamento divergente µ ν er Fr ¶(yr )urµ , fosse stata sostituita con la forza di frena2 e dwr mento ben definita r + wr2 uνr . In particolare, per una particella singola in moto 6π dsr rettilineo uniforme, e quindi in assenza di forze esterne, la (13.33) si riduce alla (13.29).

388

Mantenendo per il tensore energia–impulso delle particelle l’espressione (2.70), Tpµν

=

X

Z mr

uµr uνr δ 4 (x − yr ) dsr ,

r

si ha ancora, vedi paragrafo 2.4.3, ∂µ Tpµν

X Z dpν r 4 = δ (x − yr ) dsr . ds r r

Considerando come tensore energia–impulso totale del sistema la somma, µν T µν = Θµν em + Tp ,

si ottiene dunque, ∂µ T

µν

µ ¶ ¶ X Z µ dpν e2r dwrν r νµ 2 ν = − + wr ur − er Fr (yr )urµ δ 4 (x − yr ) dsr . dsr 6π dsr r

Se si vuole, infine, che il quadrimomento totale sia conservato localmente, ∂µ T µν = 0, allora occorre dunque che le cariche soddisfino le equazioni di Lorentz–Dirac (12.24), µ ¶ dpµr e2r dwrµ 2 µ = + wr ur + er Frµν (yr ) urν . dsr 6π dsr Vediamo che, in ultima analisi, `e la richiesta della conservazione del quadrimomento ad imporre che le particelle soddisfino queste equazioni del moto del terzo ordine. Questa richiesta va, quindi, considerata come la causa ultima di tutti gli aspetti problematici che queste equazioni comportano.

389

14

Monopoli magnetici

Nelle equazioni dell’Elettrodinamica i campi elettrico e magnetico giocano sotto certi aspetti ruoli molto simili, ma sotto altri hanno funzioni completamente diverse. In assenza di sorgenti le similitudini tra questi campi sono evidenti se si considerano le equazioni di ~ e Maxwell in notazione tridimensionale (2.28)–(2.31). In questo caso le equazioni per E ~ sono difatti identiche, a parte un segno. B D’altra parte nell’equazione di Lorentz, ³ ´ d~p ~ ~ = e E + ~v × B , dt questi campi giocano ruoli molto diversi, in particolare il campo magnetico `e soppresso di un fattore v/c rispetto al campo elettrico. Ma la differenza pi` u significativa emerge in presenza di sorgenti non nulle: cariche statiche generano infatti solo un campo elettrico, e nessun campo magnetico. In altre parole essendo, ~ ·E ~ = j 0, ∇

~ ·B ~ = 0, ∇

l’Elettrodinamica classica non prevede cariche magnetiche, ma solo cariche elettriche. In questo capitolo esploreremo la possibilit`a di introdurre in Elettrodinamica particelle dotate di carica magnetica, i cosiddetti monopoli magnetici. A priori questa impresa sembra avere poche possibilit`a di successo perch´e la struttura interna di questa teoria appare molto rigida, essendo sorretta da vari requisiti che sono in delicato equilibrio tra di loro, come l’invarianza relativistica e la conservazione della carica elettrica, del quadrimomento e del momento angolare. Sappiamo poi che queste propriet`a sono intimamente legate tra di loro. Qualsiasi modifica ad hoc delle equazioni di Maxwell e dell’equazione di Lorentz rischia quindi di compromettere la consistenza interna della teoria. Alla luce di questo fatto il risultato principale del presente capitolo, cio`e, che l’Elettrodinamica classica resta perfettamente consistente anche in presenza di monopoli magnetici, deve essere considerato un risultato altamente non banale. L’introduzione di monopoli magnetici in Elettrodinamica fu in effetti presa in considerazione gi`a all’inizio del secolo scorso 62 , e rie62

Vedi per esempio, H. Poincar´e, Compt. Rendus 123 (1896) 530, e J.J. Thomson, Electricity and Matter, Scribners, New York, 1904, p. 26.

390

saminata a livello quantistico pochissimi anni dopo l’avvento della Meccanica Quantistica da Dirac. Una volta accertato che i monopoli magnetici sono compatibili con la struttura generale dell’Elettrodinamica, l’ipotesi di questo nuovo tipo di particelle assume una certa rilevanza anche da un punto di vista sperimentale. Il dato sperimentale in questione `e la quantizzazione della carica elettrica, cio`e, il fatto che tutte le cariche elettriche presenti in natura sono multipli interi di una carica fondamentale – fenomeno che tuttora attende una spiegazione teorica. Ebbene, come dimostrato da P.A.M. Dirac nel 1931, se in natura esiste anche un solo monopolo magnetico allora la consistenza dell’Elettrodinamica quantistica comporta automaticamente la quantizzazione della carica elettrica. Nella sezione finale di questo capitolo presenteremo una deduzione semiclassica di questa “condizione di quantizzazione di Dirac”.

14.1

La dualit` a elettromagnetica

Riprendiamo le equazioni di Maxwell nel vuoto, −

~ ∂E ~ ×B ~ +∇ ∂t ~ ·E ~ ∇ ~ ∂B ~ ×E ~ +∇ ∂t ~ ·B ~ ∇

= 0,

(14.1)

= 0,

(14.2)

= 0,

(14.3)

= 0.

(14.4)

Come si vede questo insieme di equazioni resta invariato se si eseguono le sostituzioni, ~ → B, ~ E

~ → −E. ~ B

(14.5)

Queste trasformazioni generano un gruppo discreto di simmetrie che viene chiamato “dualit`a elettromagnetica”, o semplicemente “dualit`a”. Si verifica facilmente che il gruppo in questione `e Z4 . Infatti, `e sufficiente notare che se si esegue la trasformazione generatrice (14.5) due volte, si ottiene meno l’identit`a. In presenza di cariche elettriche questa simmetria `e evidentemente violata – per via della presenza di sorgenti solo nella prima coppia di equazioni.

391

Per dare valenza relativistica alla dualit`a elettromagnetica introduciamo il “tensore elettromagnetico duale”, antisimmetrico anche’esso

63

,

1 Feµν ≡ εµνρσ Fρσ . 2

(14.6)

γ δ Eseguendo l’operazione di dualit`a due volte e notando l’identit`a εαβγδ εαβµν = −4δ[µ δν] si

ottiene, 1 e µν Fe = εµνρσ Feρσ = −F µν . 2

(14.7)

In termini del tensore elettromagnetico duale le trasformazioni di dualit`a (14.5) corrispondono difatti semplicemente alle sostituzioni, F µν → Feµν ,

Feµν → −F µν .

(14.8)

Per vederlo `e sufficiente determinare i campi elettrico e magnetico “duali”. Usando la definzione (14.6) si trova infatti, e i ≡ Fei 0 = 1 εi0jk Fjk = − 1 εijk F jk = B i , E 2 2 1 1 e i ≡ − εijk Fejk = − εijk εjkl0 Fl0 = − 1 εijk εljk E l = −E i , B 2 2 2

(14.9) (14.10)

in accordo con (14.5). ` anche immediato verificare che le due coppie di equazioni di Maxwell, precedenteE mente chiamate “equazione di Maxwell” e “identit`a di Bianchi”, si possono scrivere nella forma equivalente, ∂µ F µν = jeν ,

(14.11)

∂µ Feµν = 0,

(14.12)

dove abbiamo introdotto il pedice “e” per indicare che si tratta della quadricorrente elettrica. Risulta allora chiaro che se si vogliono mantenere le equazioni di Maxwell invarianti 63 L’operazione di contrazione di un tensore completamente antisimmetrico di rango n con il tensore di Levi–Civita si chiama “dualit`a di Hodge”. Il risultato dell’operazione `e un tensore completamente antisimmetrico di rango D−n, se D `e la dimensione ³ ´ dello spazio–tempo. Da un conteggio delle componenti indipendenti di un tensore antisimmetrico, D per la precisione, ci si convince facilmente che questa n mappa preserva il numero di componenti. La dualit`a di Hodge `e infatti una biiezione tra lo spazio dei tensori antisimmetrici di rango n e quello dei tensori antisimmetrici di rango D − n.

392

sotto le trasformazioni di dualit`a (14.8) in presenza di sorgenti, allora `e necessario introdurre anche delle “sorgenti magnetiche” al membro di destra dell’identit`a di Bianchi (14.12). L’introduzione di una quadricorrente magnetica nell’identit`a di Bianchi comporta a priori vari aspetti problematici riguardo alla consistenza interna della teoria modificata. Esponiamo qu`ı di seguito l’aspetto che risulta il pi` u problematico di tutti. Supponiamo pure di introdurre una quadricorrente magnetica nella (14.12) e di preservare in questo modo l’invarianza di Poincar´e delle equazioni del moto. Sussistendo tale invarianza sappiamo che `e garantita la conservazione del quadrimomento e del momento angolare totali, se esiste un’azione invariante per trasformazioni di Poincar´e, dalla quale queste equazioni possono essere dedotte. Ma, come abbiamo visto, per scrivere un’azione `e necessario introdurre un potenziale vettore Aµ . In assenza di correnti magnetiche l’identit`a di Bianchi stessa `e equivalente all’esistenza di un potenziale vettore, ma in presenza di tali correnti l’identit`a di Bianchi `e violata e non esiste nessun modo naturale per introdurre un potenziale vettore. In effetti si pu`o far vedere che in presenza di correnti magnetiche non esiste nessuna azione canonica

64

. La conservazione del quadrimomento e del momento

angolare non `e quindi pi` u garantita a priori. Nonostante ci`o, come faremo vedere nella prossima sezione, esiste un modo consistente per modificare le equazioni di Maxwell e di Lorentz in presenza di monopoli magnetici, che preserva l’invarianza di Poincar´e e mantiene tutte le leggi di conservazione dell’Elettrodinamica con sole cariche – un risultato altamente non banale alla luce del fatto che non esiste un’azione canonica.

14.2

L’Elettrodinamica classica in presenza di dioni

In questa sezione proponiamo un nuovo insieme di equazioni fondamentali per l’Elettrodinamica – in sostituzione delle (2.12)–(2.14) – che descrivono la dinamica di un arbitrario 64

Per scrivere un’azione si deve rinunciare ad almeno una delle propriet`a base che si richiedono di solito a un’azione, per esempio la localit`a, oppure l’invarianza di Lorentz manifesta. Ciononostante le equazioni del moto che si ottengono da queste azioni sono locali e Lorentz–invarianti. Tuttavia, l’assenza di un’azione manifestamente Lorentz–invariante crea gravi problemi qualora si cerchi di quantizzare la teoria. Questa difficolt`a ha ritardato di molto la dimostrazione della consistenza quantistica della teoria dei monopoli magnetici, avvenuta solo nel 1979.

393

sistema di particelle che portano sia carica elettrica che carica magnetica, i cosiddetti dioni. Consideriamo dunque un sistema di N particelle puntiformi con masse mr e linee di universo yrµ (sr ), dotate – oltre che di carica elettrica er – di carica magnetica gr . Se per una particella si ha er 6= 0, gr 6= 0 essa viene chiamata “dione”, se er 6= 0, gr = 0 la si chiama carica (elettrica), e se er = 0, gr 6= 0 essa viene chiamata monopolo (magnetico). A questo sistema di particelle possiamo associare le quadricorrenti elettriche e magnetiche, jeµ

=

X

Z

r

µ jm

=

X

uµr δ 4 (x − yr ) dsr ,

er Z gr

uµr δ 4 (x − yr ) dsr .

r

Allo stesso modo in cui si `e dimostrato che la corrente elettrica `e conservata, si dimostra che `e conservata anche quella magnetica. Abbiamo quindi, ∂µ jeµ = 0,

µ ∂µ jm = 0,

(14.13)

qualsiasi siano le cariche er e gr . In particolare la carica magnetica totale G =

R

0 3 jm dx

risulta conservata. Proponiamo la seguente modifica delle equazioni di Maxwell, ∂µ F µν = jeν ,

(14.14)

ν ∂µ Feµν = jm .

(14.15)

Intanto vediamo che queste equazioni sono compatibili con le (14.13), in quanto sia F che Fe sono tensori antisimmetrici. Inoltre ora possiamo ristabilire l’invarianza per dualit`a se poniamo le seguenti trasformazioni, F → Fe,

Fe → −F,

je → jm ,

jm → −je ,

(14.16)

cio`e, per quanto riguarda le cariche, er → gr ,

gr → −er .

394

(14.17)

L’invarianza sotto queste trasformazioni `e anche evidente se si scrivono le nuove equazioni di Maxwell nel formalismo tridimensionale, ~ ·E ~ ∇ ~ ~ ×B ~ − ∂E ∇ ∂t ~ ~ ∇·B ~ ~ ×E ~ − ∂B −∇ ∂t

= je0 ,

(14.18)

= ~je ,

(14.19)

0 = jm ,

(14.20)

= ~jm .

(14.21)

Notiamo che, anche in presenza di dioni, l’identit`a di Bianchi modificata pu`o essere scritta in tre modi equivalenti, ν ∂µ Feµν = jm . α ∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν = −εµνρα jm 1 α ∂[µ Fνρ] = − εµνρα jm . 3

(14.22)

Dalle (14.18)–(14.21) si vede che, il campo magnetico `e ora generato non solo da cariche elettriche in moto, ma anche da monopoli magnetici statici, cos`ı come il campo elettrico sar`a ora generato non solo da cariche elettriche statiche, ma anche da monopoli magnetici in moto. 14.2.1

Leggi di conservazione

Come test principale della consistenza del nuovo sistema di equazioni (14.14), (14.15), affrontiamo ora la questione dell’esistenza di un tensore energia–impulso, che soddisfi l’equazione di continuit`a ∂µ T µν = 0. Manteniamo la definizione sia del contributo del µν , T µν = Tem + Tpµν , Z X = mr uµr uνr δ 4 (x − yr ) dsr ,

campo elettromagnetico che di quello delle particelle µν = F µα Fα ν + Tem

1 µν αβ η F Fαβ , 4

Tpµν

65

(14.23)

r

e valutiamo separatamente la divergenza dell’uno e dell’altro. Cominciamo con il contributo elettromagnetico, µν = jeα Fα ν + F µα ∂µ Fα ν + ∂µ Tem 65

1 αβ ν F ∂ Fαβ 2

Per semplicit`a trascuriamo qu`ı il problema delle divergenze dovute all’autointerazione, risolubile con le stesse tecniche del capitolo precedente.

395

¡ ¢ 1 Fαβ ∂ α F βν + ∂ β F να + ∂ ν F αβ 2 1 = −F να jeα − Fαβ εαβνµ jmµ 2 να = −F jeα − Feνα jmα ´ XZ ³ er F να + gr Feνα urα δ 4 (x − yr ) dsr . = − = −F να jeα +

r

Nel primo passaggio al posto di ∂µ F µα abbiamo sostituito jeα , usando (14.14). Il secondo passaggio contiene rimaneggiamenti elementari degli indici. Nel terzo abbiamo usato l’identit`a di Bianchi modificata, nella forma (14.22). Nel quarto abbiamo applicato la definizione di Fe, e nell’ultimo la definizione delle correnti. La divergenza del tensore energia–impulso delle particelle `e stata calcolata in (2.73), ∂µ Tpµν

X Z dpν r 4 δ (x − yr ) dsr . = ds r r

Sommando i due contributi si ottiene allora, ¶ ´ X Z µ dpν ³ r µν να να e ∂µ T = − er F + gr F urα δ 4 (x − yr ) dsr . ds r r Vediamo, quindi, che se vogliamo mantenere il tensore eneriga–impulso totale conservato, allora dobbiamo modificare anche l’equazione di Lorentz, sostituendola con, ³ ´ dpνr να να e = er F + gr F urα . dsr

(14.24)

Si noti che questa formula `e ora invariante per dualit`a, vedi (14.8) e (14.17). Usando le (14.9), (14.10) `e immediato scriverla in notazione tridimensionale, ³ ´ dεr ~ ~ = ~vr · er E + gr B dt ³ ´ ³ ´ d~pr ~ ~ ~ ~ = er E + ~vr × B + gr B − ~vr × E . dt

(14.25) (14.26)

Un dione – una particella dotata oltre che di carica elettrica er anche di carica magnetica ~ − ~vr × E). ~ gr – `e quindi soggetta alla forza di Lorentz aggiuntiva gr (B Dalle equazioni (14.18)–(14.21), e (14.26) si vede allora che – grazie alla dualit`a – la dinamica di un sistema di soli monopoli, `e completamente identica alla dinamica di un sistema di sole cariche, cio`e, all’Elettrodinamica standard.

396

Essendo il tensore energia–impulso totale conservato e simmetrico, sappiamo che si conserva automaticamente anche la corrente di densit`a di momento angolare, M µαβ = xα T µβ − xβ T µα ,

∂µ M µαβ = 0.

(14.27)

Inoltre, dato che il tensore–energia impulso ha mantenuto la stessa forma, anche l’espresR ~ eB ~ rimane sione del momento angolare conservato, Lαβ = d3 x M 0αβ , in termini di E immutata. Ricordiamo in particolare l’espressione per il momento angolare spaziale totale Li = 21 εijk Ljk , vedi (2.88), ~ = L

X

Z (~yr × p~r ) +

h i ~ ~ ~p + L ~ em . d x ~x × (E × B) ≡ L 3

(14.28)

r

~ em = 0, in Si noti che per un sistema statico di sole cariche, o soli monopoli, si ha L ~ mentre nel secondo si annulla E. ~ Nella prossima quanto nel primo caso si annulla B, sezione vedremo che per un sistema statico costituito da cariche e monopoli, avremo ~ em 6= 0. invece L

14.3

La condizione di quantizzazione di Dirac

Abbiamo visto che l’Elettrodinamica classica di un sistema di dioni, basata sulle equazioni (14.14), (14.15) e (14.24), `e perfettamente consistente qualsiasi siano le cariche er e gr delle particelle. In questa sezione daremo un argumento semiclassico per cui la dinamica quantistica di un tale sistema risulta consistente solo se queste cariche sono opportunamente vincolate tra di loro – dalla condizione di quantizzazione di Dirac. 14.3.1

Una carica e un monopolo

Dalla trattazione precedente risulta chiaro che aspetti fenomenologici nuovi possono emergere solo se consideriamo un sistema in cui compaiono sia cariche che monopoli. La situazione non banale pi` u semplice da analizzare `e la seguente. Consideriamo un monopolo magnetico statico (particella 1) con massa M e cariche e1 = 0 e g1 = g, fisso nell’origine. Possiamo allora studiare la dinamica di una carica elettrica non relativistica (particella 2) con massa m ¿ M e cariche e2 = e e g2 = 0, che si muove nel campo elettromagnetico creato dal monopolo. 397

Come prima cosa dobbiamo dunque calcolare il campo elettromagnetico generato dal monopolo. Essendo statico e fisso nell’origine le sue correnti sono, 0 jm = g δ 3 (~x),

~jm = 0,

jeµ = 0,

in quanto e1 = 0. Si tratta allora di risolvere il sistema (14.18)–(14.21) in presenza di queste correnti. Dato che ci troviamo in un regime statico esso si riduce essenzialmente ~ ·B ~ = g δ 3 (~x). La soluzione, ottenibile per dualit`a dal caso della particella all’equazione ∇ carica statica, `e, ~ 1 (t, ~x) = 0, E

~ 1 (t, ~x) = g ~x . B 4π r3

(14.29)

La particella 2 si muove quindi in questo campo elettromagnetico sotto l’azione della forza di Lorentz data in (14.26). Nella presente trattazione non relativistica la forza di frenamento agente sulla particella 2 pu`o essere trascurata, e il campo creato da essa non ha quindi nessuna influenza sulla sua dinamica. Tuttavia, pi` u avanti avremo bisogno di conoscere il campo elettromagnetico totale del sistema carica + monopolo, e quindi anche il campo creato dalla carica. Se denotiamo la sua traiettoria con ~y (t), nel limite non relativistico le sue correnti sono, ~je ≈ 0,

je0 = e δ 3 (~x − ~y (t)),

µ jm = 0.

Per queste correnti le (14.18)–(14.21) danno luogo al campo elettromagnetico ben noto, ~ 2 (t, ~x) = e ~x − ~y (t) , E 4π |~x − ~y (t)|3

~ 2 (t, ~x) = 0. B

(14.30)

Scriviamo ora l’equazione del moto (14.26) della carica nel limite non relativistico. ~ 1 = 0 si ottiene (~v = d~y /dt, ~a = d~v /dt), Tenendo conto che g2 = 0 e che E ~ 1 (t, ~y ) = eg ~v × ~y . m ~a = e ~v × B 4π y3

(14.31)

Questa `e un’equazione differenziale del secondo ordine che determina la legge oraria ~y (t) della carica, note le condizioni iniziali ~y0 e ~v0 . Data questa legge oraria vogliamo ora esplorare le leggi di conservazione del sistema carica + monopolo + campo elettromagnetico, sfruttando il fatto che – come dimostrato nella sezione precedente – energia, quantit`a di moto e momento angolare totali si devono conservare. 398

Consideriamo innanzitutto l’energia. Si vede subito che l’energia cinetica della carica si conserva perch´e, d

¡1 2

¢ mv 2 = m ~a · ~v = 0, dt

cos`ı come si conservano seperatamente l’energia del monopolo, che `e zero, e quella del R ~2 + B ~ 2 ), che `e infatti campo elettromagnetico. L’energia di quest’ultimo vale 1/2 d3 x(E 2 1 una “costante” infinita. La quantit`a di moto m ~v della carica evidentemente non si conserva, ma non `e difficile dimostrare che la quantit`a di moto del sistema carica + monopolo `e conservata

66

. La

quantit`a di moto del campo elettromagnetico dovrebbe allora essere costante. Usando le (14.29) e (14.30) si trova infatti che, Z Z Z ~x eg 3 ~ 3 ~ ~ ~ ~ ~y × d3 x = 0, Pem = d x E × B = d x E2 × B1 = − 2 3 (4π) r |~x − ~y |3 in quanto l’integrale in d3 x `e proporzionale a ~y . 14.3.2

Il momento angolare del sistema

Analizziamo ora in dettaglio la conservazione del momento angolare. Nel limite statico il monopolo ha momento angolare nullo, perch´e anche se la sua quantit`a di moto resta ~ p = ~y × m~v `e diversa da zero, il suo braccio va a zero. Il momento angolare della carica L invece diverso da zero e, per di pi` u, non si conserva. Usando la (14.31) si trova appunto, µ ¶ ~p eg ~v (~v · ~y ) ~y dL = ~y × m ~a = − . (14.32) dt 4π y y3 Di conseguenza anche il momento angolare del campo elettromagnetico deve essere diverso ~ =E ~ 2, e B ~ =B ~ 1, da zero. Lo possiamo valutare usando la sua definizione (14.28), con E (~n ≡ ~x/r), Z ~ em = L

~ × B) ~ d3 x ~x × (E µ ¶ Z g ~ x 3 ~× = d x ~x × E 4π r3 µ ¶ Z g 1 ~ ~x 3 ~ = dx E − (~x · E) 3 4π r r

66

Nel limite statico la velocit`a del monopolo va a zero, ma la sua quantit`a di moto resta finita. La somma delle quantit`a di moto di carica e monopolo `e infatti costante per il principio di azione e reazione di Newton, valido nel limite non relativistico.

399

= = = = =

Z ¡ ¢ g d3 x E i ∂i ~n 4π Z ³ ¡ ´ ¢ g ~ · E) ~ d3 x ∂i ~n E i − ~n (∇ 4π · µZ ¶ ¸ Z g 2 i i 3 3 lim r n E ~n dΩ − e d x ~n δ (~x − ~y ) 4π r→∞ Z eg ~y eg ~n dΩ − 2 (4π) 4π y eg ~y − . 4π y

(14.33)

Il momento angolare totale `e quindi dato da, ~ =L ~p + L ~ em = ~y × m~v − eg ~y , L 4π y

(14.34)

~ e usando (14.32) si verifica facilmente che `e conservato, dL/dt = 0. Il fatto che il momento angolare del sistema a due corpi (carica + monopolo) da solo non si conserva ha due conseguenze importanti. La prima `e che il moto non `e piano, come succede invece per due corpi che interagiscono attraverso una forza centrale. La seconda `e che in un esperimento di scattering una carica inizialmente priva di momento angolare, passando vicino a un monopolo magnetico pu`o acquistare un momento angolare non nullo, sottraendolo al campo elettromagnetico. La variazione del momento angolare della carica tra lo stato iniziale e quello finale pu`o infatti essere letta dalla (14.34), õ ¶ µ ¶! ~y ~ y eg ~ p = −∆L ~ em = − . ∆L 4π y f y i Supponiamo ora di eseguire un esperimento di scattering in cui la carica passa a una distanza molto grande dal monopolo, ovverosia con un parametro d’impatto b molto grande. In questo caso la carica praticamente non viene deflessa perch´e la forza a cui `e sottoposta si annulla a grandi distanze come 1/y 2 , vedi (14.31). Indicando allora con zb il versore della velocit`a a pi` u e meno infinito, che `e dunque la stessa, abbiamo, µ ¶ µ ¶ ~y ~y = −b z, = zb, y i y f e quindi, ~p = ∆L

eg zb. 2π

(14.35)

Calcolo esplicito di ∆Lzp . Per capire meglio il meccanismo che fa emergere per b → ∞ una variazione non nulla del momento angolare, mentre nello stesso limite le velocit`a 400

iniziale e finale sono uguali, calcoliamo esplicitamente la variazione della velocit`a durante l’intero processo di scattering. In questo caso la traiettoria `e praticamente rettilinea, e supponendo che essa giaccia nel piano (x, z) abbiamo ~y (t) = b x b + vt zb, ~v (t) = v zb. L’unica componente non nulla della forza in (14.31) `e allora la componente y · ¸ eg eg ~y vb Fy = ~v × 3 = . 2 4π y y 4π (b + v 2 t2 )3/2

67

,

Di conseguenza l’unica componente della velocit`a che varia `e la componente y, Z



1 ∆vy = ay (t) dt = m −∞

Z



eg vb Fy dt = 4π m −∞

Z

∞ −∞

(b2

dt eg = . 2 2 3/2 +v t ) 2π m b

Si vede quindi che la particella acquista una velocit`a lungo y diversa da zero – che la fa uscire dal piano iniziale (x, z) – che si annulla nel limite per b → ∞. Al contrario, la componente z del momento angolare subisce una variazione non nulla anche per b → ∞, ∆Lzp = b (m∆vy ) =

eg , 2π

in accordo con la (14.35). 14.3.3

Consistenza quantistica e condizione di quantizzazione di Dirac

Cerchiamo ora di interpretare il risultato di questo esperimento nel contesto della Meccanica Quantistica. In questo ambito, dato che abbiamo considerato il limite b → ∞, sia nello stato iniziale che in quello finale la carica pu`o essere considerata come una particella libera che si muove di moto rettilineo uniforme lungo l’asse z. Inoltre, le componenti z della velocit`a e del momento angolare sono variabili compatibili, perch`e da, [Li , pj ] = i~ εijk pk , segue, [Lzp , pz ] = 0. Possiamo quindi misurare l’osservabile Lzp con precisione sia nello stato iniziale che in quello finale, senza modificare la velocit`a lungo z. I valori che otteniamo per Lzp nei 67

Ovviamente la traiettoria della carica giace nel piano (x, z) solo per per t → −∞, perch´e il moto non `e piano. In realt`a qu`ı stiamo eseguendo un calcolo perturbativo attorno alla traiettoria rettilinea imperturbata, con parametro di espansione 1/b.

401

due stati sono evidentemente due autovalori permessi per una componente del momento angolare, cio`e, n1 ~ e n2 ~, con n1 e n2 interi. Ma allora deve essere quantizzata anche la differenza, ∆Lzp = n~, con n intero. Confrontando con la (14.35) si deduce cos`ı la condizione di quantizzazione di Dirac

68

, e g = 2πn~c,

(n = 0, ±1, ±2, · · ·).

(14.36)

Possiamo concludere che una condizione necessaria per la coesistenza quantistica di monopoli e cariche `e che qualsiasi coppia di cariche e monopoli soddisfi la condizione di quantizzazione di Dirac, per qualche intero positivo o negativo n. Solo recentemente `e stato dimostrato che la (14.36) `e in realt`a anche sufficiente per la costruzione di una teoria quantistica relativistica di campo che coinvolge sia cariche che monopoli

69

.

Nonostante questi risultati teorici confortanti la ricerca sperimentale di monopoli magnetici – tuttora in atto – ha dato finora esiti negativi. Tuttavia, per l’interesse sia teorico che sperimentale che queste particelle continuano a suscitare, elenchiamo qu`ı di seguito alcune conseguenze che deriverebbero dall’esistenza di monopoli magnetici in natura. Quantizzazione della carica elettrica. Supponendo che esista anche un solo monopolo, di carica g0 , la carica elettrica er di una qualsiasi particella carica a noi nota dovrebbe soddisfare la relazione er g0 = 2πnr ~, e quindi, er = e0 nr ,

e0 ≡

2π~ . g0

Si risolverebbe cos`ı il problema della quantizzazione della carica elettrica, perch´e tutte le cariche sarebbero necessariamente multiple di una carica fondamentale e0 . Questo fatto `e confermato dagli esperimenti con estrema precisione – per esempio la differenza relativa tra i moduli della carica dell’elettrone e della carica del protone `e minore di 10−20 – ma a tuttoggi non esiste nessuna spiegazione teorica di questa “coincidenza”. Dualit`a di accoppiamento debole/forte. La condizione di Dirac stabilisce una relazione 68 69

P.A.M. Dirac, Proc. Roy. Soc. (London), A133, 60 (1931). R.A. Brandt et al., Phys. Rev. D19 4 1153 (1979)

402

tra le costanti di struttura fine elettrica e magnetica, αe ≡

e2 , 4π ~c

αm ≡

g2 , 4π ~c

che in teoria quantistica di campo giocano il ruolo di costanti di accoppiamento. Usando la (14.36) si ottiene infatti, αe αm =

n2 . 4

Per un dato sistema di cariche abbiamo quindi che se αe `e piccola allora αm `e grande, e viceversa. D’altra parte sotto una trasformazione di dualit`a e e g si scambiano tra di loro secondo e → g, g → −e, che per le costanti di accoppiamento equivale a, αe

←→

αm .

(14.37)

La dualit`a elettromagnetica scambia quindi regimi di accoppiamento debole con regimi di accoppiamento forte. Per questo motivo questa dualit`a viene anche chiamata “dualit`a di accoppiamento debole/forte”. Si pu`o allora facilmente intuire che una relazione di dualit`a pu`o essere molto utile per analizzare una teoria a livello non perturbativo, cio`e, in un regime in cui la costante di accoppiamento `e grande, per cui non avrebbe senso effettuare uno sviluppo perturbativo. I monopoli in Teorie di Grande Unificazione. Lo studio dei monopoli – introdotti da noi ad hoc nell’ambito dell’Elettrodinamica classica – `e motivato anche dal fatto che nelle Teorie di Grande Unificazione (GUT), come per esempio quella basata sul gruppo di gauge SU (5), la presenza di monopoli `e una previsione inevitabile della teoria stessa. Il fatto che i monopoli non siano stati ancora osservati evidentemente non contraddice queste teorie, per il semplice motivo che le masse previste per queste particelle sono troppo elevate da poterle produrre negli acceleratori oggi in uso. La condizione di quantizzazione di Schwinger. Concludiamo presentando la generalizzazione della condizione di Dirac al caso di particelle dioniche. L’argomento semiclassico che abbiamo presentato sopra si estende infatti facilmente al caso in cui abbiamo una particella con cariche e1 e g1 , statica nell’origine, e una particella con cariche e2 e g2 che si muove nel campo elettromagnetico creato dalla prima. In questo caso si ottiene la

403

condizione

70

, e1 g2 − e2 g1 = 2πn ~c,

(n = 0, ±1, ±2, · · ·).

(14.38)

Il segno relativo tra i due termini in questa relazione `e dettato dall’invarianza per dualit`a, vedi (14.17). Sottolineiamo il fatto che le condizioni di quantizzazione (14.36) e (14.38) sono state ottenute come condizioni necessarie – attraverso un argomento semiclassico nell’ambito della Meccanica Quantistica non relativistica. Per completezza aggiungiamo che nell’ambito delle teorie quantistiche relativistiche di campo si pu`o far vedere che un sistema di N dioni pu`o interagire consistentemente se vale, in alternativa, l’uno o l’altro dei seguenti due set di condizioni, er gs = 2πnrs ~c, ∀ r, s, er gs − es gr = 4πnrs ~c, ∀ r, s, dove gli nrs sono interi postivi o negativi. Il fattore 2 aggiuntivo nel secondo set di condizioni, rispetto a (14.38), `e da interpretarsi come un effetto relativistico.

70

J. Schwinger, Phys. Rev. 144 4 (1966) 1087.

404

Related Documents