IL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVIT RISTRETTA

 
IL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ
                      RISTRETTA

                                   ISIDORO FERRANTE

                                   1. I NTRODUZIONE
In questo ciclo di lezioni ci proponiamo di seguire un percorso molto formale nella
formulazione della teoria, partendo dai postulati di Einstein, e riscrivendo le leggi della
fisica utilizzando quello che tecnicamente si chiama formalismo covariante, ovvero
quel sistema di notazione che permette di riconoscere immediatamente la struttura
matematica delle varie quantità fisiche che entrano in gioco.
A partire dal formalismo covariante, si discende ai risultati particolari in termi di
quantità note e misurabili, e si cerca di spiegare gli effetti in termini di semplici
osservazioni.
Ovviamente un simile approccio non è pensabile nell’insegnamento della scuola se-
condaria: ma del resto lo scopo di queste lezioni non è quello di fornire gli strumenti
per l’insegnamento, bensì quello di mettere gli insegnanti in condizione tale da poter
in caso affrontare la lettura di un testo specialistico sull’argomento, per cercare le ri-
sposte alle domande che spesso ingenuamente ci si pone davanti ad una teoria che in
alcuni casi fornisce dei risultati lontani dal senso comune.
Si daranno per conosciuti gli aspetti fondamentali della teoria, dal significato di sitema
di riferimento inerziale, alle trasformazioni di Lorentz, alle contrazioni delle lunghezze
e dilatazione dei tempi.

            2. A LCUNI   PROBLEMI DELLA MECCANICA NEWTONIANA E
                        DELL’ ELETTROMAGNETISMO CLASSICO .

La situazione della fisica precedente all’articolo sulla relatività generale del 1905 pre-
sentava alcuni piccoli problemi di tipo logico o sperimentale che gli scienziati del tem-
po cercavano di risolvere tramite situazioni ad hoc, senza pensare che un ripensamento
delle leggi della meccanica fosse necessario per una loro completa comprensione. La
meccanica newtoniana, anche se riscritta parzialmente nel ’700 e ’800, era rimasta so-
stanzialmente invariata, nella sostanza, dall’epoca dei principia di Newton. Qualche
problemino c’era, è vero, di natura sia logica che sperimentale. Il principale problema
di natura logica era ovviamente quello dell’azione a distanza: non era per niente chiaro
il meccanismo per cui due corpi avrebbero potuto influenzarsi a vicenda attraverso lo
spazio, e il concetto stesso aveva avuto qualche difficoltà ad affermarsi. C’era anche
il problema di definire cosa fosse esattamente un sistema inerziale, e di capire come
                                             1
2                                    italianISIDORO FERRANTE

mai una certa classe di sistemi di riferimento risultasse privilegiata rispetto ad altri,
ma sembrava un problema minore. Dal punto di vista sperimentale, le cose andavano
decisamente meglio: l’unica osservazione non spiegabile tramite la meccanica newto-
niana era la famosa precessione di 43” per secolo nel perielo di Mercurio, peraltro un
residuo di una precessione osservata di ben 574” per secolo, di cui la teoria newtoniana
riusciva a spiegare solamente 531” per secolo
Le cose peggiorarono quando si cercò di rendere coerenti le leggi della meccanica con
l’elettrodinamica di Maxwell. Un primo problema si ha ad esempio nella formulazione
                                      ~ Nella meccanica newtoniana si assumeva valesse
della forza di Lorentz1, F~ = q ~vc × B.
la relatività di Galileo: ovvero, dato un sistema chiuso (chiamiamolo laboratorio) non è
possibile determinare se questo si muove o sta fermo senza compiere esperimenti che
coinvolgano in qualche maniera gli oggetti che si trovano all’esterno del laboratorio
stesso. In modo del tutto formale si dice che le equazioni del moto devono risultare
invarianti per trasformazioni del tipo x~0 = ~x − ~v t.
Osserviamo innanzitutto che una trasformazione del genere non ha effetti sulla acce-
lerazione, e pertanto nemmeno sulla forza: questo vuol dire che la forza tra due corpi
non può dipendere dalla posizione e velocità assoluta di uno di essi, bensì solamente
dalla posizione e velocità relativa: F~1→2 = F~ (~x1 − ~x2 , ~v1 − ~v2 ). La forza di Loren-
tz invece non ha questa caratteristica, a meno di non interpretare la velocità ~v come
misurata in un qualche particolare sistema di riferimento.
La situazione in realtà è decisamente peggiore: infatti le equazioni delle onde elettro-
magnetiche, c12 ∂∂tE2 − ∇   ~ = 0 NON risulta invariante per trasformazioni di Galileo, e
                  2~
                        ~ 2E
alla stessa maniera non risulta invariante il complesso delle equazioni di Maxwell. Al-
tri problemi derivavano dall’analisi di problemi apparentemente semplici: ad esempio,
si considerino due particelle in moto con la stessa velocità ~v in una direzione che for-
ma un angolo con la congiungente (figura 2.1). Esiste un sitema di riferimento in cui
queste cariche sono in quiete, e si attraggono con una forza diretta lungo la congiun-
gente data dalla formula di Coulomb. Nel sistema di riferimento in cui le cariche sono
in moto, ognuna di queste produce un campo magnetico le cui linee di forza sono cir-
conferenze coassiali con la linea di moto; in conseguenza di ciò, su ciascuna delle due
cariche nasce una forza Fm di origine magnetica che non è diretta lungo la congiungen-
te. Sommata alla forza elettrica, si ottengono due risultati interessanti: innanzitutto,
tra le due cariche si osserva una coppia che tende a farle ruotare; in secondo luogo,
nel sistema in cui le due cariche sono a riposo la forza è diretta lungo la congiungente:
le trasformazioni di Galileo prevedono invece che questa NON cambi direzione. Che
fine fa il principio di azione e reazione? E la conservazione del momento angolare? E
come mai le trasformazioni di Galileo falliscono?
Un problema molto simile vien fuori da un esempio altrettanto semplice: si consideri
la situazione esemplificata in figura 2.2: stavolta le due velocità non devono essere
    1
    Adopereremo il sistema di unità di misura detto gaussiano, in quanto utile per semplificare molte
delle formule adoperate: vedi la sezione dedicata all’elettromagnetismo.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA             3

       F IGURA 2.1. Due cariche viste da un sistema di riferimento che si
       muove con velocità v rispetto ad ess: sorgono delle forze di natura
       magnetica che fanno sì che la forza che agisce su ciascuna delle due
       cariche non risulti diretta lungo la congiungente.
                                           q            v
                                    Fe
                                              Fm

                                       F

                                q             v

       F IGURA 2.2. Sulla carica 1 agisce solamente la forza dovuta al campo
       elettrico generato dalla carica 2; su questa invece agiscono sia la forza
       dovuta al campo elettrico che quella dovuta al campo magnetico.
                                                        v1

                                                   F 21

                                                  v2

                                         Fm       F12

necessariamente uguali. Sulla carica superiore agisce solamente la forza dovuta al
campo elettrico della carica inferiore: infatti, lungo la direzione del moto il campo
magnetico è nullo.
Sulla carica inferiore invece agiscono sia le forze dovute al campo elettrico che quelle
dovute al campo magnetico prodotti dalla carica superiore.
Stavolta, la forza di origine magnetica non si annulla, anzi è diretta verso sinistra. Di
nuovo,che fine fa il principio di azione e reazione?
In realtà i fisici della fine del diciannovesimo secolo non erano troppo turbati da queste
osservazioni: infatti, la natura ondulatoria della luce, così come era ormai stata defini-
tivamente accertata sperimentalmente, richiede nel loro modo di vedere l’esistenza di
un mezzo in grado di trasportare le vibrazioni dovute ai campi elettromagnetici.
Si pensava insomma che, analogamente a quanto accade con le onde sonore, esistes-
se un qualche substrato, detto etere, in grado di propagare le onde elettromagnetiche.
4                                italianISIDORO FERRANTE

A questo punto, la mancata validità delle relatività galileiana per le equazioni elet-
tromagnetiche non veniva a costituire più un problema, perché si veniva a creare un
sistema di riferimento privilegiato, quello in cui l’etere si trovava a riposo, appunto,
nel quale valevano le equazioni di Maxwell: in tutti gli altri sistemi di riferimento sa-
rebbero comparsi dei fattori correttivi generalmente troppo piccoli per essere rivelati
sperimentalmente.
Purtroppo tutti gli esperimenti destinati a determinare le caratteristiche fisiche dell’e-
tere portavano a risultati contraddittori: un classico esempio è il risultato di Fizeau
sulla velocità della luce all’interno di dielettrici in moto. Fizeau misurò la velocità
della luce all’interno di un tubo percorso da un flusso di acqua in moto con veloci-
tà v, trovando dei risultati compatibili con l’ipotesi che la velocità aumentasse di un
termine 1 − n2 v: si tratta di un risultato difficilmente comprensibile in meccanica
                1

classica, in quanto porterebbe ad ipotizzare che l’etere venisse trascinato solamente
parzialmente dal moto del fluido.
Inoltre, i tentativi di misurare direttamente il moto della Terra attraverso l’etere, so-
prattutto ad opera di Michaelson e Morley, portarono, come è noto, a risultati negativi.

2.1. I postulati di Einstein. La strategia adoperata da Einstein è quella di rifiutare l’i-
dea dell’esistenza di un sistema di riferimento inerziale privilegiato: assieme a questo
principio, Einstein assume anche la congettura che la velocità della luce sia la stessa
in qualunque sistema di riferimento inerziale.
A partire da questi due postulati, Einstein ricava rapidamente le conseguenze più rivo-
luzionare della sua teoria: la revisione del concetto di simultaneità, le trasformazioni
di Lorentz come equazioni che collegano le misure di tempo e distanza tra due sistemi
inerziali diversi, la contrazione delle lunghezze e la dilatazione dei tempi, l’aberrazione
della luce, fino ad arrivare alle equazioni del moto dell’elettrone.
In questa trattazione noi seguiremo un approccio simile, ma partendo non dall’inva-
rianza della velocità della luce, bensì dalla richiesta di invarianza delle equazioni della
dinamica e dell’elettrodinamica rispetto alle trasformazioni di Lorentz. Si tratta di un
approccio più moderno, in gran parte dovuto ad un ex professore di Einstein, Min-
kowsky, il quale si occupò di formalizzare la struttura dello spazio tempo così come
concepito da Einstein, il quale dapprima rimase perplesso di fronte al lavoro del col-
lega, salvo poi accettarlo in toto quando si rese conto di quanto venisse facilitata la
formulazione della teoria della relatività generale.

2.2. Il concetto di invarianza. Si dice che una determinata legge fisica espressa nella
forma A = B è invariante sotto una certa trasformazione se questa trasformazione
cambia nello stesso modo sia la quantità A che la quantità B trasformando l’equazione
in un’altra del tipo A0 = B 0 .
Le leggi della fisica classiche, newtoniane, ad esempio sono invarianti per rotazioni
del sistema di riferimento: ad esempio, in F~ = m~a sia la forza che la accelerazio-
ne si trasformano alla stessa maniera se si adopera un sistema di riferimento ruotato
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA                           5

 rispetto ad un qualunque asse. Certamente, le componenti dei vettori F~ e ~a cambieran-
 no nel passaggio al nuovo sistema di riferimento, ma in modo tale che l’uguaglianza
 venga sempre rispettata. Altre due invarianze importanti nella meccanica newtonia-
 na sono quelle per traslazioni spaziali (che trasforma la coordinata ~x nella coordinata
~x0 = ~x + x~0 ) o temporali (t → t0 = t + t0 ): ovvero, cambiando l’origine delle coor-
 dinate o l’origine dei tempi, le equazioni devono rimanere valide. Questo ci porta a
 concludere, ad esempio, che la forza tra due corpi a e b può dipendere solamente dalla
 loro posizione relativa e non da quella assoluta: ovvero F~ab = F~ (~xa − ~xb ).
 Altre due importanti invarianze sono quelle per inversioni spaziali, o parità, o per
 inversioni temporali.
 La prima ci dice che non ha importanza se prendo una terna di assi cartesiani destrorsi
 o sinistrorsi, ottenuta invertendo il verso di tutti e tre gli assi(x,
                                                                     ˆ ŷ, ẑ) → (x̂0 , ŷ 0 , ẑ 0 ) =
 (−x̂, −ŷ, −ẑ): infatti le componenti dell’accelerazione cambieranno segno così come
 quelle della forza2. Un caso particolare è dato dalla forza di Lorentz: F~ = qv   ~ × B.       ~ In
 questa espressione, infatti, cambiando di segno alle componenti degli assi, si giunge-
 rebbe ad un assurdo, in quanto il prodotto vettoriale rimarrebbe alla fine dello stesso
 segno.... Il problema viene risolto in quanto dallo studio delle equazioni di Maxwell si
 scopre che le componenti di del campo magnetico non cambiano di segno se si cambia
 il segno agli assi del sistema di riferimento! Si dice allora che B  ~ è uno pseudovettore,
 in quanto si comporta come un vettore per rotazioni, ma in modo diverso per trasfor-
 mazioni di parità. Una quantità con proprietà simili è il momento della quantità di
 moto.
 L’invarianza per inversione temporale è una questione invece assai delicata: vuol dire
 infatti che ogni processo fisico visto alla rovescia, ossia dalla fine al principio, rimane
 sempre un processo fisicamente probabile. Sappiamo che questo è vero microscopi-
 camente: le leggi fondamentali che regolano le interazioni tra le particelle elementari
 ubbidiscono a questa regola3; tuttavia sappiamo anche che le leggi macroscopiche, che
 coinvolgono le interazioni tra molti corpi, non risultano reversibili temporalmente. Un
 esempio banale: in un corpo soggetto ad attrito viscoso, F~ = −κ~v = m~a, per inver-
 sione temporale cambia segno il termine della forza, ma non quello dell’accelerazione
 (l’accelerazione, in quanto derivata seconda rispetto al tempo, non cambia segno per
 inversione temporale, mentre la velocità sì). In questo caso, infatti, la forza sorge dalla
 somma degli urti che il corpo subisce contro le molecole del fluido in cui è immerso: i
 singoli urti sono reversibili temporalmente, ma il loro effetto complessivo no.
 L’ultima invarianza, quella che ci interessa di più, è invece l’invarianza per trasforma-
 zioni di Galileo:

                                              ~x0 = ~x − ~v t
   2Sappiamo però che     questo non è vero se si considerano le interazioni deboli.
   3
    In realtà le interazioni deboli sembrano violarla: non esiste una prova sperimentale diretta, ma alcuni
principi teorici uniti a dati sperimentali puntano in questa direzione.
6                                           italianISIDORO FERRANTE

Ovvero, se ci trasferiamo da un sistema di riferimento ad un altro che si muove rispetto
a questo con velocità costante ~v le equazioni non cambiano.
L’accelerazione è ovviamente invariante: infatti, derivando due volte si ottiene ~a 0 = ~a.
Ne segue che perché l’equazione di newton sia invariante deve risultare che la forza
deve dipendere dalla posizione relativa degli oggetti, come già visto, ed eventualmente
dalla velocità relativa: F~ab = F~ (x~a − x~b , ~va − ~vb ).
Nel caso del moto nel fluido viscoso, l’invarianza non è ovviamente rispettata: infatti
in quel caso abbiamo un sistema di riferimento privilegiato, ovvero quello in cui il
fluido è in quiete, e la velocità va misurata relativamente a quel sistema di riferimento.
Passiamo adesso ad esaminare le leggi dell’elettromagnetismo: le equazioni di max-
well sono invarianti rispetto alle trasformazioni viste prima, tranne in un caso: ovvero
quello delle trasformazioni di galileo.
Per trasformazioni di Galileo compaiono nelle equazioni termini aggiuntivi, che non
vi è modo di eliminare. 4
Ora, si potrebbe pensare che cambiando sistema di riferimento questi termini in qual-
che modo si compensino ad esempio nel calcolo delle forze: bene, non è così. L’elet-
tromagnetismo non è invariante per trasformazioni di Galileo.
Sappiamo però che le trasformazioni di Lorentz, quelle ottenute supponendo l’inva-
rianza della velocità della luce in un cambiamento di sistema di riferimento inerziale,
lasciano invariate le equazioni di Maxwell (e lo dimostreremo nel seguito).
Possiamo quindi cambiare leggermente i postulati di Einstein nei due seguenti:
     (1) Le relazioni tra le misure di spazio e di tempo in due sistemi di coordinate che
         si muovono con velocità relativa costante sono dati dalle equazioni di Lorentz
     (2) Tutte le equazioni fondamentali della fisica sono invarianti sotto trasformazioni
         di Lorentz.
Partiremo da questo punto, quindi, e al termine ricaveremo l’invarianza della velocità
della luce.

2.3. Le trasformazioni di Lorentz. Richiamiamo le trasformazioni di Lorentz: in
quasi tutti gli esempi in questi appunti ci riferiremo alla situazione seguente: conside-
riamo un sistema di riferimento S ed un altro sistema di riferimento S 0 che si muove
rispetto a questo con velocità ~v senza ruotare.
    4Ad esempio, consideriamo l’equazione ∇
                                          ~ ×E
                                             ~              = − 1c ∂∂tB . Per trasformazione di Galileo dal sistema
                                                                    ~

S a quello S che si muove con velocità v lungo l’asse y, i campi si trasformano nel modo seguente:
                0

E~ 0 (~x0 ) = E(~
              ~ x − ~v t), B            ~ x − ~v t). Le derivate rispetto alla coordinate non cambiano: ∇
                           ~ 0 (~x0 ) = B(~                                                                    ~ 0 = ∇,
                                                                                                                     ~
ma la dipendenza rispetto al tempo contiene una dipendenza aggiuntiva! Si ha quindi ∂t = ∂t − (~v ·  ∂B~0      ~
                                                                                                              ∂B

~ B.
∇)    ~
     Si ha quindi un termine aggiuntivo che non va via. Si può pensare che l’errore stia nell’assunto
secondo cui basti sostituire le nuove coordinate per ottenere i campi E            ~ 0, B
                                                                                        ~ 0 , ed in effetti è così : nel
nuovo sistema di riferimento i campi cambiano. Tenendo conto di questa possibilità, il termine extra si
trasforma in un termine del secondo ordine in v/c, ma non scompare del tutto.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA                         7

         F IGURA 2.3. Due sistemi di riferimento S ed S 0 si muovono con velo-
         cità relativa uniforme diretta lungo x. All’istante t = 0 le origini delle
         coordinate coincidono, ed inoltre t0 = 0.
                                  S                    S’
                                                        v

                                O                 O’

Supponiamo inoltre per semplicità che all’istante t = 0 le origini O ed O 0 coincidano,
ed inoltre che in quell’istante anche nel sistema S 0 valga t0 = 0 Supponiamo infine che
la velocità ~v sia orientata lungo l’asse x (vedi figura ).
Allora dato un evento, ovvero un punto di coordinate spaziali x, y, z e coordinate
temporali t, nel sistema S 0 le coordinate saranno:

                                                 1
                             x0 = q                          (x − vt)
                                                       v2
                                                1−     c2
                                                 1           v 
                                                             
                              t0 = q                     t −    x
                                                      2
                                                1 − vc2      c2

                             y0 = y
                             z0 = z

Solitamente si introducono i simboli: β = vc , γ = √ 1                    ; inoltre si moltiplica il tempo
                                                                  1−β 2
t per la velocità della luce in modo da avere grandezze omogenenee.
Con questo simbolismo, le T.L. acquistano una forma simmetrica:
                                       x0   =    γ (x − βct)
                                      ct0   =    γ (ct − βx)
                                       y0   =    y
(2.1)                                  z0   =    z

Le trasfomazioni inverse si ottengono rapidamente spostando gli apici e cambiando v
con −v:
                                     x      =    γ (x0 + βct0 )
                                    ct      =    γ (ct0 + βx0 )
                                     y      =    y0
                                     z      =    z0
8                                        italianISIDORO FERRANTE

        3. D EFINIZIONE     DELLO SPAZIO QUADRIDIMENSIONALE CON METRICA DI
                                        M INKOWSKY.

Cominciamo col definire delle quantità che chiameremo vettori controvarianti, o anche
quadrivettori (o tetravettori, con una parola in disuso).
Un quadrivettore viene individuato da quattro componenti, che si indicano con gli
indici da 0 a 3. Lo indichiamo col simbolo xµ (fate attenzione all’indice in alto: è
la chiave del formalismo). La componente con indice uguale a 0 è detta componente
temporale del quadrivettore, mentre le componenti da 1 a 3 sono dette componenti
spaziali. Una forma alternativa di indicare un vettore di questo tipo è x µ = (x0 , ~x).
Definiamo un prodotto scalare tra vettori nella forma5 hx, yi = x0 y 0 − x1 y 1 − x2 y 2 −
x3 y 3 = x0 y 0 − ~x · ~y. Osservate questa formula: risulta un po’ complicata da applicare,
soprattutto perché a volta i termini vanno sommati, a volte sottratti. Nel formalismo
einsteniano, questo prodotto scalare si scrive anche nella forma: hx, yi = Σ µ,ν gµν xµ y ν ,
dove gµν è una matrice diagonale i cui elementi sono g00 = 1, g11 = g22 = g33 = −1.
Notare anche stavolta la posizione degli indici. Si assume per convenzione che quando
due indici sono uguali, ed uno si trova in alto e l’altro in basso, allora si somma su di
essi. In questo modo si semplifica ulteriormente la formula:hx, yi = g µν xµ y ν . L’uso
della matrice metrica gµν serve per il momento solamente ad evitare il problema dei
segni che cambiano. Ci si può spingere ancora più in là nella semplificazione: si
definiscono i cosiddetti vettori controvarianti secondo la formula: x µ = gµν xν : un
vettore controvariante ha quindi componenti x0 = x0 , x1 = −x1 , x2 = −x2 , x3 =
−x3 , ovvero xµ = (x0 , −~x). In questo modo il prodotto scalare si scrive nella forma:
hx, yi = xµ y µ = xµ yµ . Da notare che qualunque tra i due vettori x o y può essere
trasformato nell’equivalente controvariante.
Cosa sono questi vettori controvarianti? I fisici di solito si trovano spaesati di fronte a
questo nuovo concetto: in fondo un vettore controvariante sembra uguale ad un vettore
covariante, a parte i segni cambiati. Per i matematici invece la differenza è più chiara,
in quanto riconoscono nei vettori controvarianti gli elementi di uno spazio duale. Il
fatto che la forma di g sia così semplice è dovuta essenzialmente al fatto che stiamo
adoperando coordinate cartesiane. Se avessimo adoperato ad esempio coordinate pola-
ri nello spazio, allora la matrice g avrebbe avuto una forma completamente differente e
i vettori controvarianti sarebbero risultati completamente diversi dai vettori covarianti,
al punto di non avere neanche le stesse dimensioni.

    5
     Nei testi più vecchi, si utilizzano gli indici da 1 a 4: le componenti spaziali del quadrivettore sono le
prome tre, mentre la quarta componente è puramente immaginaria. In questo modo il prodotto scalare
assume la forma consueta, ma assume segno opposto a quello da noi definito: hx, yi = x 1 y 1 + x2 y 2 +
x3 y 3 + (ix4 · iy 4 ) = ~x · ~y − x4 y 4 . Questa notazione apparentemente più semplice risulta perè alla lunga
macchinosa e non è estendibile alla relatività generale.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA                          9

Il vantaggio di adoperare questa notazione risulterà evidente quando si passerà a siste-
mi di coordinate qualsiasi (nella relatività generale).6
Allo stesso modo in cui abbiamo definito la matrice gµν possiamo definire una matrice
g µν che ritrasforma il vettore controvariante in un vettore covariante. Nel linguaggio
gergale, moltiplicare per una matrice gµν abbassa un indice, mentre moltiplicare per
g µν lo alza. In questa semplice rappresentazione, gli elementi di g µν sono uguali a
quelli di gµν . Si noti inoltre che gν µ = gνµ = δνµ dove δ indica il simbolo di kronecker.

3.1. Il gruppo di Lorentz. Fino a questo punto abbiamo costruito uno spazio quadri-
dimensionale, e l’abbiamo dotato di una sua metrica.
Adesso definiamo le trasformazioni di Lorentz come quelle trasformazioni lineari che
lasciano invariato il prodotto scalare tra due quadrivettori, ovvero quelle che, dati due
quadrivettori di componenti xµ , xν , le trasformano in x0µ , y 0µ , in modo tale che x0µ yµ0 =
xµ y µ .
Entrando nel dettaglio, data una qualsiasi trasformazione lineare definita dalla ma-
trice Λµ ν tale che x0µ = Λµ ν xν (si noti che l’ordine degli indici è importante, la
matrice in generale non è simmetrica), e definita la matrice covariante Λ µ ν ottenu-
ta abbassando un indice ed alzandone un altro tramite la matrice metrica g µν , allora
deve aversi:x0µ yµ0 = Λµ k xk Λµ λ yλ , ovvero Λµ k Λν k = δνµ . Questa è una relazione di
ortogonalità tra matrici. Si può dimostrare facilmente come il determinante della ma-
trice Λ debba essere uguale a ±1. A noi interessano solamente quelle trasformazioni
che possono essere ricondotte con continuità alla matrice identità, ovvero quelle con
determinante 1.
Inoltre, vogliamo considerare solamente quelle trasformazioni che non cambiano se-
gno alla coordinata temporale (trasformazioni ortocrone) : si verifica che queste cor-
rispondono al caso Λ00 > 0. Queste due condizioni definiscono le cosiddette trasfor-
mazioni di Lorentz proprie. Si dimostra che costituiscono un gruppo, il gruppo di
Lorentz.
Le rotazioni costituiscono un sottogruppo del gruppo di Lorentz: infatti, mantengono
invariato il modulo della parte spaziale e non toccano la parte temporale.
Si può dimostrare anche intuitivamente che una qualunque trasformazione del gruppo
è scrivibile come l’applicazione successiva di un massimo di 6 trasformazioni succes-
sive: una rotazione intorno a ciascuno dei dei tre assi, ed una spinta (la spinta è una
Trasformazione di Lorentz che non prevede rotazioni del sistema di riferimento) lungo
ciascuno dei tre assi.
Le matrici che effettuano le trasformazioni sono7:
   6Nell’eseguire materialmente i conti, conviene pensare ai vettori controvarianti come vettori colonna,

mentre i vettori covarianti sono vettori riga. Nel passare da un vettore controvariante al corrispondente
covariante, si traspone e si cambia il segno agli indici 1, 2 e 3.
   7Consideriamo il primo indice come il numero di riga ed il secondo come numero di colonna.
10                               italianISIDORO FERRANTE

                           rotazioni               spinte             
                     1   0      0       0          γ   −βγ 0 0
                    0   1      0       0       −βγ    γ    0 0        
             x                                                        
                    0   0 cos θx sin θx        0      0    1 0        
                    0   0 − sin θx cos θx      0      0    0 1        
                     1      0     0     0          γ   0 −βγ 0
                    0    cos θy 0 sin θy       0    1    0    0       
             y                                                        
                    0      0     1     0       −βγ 0     γ    0       
                    0   − sin θy 0 cos θy       0   0    0    1       
                     1      0       0     0        γ   0 0 −βγ
                    0    cos θz sin θz 0       0    1 0     0         
             z                                                        
                    0   − sin θz cos θz 0      0    0 1     0         
                     0      0       0     1       −βγ 0 0      γ

dove, seguendo la notazione usuale, abbiamo posto per brevità β = vc , γ = √ 1           .
                                                                                 1−β 2

3.2. Scalari, quadrivettori, tensori. Fin qui abbiamo incontrato due tipi di grandez-
ze: quelle che per trasformazioni di Lorentz rimangono invarianti, e li chiameremo
scalari, e i quadrivettori, che invece si trasformano tramite la matrice Λ.
Possiamo generalizzare la nozione di quadrivettore considerando una grandezza mu-
nita di N indici, ciascuno dei quali si può alzare od abbassare tramite la matrice g µν ,
che da un sistema all’altro si trasforma tramite moltiplicazione di ciascuno degli indici
per una matrice Λ: si parla allora di tensori di rango N. Gli scalari sono quindi tensori
di rango 0 e i quadrivettori tensori di rango 1. Adoperemo nel seguito quasi esclusi-
vamente tensori di rango 2, che quindi i trasformano sotto T.L. secondo la formula:
T 0µν = Λµ k Λµ λ T κλ .
A partire da due vettori si possono costruire due tensori indipendenti, uno simmetrico
e uno asimmetrico:

                                S µν = xµ y ν + xν y µ
                                Aµν = xµ y ν − xν y µ

I tensori antisimmetrici posseggono una strana proprietà molto utile: sotto rotazioni,
gli elementi A0i , con i = 1, 2, 3, si comportano esattamente come un vettore tridi-
mensionale. Non solo, ma gli elementi (A23 , −A13 , A21 ) si comportano analogamente
come un normale vettore tridimensiale sotto rotazioni. La verifica si può effettuare
moltiplicando esplicitamente la generica matrice antisimmetrica per una delle matri-
ci che effettuano rotazioni lungo uno qualunque degli assi. Se però si effettua una
operazione di parità, ovvero si cambia la direzione di tutti e tre gli assi spaziali (tra-
sformazione a determinante -1, e quindi non appartenenente al gruppo di Lorentz), gli
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA            11

elementi A0i cambiano di segno, mentre gli elementi (A23 , −A13 , A21 ) rimangono in-
variati. Insomma, un tensore antisimmetrico corrisponde, nello spazio tridimensionale,
ad un vettore ed uno pseudovettore, e si può scrivere nella forma:
                                                
                                   0   Vx Vy  Vz
                                 −Vx  0  Pz −Py 
                         Aµν   =
                                 −Vy −Pz
                                                 
                                          0  Px 
                                  −Vz Py −Px  0
Si può moltipicare un vettore per un tensore contraendo due indici, ovvero facendo
in modo che uno di questi sia covariante ed uno controvariante, ponendoli uguali, e
sommando su di essi:

                                 B µ = T µν Vν = Tν µ V ν
Si possono moltiplicare anche due tensori tra di loro:
                                     K µν = T µλ Sλ ν
Il risultato del prodotto di più tensori eseguito secondo queste regole è un altro tensore,
di rango pari al numero di indici liberi.
La traccia di un tensore di rango 2, ottenuta contraendo i due indici tra di loro, è un
invariante:
T r(T ) = T µµ = T 00 + T 11 + T 22 + T 33 = T 00 − T 11 − T 22 − T 33
Insomma, le regole d’oro per lavorare con i tensori sono: quando si contraggono due
indici, uno deve essere in alto ed uno in basso. Dalla contrazione di due indici, si ottie-
ne un tensore di rango inferiore di due unità. A destra e a sinistra di una uguaglianza,
si devono trovare lo stesso numero di indici, con lo stesso nome e nella stessa posi-
zione. Queste regolette ci permettaranno di procedere alla formalizzazione della teo-
ria ella relatività procedendo pressocché alla velocità della luce (senza mai superarla,
ovviamente).
Possiamo osservare, en passant, come le matrici gµν e Λµ ν siano dei tensori (cosa di
per sé non banale). La dimostrazione è lasciata come esercizio.

3.3. Invarianza sotto trasformazioni di Lorentz. A questo punto possiamo capire
cosa vuol dire che le equazioni della meccanica e dell’elettromagnetismo devono es-
sere invarianti sotto trasformazioni di Lorentz: vuol dire che possiamo scriverle in
forma cosiddetta covariante a vista ovvero del tipo: Aµ = B µ , dove Aµ e B µ sono due
quantità fisiche che si trasformano entrambe come quadrivettori. Ovviamente anche le
forme T µν = S µν od anche Aµ = T µν B ν sono forme covarianti, e quindi possibili leggi
fisiche. La cosa importante è che a destra e a sinistra delle equazioni si abbiano oggetti
che si trasformano allo stesso modo da un sistema di riferimento inerziale all’altro.
Adesso possiamo tornare alla fisica, e classificare le quantità che conosciamo in base
alle proprietà di trasformazione.
12                               italianISIDORO FERRANTE

3.4. Coordinate, separazione. Il primo quadrivettore con cui avremo a che fare sarà
il vettore posizione, che individua univocamente un evento dello spazio tempo, dato
un particolare riferimento inerziale. Sarà xµ = (ct, ~x). Dati due eventi vicini a e b, e
indicate con xµa e xµb le coordinate dei due eventi, definiamo come separazione tra gli
eventi la differenza tra le due coordinate ∆xµ = xµb − xµa . Sia inoltre tb > ta in quel
particolare riferimento, ovvero a precede b.
Il modulo quadro (con la metrica relativistica) di questo quadrivettore è l’intervallo tra
i due eventi: ∆s2 = ∆xµ ∆xµ = c2 (tb − ta )2 − (~xb −~xa )2 . Questo intervallo può essere
positivo, negativo o nullo.
Se l’intervallo è positivo, allora si dice di tipo tempo. In questo caso esiste un sistema
di riferimento in cui gli eventi a e b avvengono nello stesso
                                                            q     luogo, ma con un certo
intervallo di tempo. In questo caso, la quantità ∆τ = ∆s           rappresenta l’intervallo
                                                                2
                                                                c2
temporale tra i due eventi. Si può verificare facilmente che in ogni altro sistema di
riferimento la distanza temporale tra i due eventi risulterà maggiore: la quantità ∆τ
costituisce l’intervallo di tempo proprio tra i due eventi a e b. I due eventi posso-
no (ma non debbono necessariamente) essere collegati da un nesso di tipo causale, e
precisamente a è la causa e b l’effetto.
Se l’intervallo è negativo, è detto di tipo spazio. Esiste un sistema di riferimento in cui
i due eventi avvengono nello stesso istante, ma in luoghi diversi. √    In quel sistema di
riferimento, la componente temporale si annulla. La quantità ∆l = −∆s2 costituisce
la distanza propria tra i due eventi. Stavolta i due eventi NON sono collegati da un
nesso causale.
Infine particolare importanza riveste il caso ∆s2 = 0: in questo caso, esiste un raggio
di luce che partendo dall’evento a raggiunge l’evento b : i due eventi sono separati
da un intervallo di tipo luce. Può esistere anche in questo caso un nesso causale tra
l’evento a e l’evento b.

                                    4. C INEMATICA .
Si consideri un punto materiale (o particella) che descrive una certa traiettoria nello
spazio. Siamo abituati a descrivere la traiettoria come una curva nello spazio tridi-
mensionale, data da tre equazioni parametriche ~x(t). La descrizione relativistica del
moto della stessa particella non cambia di molto: stavolta abbiamo un quadrivettore
                ~
xµ (t) = (ct, x(t)). Rispetto al caso non relativistico, la traiettoria deve soddisfare in
più alla condizione che la velocità risulti inferiore alla velocità della luce. Ovviamente
i valori delle coordinate cambiano a seconda del sistema di riferimento che abbiamo
scelto per descrivere il moto: supponiamo di averne scelto uno in modo assolutamente
casuale ed arbitrario.

4.1. Tempo proprio. Consideriamo due punti della traiettoria, agli istanti t e t + dt.
La separazione tra questi due eventi è uguale a dxµ = (cdt, ~v dt).L’intervallo è ovvia-
mente di tipo temporale, come del resto si osserva calcolandolo esplicitamente:ds 2 =
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA              13

        F IGURA 4.1. Diagramma spazio temporale del paradosso dei gemelli

                              ct

                             ct1
                                                                 1/2
                                               cdτ =(c2 dt2 −dx2 )      t1 . Questo non è altro che il
                          R t1      R t1 dτ
paradosso dei gemelli esposto in modo formalmente rigoroso.

4.2. Velocità. La velocità ordinaria di una particella risulta dal rapporto tra la parte
spaziale e quella temporale di un quadrivettore:~v = d~x
                                                      dt
                                                         . Quindi le proprietà di trasfor-
mazione da un sistema di riferimento all’altro non sono per niente ovvie: la velocità
non è un quadrivettore. Per questo motivo, le sue proprietà di trasformazione da un
sistema di riferimento all’altro risultano particolari: per ottenerle, basta scrivere le
trasformazioni di Lorentz in forma differenziale:

                                    dx0    =    γ (dx − βcdt)
                                   cdt0    =    γ (cdt − βcdx)
                                    dy 0   =    dy
                                    dz 0   =    dz

dove β = v0 /c è la velocità di S 0 rispetto ad S, e poi dividere membro a membro:
14                                 italianISIDORO FERRANTE

                             dx0     dx − βcdt     vx − v 0
                     vx0 =        =            =
                             dt0    dt − βdx/c     1 − vxc2v0
                             dy 0         dy                  vy
(4.1)                vy0   =      =                 =
                                                      γ 1 − vxc2v0
                                0
                                                                   
                             dt     γ (dt − βdx/c)
                               dz 0        dz           vz
                     vz0 =          =             =
                                                    γ 1 − vxc2v0
                                                                 
                               dt0    γdt − βdx/c
Si lascia come esercizio la dimostrazione che qualunque siano ~v e v 0 , si ha sempre
|~v 0 | < c, e che se |~v | = c allora anche |~v 0 | = c

 4.3. Quadrivelocità. Dividendo invece la separazione infinitesima tra due punti del-
 la traiettoria di una particella (quadrivettore) per il corrispondente intervallo di tem-
 po proprio (invariante) si ottiene ovviamente un quadrivettore: u µ = dx               . Il nome
                                                                                      µ
                                                                                    dτ
 che viene dato a questa quantità fisica è quadrivelocità. Le sue componenti sono:
 uµ = (γc, γ~v ). Il concetto di quadrivelocità non scalza quello di semplice velocità di
 una particella: infatti, la velocità di un punto materiale risulta facilmente accessibile
 alla misurazione, in quanto coinvolge il rapporto tra grandezze misurate nello stesso
 sistema di riferimento (mentre l’intervallo di tempo proprio è definito nel sistema di
 quiete della particella). Si noti inoltre che la quadrivelocità non risulta definita per un
 raggio di luce, in quanto l’intervallo di tempo proprio risulta identicamente uguale a
 zero.
 Moltiplicando la quadrivelocità per se stessa, si trova facilmente: uµ uµ = γ 2 c2 −
 γ 2~v 2 = c2 .
 Un esercizio interessante consiste nel ricavare la trasformazione della velocità a partire
 dalla quadrivelocità : infatti, se in un sistema di riferimento una particella ha velocità
~v , ed in un altro sistema di riferimento, in moto con velocità ~v 0 rispetto a questo,
 ha velocità ~v 0 , allora sarà uµ = (cγ, γ~v ) e u0µ = (cγ 0 , γ 0~v 0 ). Ma d’altro canto u ed
 u0 devono essere collegati da una T.L. di velocità ~v0 . Sfruttando queste relazioni, è
 possibile trovare la relazione esistente tra ~v e ~v 0

4.4. Quadriaccelerazione. La derivata della quadrivelocità rispetto al tempo proprio
si chiama quadriaccelerazione: aµ = udτ . La quadriaccelerazione ha la particolarità di
                                            µ

essere ortogonale (con la metrica di Minkowsky) alla quadrivelocità: infatti u µ aµ =
uµ du   = 12 dudτuµ = 12 dc   = 0. La relazione tra l’accelerazione e la parte spaziale della
      µ
               µ            2
    dτ                   dτ
quadriaccelerazione è piuttosto complicata: si lascia per esercizio la dimostrazione che
i due vettori puntano in lgenerale in direzioni diverse.

                                        5. D INAMICA
La dinamica è la parte più delicata della relatività speciale: infatti è quella parte del-
la teoria in cui i principi della dinamica newtoniana vengono messi in discussione e
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA                      15

modificati in modo da rimanere consistenti con gli altri postulati della relatività. Ov-
viamente, in questo come in altri casi, la parola ultima delle modifiche apportate spetta
agli esperimenti, che finora hanno verificato solidamente i risultati ottenuti.
5.1. Massa di quiete. Un primo concetto che vogliamo definire è quello di massa di
quiete di un corpo. Vogliamo che la massa costituisca una proprietà del corpo, che non
dipenda dal sistema di riferimento. Non esistono motivi di principio per cui si debba
effettuare una richiesta del genere: infatti proprietà come il volume, le dimensioni,
anche il colore (vedremo in seguito) possono cambiare da un sistema di riferimento
all’altro, e quindi dipendere dalla velocità del corpo. Del resto, alcuni testi di relati-
vità parlano tranquillamente di massa relativistica di un corpo come dipendente dalla
velocità. Però esistono tutta una serie di ragioni pratiche e teoriche non disprezzabili
che fanno preferire una definizione invariante: ad esempio, le particelle subatomiche
sono caratterizzate da una serie di proprietà che le identificano, ed una di esse è la
massa. Tutti gli elettroni, e i protoni, ad esempio, hanno la stessa massa quando que-
sta viene misurata nel sistema di riferimento in cui essi sono in quiete, e così tutti i
neutroni e tutti i mesoni K, π, e qualunque altro riusciate ad immaginare. Sembra un
delitto mascherare questo fatto della natura utilizzando una definizione di massa che
dipenda dalla velocità. Inoltre, e questo lo vedremo in seguito, la massa a riposo di
una particella fornisce una misura dell’energia interna di legame dei vari costituenti.
La scelta che risulterà alla fine più elegante sarà quella di definire la massa di un corpo
tramite misure effettuate nel suo riferimento di quiete. In questo modo la massa risulta
uno scalare (possiede ovviamente lo stesso valore in ogni sistema di riferimento) , e
può essere misurata tranquillamente adoperando i metodi della meccanica newtoniana,
misurando ad esempio l’accelerazione che il corpo subisce quando viene sottoposto ad
una forza nota, purché le velocità che entrano in gioco nel misuramento risultino molto
piccole.
5.2. Quadriimpulso. Possiamo creare un nuovo tensore moltiplicando la quadrivelo-
cità per la massa a riposo di un corpo:
(5.1)                              P µ = muµ = (mcγ, mγ~v )
Concentriamo momentaneamente la nostra attenzione sulla parte spaziale: osserviamo
come a bassa velocità il fattore γ tende ad 1, e quindi la parte spaziale tende alla quan-
tità di moto della particella. Adesso il problema è: la definizione di quantità di moto
newtoniana è corretta, oppure è solamente il limite a bassa velocità della espressione
relativistica8?
Il punto focale è: dato un sistema di due particelle che interagiscono tra di loro, vo-
gliamo che la quantità di moto risulti definita in modo tale che si conservi durante
l’urto. Questa proprietà, dovendo rimanere valida in ogni sistema di riferimento, ci fa
   8
    In questi appunti, considero sinonimi i termini quantità di moto, impulso e momento della particella
(anche se a stretto rigore il secondo è l’integrale della forza, mentre l’ultimo termine è una cattiva
traduzione dell’inglese momentum) in quanto ormai questo è l’uso corrente.
16                                italianISIDORO FERRANTE

        F IGURA 5.1. Esempio adoperato per il calcolo della forma relativistica
        dell’impulso: supponiamo che le masse siano uguali, e che la compo-
        nente y dell’impulso totale sia nulla. Allora la massa 1 torna indietro
        con la stessa velocità, mentre la massa 2 cambia il segno della compo-
        nente y. Lo stesso urto, visto nel sistema S 0 che si muove con velocità
        v0 , appare praticamente uguale, tranne che per il fatto che le masse 1 e
        2 si scambiano il ruolo.
                                                        −v
                      u1    −u1                 u2
           u2
                                                             u1
                v                                        Urto visto in S’
                    Urto visto in S

immediatamente sospettare che la quantità di moto debba essere la parte spaziale di
un quadrivettore. Per corroborare questa ipotesi, possiamo considerare un urto in due
sistemi di riferimento, scelti in modo che i conti siano particolarmente facili. questo
esempio è adoperato dalla maggior parte dei libri, ma una trattazione più generale si
trova nel libro di Jackson.
Supponiamo allora di trovarci in un sistema di riferimento in cui si ha un urto come in
figura 5.1: le masse siano uguali, e la massa 1 torni indietro dopo l’urto con la stessa
velocità u1 . La massa 2, d’altro canto, prima dell’urto ha una velocità ~v di componenti
vx = v0 , vy = u2 : dopo l’urto, la componente x rimane invariata, mentre quella y
cambia di segno.
Supponiamo di osservare adesso lo stesso urto da un sistema di riferimento S 0 che si
muove con velocità v0 rispetto ad x: stavolta, nel nuovo sistema di riferimento, la
massa 2 avrà una componente x della velocità nulla sia prima che dopo l’urto; al
contrario, la massa 1 avrà sia prima che dopo l’urto una componente x della velocità
pari a vx = −v0 .
In pratica, le due masse si saranno scambiate il ruolo! quindi per simmetria, osser-
vando la figura, possiamo concludere che nel sistema di riferimento S 0 la massa 1 avrà
velocità lungo y pari ad u2 , mentre la massa 1 avrà velocità lungo y uguale a u2 . Ma
le due velocità sono collegate da una trasformazione di Lorentz, ovvero: u 01 = u2 ed
anche u02 = u1 . quindi varrà, applicando le 4.1:

                                                   u1
(5.2)                                 u2 = u01 =
                                                   γ
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA           17

Passiamo adesso a considerare la quantità di moto: supponiamo inanzitutto che questa
abbia una forma del tipo: P~ = mg(v)~v dove g(v) è una funzione del modulo della
velocità della particella. In entrambi i sistemi, visto che le masse 1 e 2 tornano indie-
tro con la stessa velocità, la componente y della quantità di moto totale deve essere
nulla: quindi deve risultare mg(u1 )u1 = mg(v)u2 . Applicando la relazione 5.2 si
trova:g(u1) = g(v)/γ. Prendendo il limite per piccole velocità, ed osservando che
perché risulti valido il limite newtoniano deve essere g(0) = 1, si trova: g(v) = γ.

5.3. L’energia. Adesso che abbiamo giustificato l’ipotesi che la parte spaziale del
quadriimpulso corrisponda alla quantità di moto, occupiamoci della componente tem-
porale.
Una prima osservazione che possiamo fare è la seguente: noi vogliamo che la quantità
di moto totale si conservi in un urto indipendentemente dal sistema di riferimento dal
quale compiamo la misura. Ma una trasformazione di Lorentz da un sistema di riferi-
mento all’altro comporta mescolamenti tra la parte spaziale e quella temporale: quindi,
se vogliamo che la conservazione sia indipendente dal sitema scelto, allora dobbiamo
concludere che anche la parte temporale rappresenta una quantità conservata.
Per capire di cosa si tratta, facciamo il limite per piccole velocità:
                                            1 v2
                                                                    
                   0                                  1      2   1 2
                 P = mcγ w mc 1 + 2 =                     mc + mv
                                            2c        c          2
Come si vede, a parte il termine mc2 , non è altro che l’energia cinetica della particella
divisa per la velocità della luce. Ma cosa significa il termine mc2 ? La tentazione è
quella di attribuirgli il significato di energia posseduta dalla particella in assenza di
velocità. Si tratterebbe quindi di un termine che tiene conto di tutta l’energia interna
della particella. Ma è giustificata una ipotesi di questo tipo? Evidentemente si tratta
di una congettura molto forte, in quanto non esiste assolutamente niente del genere in
meccanica newtoniana!
Ci viene incontro in questa supposizione un argomento molto semplice: immaginiamo
di avere un sistema composto da due masse uguali M tenute ad una distanza L da un
sistema di asticciole rigido (vedi figura 5.2). Da una di queste masse parte una certa
quantità di energia sotto forma di onda elettromagnetica che viene assorbita dall’altra.
Sappiamo che la relazione tra l’energia e l’impulso della radiazione elettromagnetica
è E = cP : quindi, in seguito all’emissione, le due masse rinculano e si muovono in
direzione opposta alla radiazione con velocità v = P/2M . Quando la radiazione viene
assorbita dall’altra massa, dopo un tempo circa L/c, il sistema si trova nuovamente
a riposo: nel frattempo però si è spostato in direzione della massa che ha emesso
l’energia di una quantità ∆x = vL/c = EL/(2M c2 ). D’altro canto, però, per la
conservazione della quantità di moto, la posizione del centro di massa deve essere
rimasta invariata! L’unica possibilità a questo punto è che una piccola quantità di
massa ∆M si sia spostata dal’emettitore all’assorbitore, in maniera che il baricentro
non si trovi più al centro delle due masse, ma si sia spostato verso la massa più pesante
18                              italianISIDORO FERRANTE

       F IGURA 5.2. Schema dell’esperimento mentale in grado digiustifica-
       re l’equivalenza tra massa ed energia: due masse uguali sono connesse
       rigidamente a distanza L. Il centro di massa si trova al centro. Dalla
       massa di sinistra un fotone di energia E viene emesso verso destra: le
       due masse rinculano con velocità v = P/2M . Quando il fotone vie-
       ne assorbito, dopo un tempot = L/c, il sistema torna in quiete, ma si
       è spostato di una quantità ∆x = vt = P L/(2M c). Essendo però il
       sistema isolato, il centro di massa deve essere rimasto in quiete: pertan-
       to, si deve supporre che la massa di sinistra abbia perduto una quantità
       di massa ∆M e che una uguale quantità sia stata acquisita dall’altra
       massa. Imponendo che lo spostamento del centro di massa sia uguale
       ed opposto allo spostamento del sistema formato dalle due masse, si
       ottiene:∆M = E/c2 .
                                  M           L                                                         M
                                                                                                       
                                                                                                       
                                                                                                       
                                                                                                           
                                                                             
                                                                                           
                                                     E=cP                      
                                                                                                 
                        v=P/2M                                                   
                                                                                                      
                                                                                   
                                                                                    
                            
                                                           
                                                              
                                                               
                                                                                  
                            
                                                                  
                            
                                                                                       
                            
                                                    ∆x                    
                                                                        
                               M−∆ M                                       M+ ∆ M

di una quantità ∆x. Insomma, bisogna avere:∆x = ∆M L/2M = EL/(2M c 2 ) ovvero
∆M = E/c2 . Quindi si trova che appunto la variazione di massa dell’emettitore è
uguale all’energia della radiazione emessa diviso la velocità della luce al quadrato!
Ovviamente questo ragionamento è solamente approssimativo, in quanto mescola con-
cetti provenienti dall’elettrodinamica e dalla meccanica newtoniana per giungere ad un
risultato relativistico: un conteggio più accurato porta tuttavia allo stesso risultato.
Siamo quindi autorizzati ad ipotizzare che l’energia di una particella relativistica sia
data dalla formula E = √ mc 2 2 . Le conferme sperimentali di questo risultato sono
                                2

                           1−v /c
ormai così tante che non avrebbe senso elencarle tutte: questa formula è adoperata
ormai correntemente in tutti quei calcoli che coinvolgono le particelle all’interno degli
acceleratori che si muovono a velocità molto vicine a quella della luce, e non si sono
mai osservate deviazioni significative.
Quindi il quadriimpulso assume definitivamente la forma: P µ = (E/c, P   ~ ).
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA               19

Prendendone il quadrato, si ottiene: m2 c2 = E 2 /c2 − P~ 2 od anche E 2 = m2 c4 + c2 P~ 2 .
Nel caso di corpi di massa 0, allora E = c|P~ |.
Inoltre, dal semplice esame delle formule 5.1 che danno energia ed impulso in termini
della velocità, si ricava:
                                      P~ = ~v E/c2
Nel caso m = 0 si trova |~v | = c: le particelle prive di massa possono muoversi
solamente alla velocità della luce!

5.3.1. Urti. Definiamo dapprima il concetto di urto in modo preciso: in un processo
di urto si hanno due corpi non interagenti, ciascuno in moto rettilineo uniforme. I due
corpi vengono portati ad interagire brevemente in una regione limitata di spazio e per
un intervallo di tempo finito, dopo di ché l’interazione cessa e i corpi ricominciano a
viaggiare con velocità costante.
Come abbiamo visto, nell’urto tra due particelle si conserva il quadriimpulso totale:
questo significa che nel trattamento relativistico degli urti l’energia totale si conserva
sempre. La cosa non è in contrasto con l’esperienza quotidiana: infatti, in un urto ane-
lastico, l’energia cinetica dei due corpi coinvolti nella collisione si converte in energia
interna, di legame o di agitazione termica. Questa energia rientra nel calcolo della
massa dei corpi: pertanto, in un urto anelastico relativistico, esiste la possibilità che le
masse delle particelle dopo l’urto (dette anche prodotti di reazione) risultino differenti
da quelle che si avevano prima dell’urto! Nel caso di corpi macroscopici, solitamente
le energie cinetiche in gioco sono cosi’ piccole rispetto alla massa a riposo che una
conversione di energia in massa corrisponde ad un trascurabile aumento della massa,
che passa inosservato, a fronte di una grande perdita di energia cinetica, facilmente
osservabile.
Per una trattazione relativistica completa degli urti dobbiamo allora considerare la
possibilità che le masse cambino.
Avremo quindi 2 particelle, a e b, con masse ma ed mb , prima dell’urto, e quadrimo-
menti Paµ e Pbµ , prima dell’urto, ed altre due particelle c e d dopo l’urto, con quadri-
momenti Pcµ e Pdµ . Se sia la particella a a trasformarsi nella c, o se sia la particella b, è
una questione inessenziale, e sostanzialmente indecidibile, soprattutto se consideriamo
particelle microscopiche. La conservazione del quadriimpulso si scrive nella forma:
                                   Paµ + Pbµ = Pcµ + Pdµ
e contiene sia la conservazione dell’impulso che quella dell’energia.
Una quantità molto utile è il modulo quadro dell’impulso totale, moltiplicato per la
velocità della luce al quadrato:
                                                                        2
             s = c2 (Pa + Pb )µ (Pa + Pb )µ = (Ea + Eb )2 − c2 P~a + P~b

Il significato di questa quantità diventa chiaro calcolandola nel sistema del centro dei
momenti, impropriamente detto spesso anche sistema del centro di massa: infatti si
20                               italianISIDORO FERRANTE

       F IGURA 5.3. Scattering Compton: un fotone urta contro un elettrone
       in quiete; a seguito dell’urto, l’elettrone rincula e il fotone cambia la
       sua energia ed il suo impulso.

                                  /home/ferrante/tex/relativita/compton.eps not f

tratta di un invariante, e possiamo calcolarlo dove i conti sono più semplici. Nel si-
stema del centro di massa, appunto, la somma dei momenti delle particelle è nulla.
Pertanto, la quantità s si riduce al quadrato della somma delle energie delle due parti-
celle nel centro di massa, ovvero più semplicemente il quadrato dell’energia nel centro
di massa. Se si ricorda che l’energia di una particella è sempre maggiore alla sua massa
per c2 , si ottiene che per ottenere due particelle di un tipo dato, condizione necessaria
(ma non sufficente) è che l’energia del centro di massa debba essere maggiore della
somma delle masse dei prodotti finali, moltiplicata per c2 .
Example 5.1. Scattering Compton.
Uno degli esempi più interessanti è l’effetto Compton, che consiste nell’urto di un
fotone con un elettrone in quiete (vedere figura 5.3). Si tratta in questo caso di un
urto elastico, in quanto le masse dei prodotti finali sono uguali a quelle dei prodotti
iniziali. In questo caso, Paµ = hν/c(1, k̂); Pbµ = (me c, 0),
                                                            ~ mentre P µ = hν 0 /c(1, k̂),
                                                                        c
  µ
Pd = (me γc, me γ~v ).
Le incognite sono sei (le tre componenti dell’impulso per ognuna delle particelle),
mentre le equazioni sono 4. Una incognita è però eliminabile facilmente osservando
che l’impulso iniziale e i due finali giacciono sullo stesso piano: quindi un angolo
di rotazione intorno alla direzione dell’impulso iniziale è arbitrario, e non cambia le
energie delle particelle finali. Dopo essersi ridotti ad un piano, rimangono 4 equazioni
e tre incognite. Una ulteriore quantità rimane indeterminata: assumiamo che sia l’an-
golo formato tra la direzione del fotone entrante e quella del fotone uscente, ovvero
l’angolo di scattering del fotone.
Allora scriviamo la conservazione del quadriimpulso nella forma:
                                 Pdµ = Paµ + Pbµ − Pcµ
e calcoliamo il prodotto scalare di questa espressione per sè stessa. Ricordiamo che
in base alla definizione Pdµ Pdµ = Pbµ Pbµ = m2e c2 ed inoltre Pcµ Pcµ = Paµ Paµ = 0;
rimangono i doppi prodotti Paµ Pbµ = hνme , Pcµ Pbµ = hν 0 me ed infine Paµ Pcµ =
h2 νν 0
  c2
        (1 − cos θ). Mettendo assieme tutti i pezzi, si ha:
                        c    c     0        h
                          −    = λ   − λ =      (1 − cos θ)
                       ν0 ν                me c
Example 5.2. Energia di soglia
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA                        21

Un altro esempio interessante riguarda il concetto di energia di soglia. Si suppon-
ga di voler inviare un positrone (Particella avente la stessa massa dell’elettrone, ma
di carica positiva: è l’antiparticella dell’elettrone) contro un elettrone, in modo che
nella reazione finale si ottengano un protone ed un antiprotone (protone con cari-
ca negativa). L’ elettrone, inoltre, sia in quiete e il positrone venga sparato addos-
so con impulsoq  indidente P~i ed energia Ei . L’energia del centro di massa è allora:
        √                                  √
Ecm = s = (Ei + me c2 ) − P~ 2 = 2Ei me c2 . Perché si possano produrre due
                                          i
                                                                                                 m2
protoni, deve risultare Ecm > 2mp c , ovvero 2E i me c2 > 4m2p c4 , ed infine E i > 2 mpe c2 .
                                          2

La massa dell’elettrone è di 9.1 × 10−31 Kg, corrispondente ad una energia a riposo di
circa 8 × 10−14 Joule. La massa del protone è circa 1.7 × 10−27 Kg, pari a circa 1.5 ×
10−10 Joule. Inserendo i numeri, si trova allora che il positrone deve avere un’energia
di 5.5 × 10−7 , ovvero 6.7 milioni di volte maggiore della sua massa a riposo 9.
Se invece elettrone e positrone vengono fatti collidere sparandoli uno contro l’altro con
la stessa velocità ed energia Ei , allora l’energia nel centro di massa è semplicemente
2Ei , e quindi basterà che sia Ei > mp c2 , ovvero l’energia incidente deve essere sempli-
cemente maggiore dell’energia a riposo del protone, pari a circa 1800 volte l’energia a
risposo dell’elettrone, decisamente minore di quella calcolata nel caso precedente. E’
proprio su questo principio che si basa il funzionamento dei collisionatori, od anche,
usando il termine inglese, colliders, in cui le particelle vengono scagliate l’una contro
l’altra con uguale velocità.

5.4. Forze. Il concetto di forza in relatività risulta problematico.
Innanzitutto, si perde il concetto di azione a distanza: se ad esempio considero l’in-
terazione tra due elettroni in moto, allora l’informazione sulla posizione di uno dei
due elettroni giunge all’altro con un ritardo che dipende dalla distanza. Nel frattempo,
il primo elettrone si è spostato e quindi la forza non potrà in principio essere diretta
lungo la congiungente, se non in casi speciali. Viene a mancare così il principio di
azione e reazione, fondamentale nella meccanica newtoniana. In fisica relativistica le
interazioni avvengono non tra corpi, bensì tra i corpi ed il campo (elettrico, magnetico,
gravitazionale, o di altra natura) nelle immediate vicinanze di ogni corpo.
Rimane valido però il principio della conservazione della quantità di moto, a patto di
tenere conto della quantità di moto associata al campo che trasporta l’interazione.
Quale sarà la forma assunta dall’equazione F~ = m~a ? Una ipotesi potrebbe essere
qualcosa del tipo: maµ = F µ , dove F µ è un quadrivettore la cui parte spaziale si ridu-
ce alla forza newtoniana nel limite di piccole velocità. Ma questo non ci dice molto:
infatti le forme γ F~ , F~ , F~ /γ si riducono tutte alla forma newtoniana per basse velocità,
e niente ci impedisce di pensarne mille altre. Si rende necessario dare parola all’espe-
rimento: ad esempio, considerando la deflessione di un elettrone a velocità prossima
   9
    Per confronto, un insetto di massa intorno ad 1 mg, che vola ad una velocità di circa 50 cm/s ha una
energia cinetica di circa 10−4 Joule. La sua energia a riposo, per contro, è di circa 1014 Joule.
Puoi anche leggere
DIAPOSITIVE SUCCESSIVE ... Annulla