IL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVIT RISTRETTA
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
IL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA ISIDORO FERRANTE 1. I NTRODUZIONE In questo ciclo di lezioni ci proponiamo di seguire un percorso molto formale nella formulazione della teoria, partendo dai postulati di Einstein, e riscrivendo le leggi della fisica utilizzando quello che tecnicamente si chiama formalismo covariante, ovvero quel sistema di notazione che permette di riconoscere immediatamente la struttura matematica delle varie quantità fisiche che entrano in gioco. A partire dal formalismo covariante, si discende ai risultati particolari in termi di quantità note e misurabili, e si cerca di spiegare gli effetti in termini di semplici osservazioni. Ovviamente un simile approccio non è pensabile nell’insegnamento della scuola se- condaria: ma del resto lo scopo di queste lezioni non è quello di fornire gli strumenti per l’insegnamento, bensì quello di mettere gli insegnanti in condizione tale da poter in caso affrontare la lettura di un testo specialistico sull’argomento, per cercare le ri- sposte alle domande che spesso ingenuamente ci si pone davanti ad una teoria che in alcuni casi fornisce dei risultati lontani dal senso comune. Si daranno per conosciuti gli aspetti fondamentali della teoria, dal significato di sitema di riferimento inerziale, alle trasformazioni di Lorentz, alle contrazioni delle lunghezze e dilatazione dei tempi. 2. A LCUNI PROBLEMI DELLA MECCANICA NEWTONIANA E DELL’ ELETTROMAGNETISMO CLASSICO . La situazione della fisica precedente all’articolo sulla relatività generale del 1905 pre- sentava alcuni piccoli problemi di tipo logico o sperimentale che gli scienziati del tem- po cercavano di risolvere tramite situazioni ad hoc, senza pensare che un ripensamento delle leggi della meccanica fosse necessario per una loro completa comprensione. La meccanica newtoniana, anche se riscritta parzialmente nel ’700 e ’800, era rimasta so- stanzialmente invariata, nella sostanza, dall’epoca dei principia di Newton. Qualche problemino c’era, è vero, di natura sia logica che sperimentale. Il principale problema di natura logica era ovviamente quello dell’azione a distanza: non era per niente chiaro il meccanismo per cui due corpi avrebbero potuto influenzarsi a vicenda attraverso lo spazio, e il concetto stesso aveva avuto qualche difficoltà ad affermarsi. C’era anche il problema di definire cosa fosse esattamente un sistema inerziale, e di capire come 1
2 italianISIDORO FERRANTE mai una certa classe di sistemi di riferimento risultasse privilegiata rispetto ad altri, ma sembrava un problema minore. Dal punto di vista sperimentale, le cose andavano decisamente meglio: l’unica osservazione non spiegabile tramite la meccanica newto- niana era la famosa precessione di 43” per secolo nel perielo di Mercurio, peraltro un residuo di una precessione osservata di ben 574” per secolo, di cui la teoria newtoniana riusciva a spiegare solamente 531” per secolo Le cose peggiorarono quando si cercò di rendere coerenti le leggi della meccanica con l’elettrodinamica di Maxwell. Un primo problema si ha ad esempio nella formulazione ~ Nella meccanica newtoniana si assumeva valesse della forza di Lorentz1, F~ = q ~vc × B. la relatività di Galileo: ovvero, dato un sistema chiuso (chiamiamolo laboratorio) non è possibile determinare se questo si muove o sta fermo senza compiere esperimenti che coinvolgano in qualche maniera gli oggetti che si trovano all’esterno del laboratorio stesso. In modo del tutto formale si dice che le equazioni del moto devono risultare invarianti per trasformazioni del tipo x~0 = ~x − ~v t. Osserviamo innanzitutto che una trasformazione del genere non ha effetti sulla acce- lerazione, e pertanto nemmeno sulla forza: questo vuol dire che la forza tra due corpi non può dipendere dalla posizione e velocità assoluta di uno di essi, bensì solamente dalla posizione e velocità relativa: F~1→2 = F~ (~x1 − ~x2 , ~v1 − ~v2 ). La forza di Loren- tz invece non ha questa caratteristica, a meno di non interpretare la velocità ~v come misurata in un qualche particolare sistema di riferimento. La situazione in realtà è decisamente peggiore: infatti le equazioni delle onde elettro- magnetiche, c12 ∂∂tE2 − ∇ ~ = 0 NON risulta invariante per trasformazioni di Galileo, e 2~ ~ 2E alla stessa maniera non risulta invariante il complesso delle equazioni di Maxwell. Al- tri problemi derivavano dall’analisi di problemi apparentemente semplici: ad esempio, si considerino due particelle in moto con la stessa velocità ~v in una direzione che for- ma un angolo con la congiungente (figura 2.1). Esiste un sitema di riferimento in cui queste cariche sono in quiete, e si attraggono con una forza diretta lungo la congiun- gente data dalla formula di Coulomb. Nel sistema di riferimento in cui le cariche sono in moto, ognuna di queste produce un campo magnetico le cui linee di forza sono cir- conferenze coassiali con la linea di moto; in conseguenza di ciò, su ciascuna delle due cariche nasce una forza Fm di origine magnetica che non è diretta lungo la congiungen- te. Sommata alla forza elettrica, si ottengono due risultati interessanti: innanzitutto, tra le due cariche si osserva una coppia che tende a farle ruotare; in secondo luogo, nel sistema in cui le due cariche sono a riposo la forza è diretta lungo la congiungente: le trasformazioni di Galileo prevedono invece che questa NON cambi direzione. Che fine fa il principio di azione e reazione? E la conservazione del momento angolare? E come mai le trasformazioni di Galileo falliscono? Un problema molto simile vien fuori da un esempio altrettanto semplice: si consideri la situazione esemplificata in figura 2.2: stavolta le due velocità non devono essere 1 Adopereremo il sistema di unità di misura detto gaussiano, in quanto utile per semplificare molte delle formule adoperate: vedi la sezione dedicata all’elettromagnetismo.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 3 F IGURA 2.1. Due cariche viste da un sistema di riferimento che si muove con velocità v rispetto ad ess: sorgono delle forze di natura magnetica che fanno sì che la forza che agisce su ciascuna delle due cariche non risulti diretta lungo la congiungente. q v Fe Fm F q v F IGURA 2.2. Sulla carica 1 agisce solamente la forza dovuta al campo elettrico generato dalla carica 2; su questa invece agiscono sia la forza dovuta al campo elettrico che quella dovuta al campo magnetico. v1 F 21 v2 Fm F12 necessariamente uguali. Sulla carica superiore agisce solamente la forza dovuta al campo elettrico della carica inferiore: infatti, lungo la direzione del moto il campo magnetico è nullo. Sulla carica inferiore invece agiscono sia le forze dovute al campo elettrico che quelle dovute al campo magnetico prodotti dalla carica superiore. Stavolta, la forza di origine magnetica non si annulla, anzi è diretta verso sinistra. Di nuovo,che fine fa il principio di azione e reazione? In realtà i fisici della fine del diciannovesimo secolo non erano troppo turbati da queste osservazioni: infatti, la natura ondulatoria della luce, così come era ormai stata defini- tivamente accertata sperimentalmente, richiede nel loro modo di vedere l’esistenza di un mezzo in grado di trasportare le vibrazioni dovute ai campi elettromagnetici. Si pensava insomma che, analogamente a quanto accade con le onde sonore, esistes- se un qualche substrato, detto etere, in grado di propagare le onde elettromagnetiche.
4 italianISIDORO FERRANTE A questo punto, la mancata validità delle relatività galileiana per le equazioni elet- tromagnetiche non veniva a costituire più un problema, perché si veniva a creare un sistema di riferimento privilegiato, quello in cui l’etere si trovava a riposo, appunto, nel quale valevano le equazioni di Maxwell: in tutti gli altri sistemi di riferimento sa- rebbero comparsi dei fattori correttivi generalmente troppo piccoli per essere rivelati sperimentalmente. Purtroppo tutti gli esperimenti destinati a determinare le caratteristiche fisiche dell’e- tere portavano a risultati contraddittori: un classico esempio è il risultato di Fizeau sulla velocità della luce all’interno di dielettrici in moto. Fizeau misurò la velocità della luce all’interno di un tubo percorso da un flusso di acqua in moto con veloci- tà v, trovando dei risultati compatibili con l’ipotesi che la velocità aumentasse di un termine 1 − n2 v: si tratta di un risultato difficilmente comprensibile in meccanica 1 classica, in quanto porterebbe ad ipotizzare che l’etere venisse trascinato solamente parzialmente dal moto del fluido. Inoltre, i tentativi di misurare direttamente il moto della Terra attraverso l’etere, so- prattutto ad opera di Michaelson e Morley, portarono, come è noto, a risultati negativi. 2.1. I postulati di Einstein. La strategia adoperata da Einstein è quella di rifiutare l’i- dea dell’esistenza di un sistema di riferimento inerziale privilegiato: assieme a questo principio, Einstein assume anche la congettura che la velocità della luce sia la stessa in qualunque sistema di riferimento inerziale. A partire da questi due postulati, Einstein ricava rapidamente le conseguenze più rivo- luzionare della sua teoria: la revisione del concetto di simultaneità, le trasformazioni di Lorentz come equazioni che collegano le misure di tempo e distanza tra due sistemi inerziali diversi, la contrazione delle lunghezze e la dilatazione dei tempi, l’aberrazione della luce, fino ad arrivare alle equazioni del moto dell’elettrone. In questa trattazione noi seguiremo un approccio simile, ma partendo non dall’inva- rianza della velocità della luce, bensì dalla richiesta di invarianza delle equazioni della dinamica e dell’elettrodinamica rispetto alle trasformazioni di Lorentz. Si tratta di un approccio più moderno, in gran parte dovuto ad un ex professore di Einstein, Min- kowsky, il quale si occupò di formalizzare la struttura dello spazio tempo così come concepito da Einstein, il quale dapprima rimase perplesso di fronte al lavoro del col- lega, salvo poi accettarlo in toto quando si rese conto di quanto venisse facilitata la formulazione della teoria della relatività generale. 2.2. Il concetto di invarianza. Si dice che una determinata legge fisica espressa nella forma A = B è invariante sotto una certa trasformazione se questa trasformazione cambia nello stesso modo sia la quantità A che la quantità B trasformando l’equazione in un’altra del tipo A0 = B 0 . Le leggi della fisica classiche, newtoniane, ad esempio sono invarianti per rotazioni del sistema di riferimento: ad esempio, in F~ = m~a sia la forza che la accelerazio- ne si trasformano alla stessa maniera se si adopera un sistema di riferimento ruotato
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 5 rispetto ad un qualunque asse. Certamente, le componenti dei vettori F~ e ~a cambieran- no nel passaggio al nuovo sistema di riferimento, ma in modo tale che l’uguaglianza venga sempre rispettata. Altre due invarianze importanti nella meccanica newtonia- na sono quelle per traslazioni spaziali (che trasforma la coordinata ~x nella coordinata ~x0 = ~x + x~0 ) o temporali (t → t0 = t + t0 ): ovvero, cambiando l’origine delle coor- dinate o l’origine dei tempi, le equazioni devono rimanere valide. Questo ci porta a concludere, ad esempio, che la forza tra due corpi a e b può dipendere solamente dalla loro posizione relativa e non da quella assoluta: ovvero F~ab = F~ (~xa − ~xb ). Altre due importanti invarianze sono quelle per inversioni spaziali, o parità, o per inversioni temporali. La prima ci dice che non ha importanza se prendo una terna di assi cartesiani destrorsi o sinistrorsi, ottenuta invertendo il verso di tutti e tre gli assi(x, ˆ ŷ, ẑ) → (x̂0 , ŷ 0 , ẑ 0 ) = (−x̂, −ŷ, −ẑ): infatti le componenti dell’accelerazione cambieranno segno così come quelle della forza2. Un caso particolare è dato dalla forza di Lorentz: F~ = qv ~ × B. ~ In questa espressione, infatti, cambiando di segno alle componenti degli assi, si giunge- rebbe ad un assurdo, in quanto il prodotto vettoriale rimarrebbe alla fine dello stesso segno.... Il problema viene risolto in quanto dallo studio delle equazioni di Maxwell si scopre che le componenti di del campo magnetico non cambiano di segno se si cambia il segno agli assi del sistema di riferimento! Si dice allora che B ~ è uno pseudovettore, in quanto si comporta come un vettore per rotazioni, ma in modo diverso per trasfor- mazioni di parità. Una quantità con proprietà simili è il momento della quantità di moto. L’invarianza per inversione temporale è una questione invece assai delicata: vuol dire infatti che ogni processo fisico visto alla rovescia, ossia dalla fine al principio, rimane sempre un processo fisicamente probabile. Sappiamo che questo è vero microscopi- camente: le leggi fondamentali che regolano le interazioni tra le particelle elementari ubbidiscono a questa regola3; tuttavia sappiamo anche che le leggi macroscopiche, che coinvolgono le interazioni tra molti corpi, non risultano reversibili temporalmente. Un esempio banale: in un corpo soggetto ad attrito viscoso, F~ = −κ~v = m~a, per inver- sione temporale cambia segno il termine della forza, ma non quello dell’accelerazione (l’accelerazione, in quanto derivata seconda rispetto al tempo, non cambia segno per inversione temporale, mentre la velocità sì). In questo caso, infatti, la forza sorge dalla somma degli urti che il corpo subisce contro le molecole del fluido in cui è immerso: i singoli urti sono reversibili temporalmente, ma il loro effetto complessivo no. L’ultima invarianza, quella che ci interessa di più, è invece l’invarianza per trasforma- zioni di Galileo: ~x0 = ~x − ~v t 2Sappiamo però che questo non è vero se si considerano le interazioni deboli. 3 In realtà le interazioni deboli sembrano violarla: non esiste una prova sperimentale diretta, ma alcuni principi teorici uniti a dati sperimentali puntano in questa direzione.
6 italianISIDORO FERRANTE Ovvero, se ci trasferiamo da un sistema di riferimento ad un altro che si muove rispetto a questo con velocità costante ~v le equazioni non cambiano. L’accelerazione è ovviamente invariante: infatti, derivando due volte si ottiene ~a 0 = ~a. Ne segue che perché l’equazione di newton sia invariante deve risultare che la forza deve dipendere dalla posizione relativa degli oggetti, come già visto, ed eventualmente dalla velocità relativa: F~ab = F~ (x~a − x~b , ~va − ~vb ). Nel caso del moto nel fluido viscoso, l’invarianza non è ovviamente rispettata: infatti in quel caso abbiamo un sistema di riferimento privilegiato, ovvero quello in cui il fluido è in quiete, e la velocità va misurata relativamente a quel sistema di riferimento. Passiamo adesso ad esaminare le leggi dell’elettromagnetismo: le equazioni di max- well sono invarianti rispetto alle trasformazioni viste prima, tranne in un caso: ovvero quello delle trasformazioni di galileo. Per trasformazioni di Galileo compaiono nelle equazioni termini aggiuntivi, che non vi è modo di eliminare. 4 Ora, si potrebbe pensare che cambiando sistema di riferimento questi termini in qual- che modo si compensino ad esempio nel calcolo delle forze: bene, non è così. L’elet- tromagnetismo non è invariante per trasformazioni di Galileo. Sappiamo però che le trasformazioni di Lorentz, quelle ottenute supponendo l’inva- rianza della velocità della luce in un cambiamento di sistema di riferimento inerziale, lasciano invariate le equazioni di Maxwell (e lo dimostreremo nel seguito). Possiamo quindi cambiare leggermente i postulati di Einstein nei due seguenti: (1) Le relazioni tra le misure di spazio e di tempo in due sistemi di coordinate che si muovono con velocità relativa costante sono dati dalle equazioni di Lorentz (2) Tutte le equazioni fondamentali della fisica sono invarianti sotto trasformazioni di Lorentz. Partiremo da questo punto, quindi, e al termine ricaveremo l’invarianza della velocità della luce. 2.3. Le trasformazioni di Lorentz. Richiamiamo le trasformazioni di Lorentz: in quasi tutti gli esempi in questi appunti ci riferiremo alla situazione seguente: conside- riamo un sistema di riferimento S ed un altro sistema di riferimento S 0 che si muove rispetto a questo con velocità ~v senza ruotare. 4Ad esempio, consideriamo l’equazione ∇ ~ ×E ~ = − 1c ∂∂tB . Per trasformazione di Galileo dal sistema ~ S a quello S che si muove con velocità v lungo l’asse y, i campi si trasformano nel modo seguente: 0 E~ 0 (~x0 ) = E(~ ~ x − ~v t), B ~ x − ~v t). Le derivate rispetto alla coordinate non cambiano: ∇ ~ 0 (~x0 ) = B(~ ~ 0 = ∇, ~ ma la dipendenza rispetto al tempo contiene una dipendenza aggiuntiva! Si ha quindi ∂t = ∂t − (~v · ∂B~0 ~ ∂B ~ B. ∇) ~ Si ha quindi un termine aggiuntivo che non va via. Si può pensare che l’errore stia nell’assunto secondo cui basti sostituire le nuove coordinate per ottenere i campi E ~ 0, B ~ 0 , ed in effetti è così : nel nuovo sistema di riferimento i campi cambiano. Tenendo conto di questa possibilità, il termine extra si trasforma in un termine del secondo ordine in v/c, ma non scompare del tutto.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 7 F IGURA 2.3. Due sistemi di riferimento S ed S 0 si muovono con velo- cità relativa uniforme diretta lungo x. All’istante t = 0 le origini delle coordinate coincidono, ed inoltre t0 = 0. S S’ v O O’ Supponiamo inoltre per semplicità che all’istante t = 0 le origini O ed O 0 coincidano, ed inoltre che in quell’istante anche nel sistema S 0 valga t0 = 0 Supponiamo infine che la velocità ~v sia orientata lungo l’asse x (vedi figura ). Allora dato un evento, ovvero un punto di coordinate spaziali x, y, z e coordinate temporali t, nel sistema S 0 le coordinate saranno: 1 x0 = q (x − vt) v2 1− c2 1 v t0 = q t − x 2 1 − vc2 c2 y0 = y z0 = z Solitamente si introducono i simboli: β = vc , γ = √ 1 ; inoltre si moltiplica il tempo 1−β 2 t per la velocità della luce in modo da avere grandezze omogenenee. Con questo simbolismo, le T.L. acquistano una forma simmetrica: x0 = γ (x − βct) ct0 = γ (ct − βx) y0 = y (2.1) z0 = z Le trasfomazioni inverse si ottengono rapidamente spostando gli apici e cambiando v con −v: x = γ (x0 + βct0 ) ct = γ (ct0 + βx0 ) y = y0 z = z0
8 italianISIDORO FERRANTE 3. D EFINIZIONE DELLO SPAZIO QUADRIDIMENSIONALE CON METRICA DI M INKOWSKY. Cominciamo col definire delle quantità che chiameremo vettori controvarianti, o anche quadrivettori (o tetravettori, con una parola in disuso). Un quadrivettore viene individuato da quattro componenti, che si indicano con gli indici da 0 a 3. Lo indichiamo col simbolo xµ (fate attenzione all’indice in alto: è la chiave del formalismo). La componente con indice uguale a 0 è detta componente temporale del quadrivettore, mentre le componenti da 1 a 3 sono dette componenti spaziali. Una forma alternativa di indicare un vettore di questo tipo è x µ = (x0 , ~x). Definiamo un prodotto scalare tra vettori nella forma5 hx, yi = x0 y 0 − x1 y 1 − x2 y 2 − x3 y 3 = x0 y 0 − ~x · ~y. Osservate questa formula: risulta un po’ complicata da applicare, soprattutto perché a volta i termini vanno sommati, a volte sottratti. Nel formalismo einsteniano, questo prodotto scalare si scrive anche nella forma: hx, yi = Σ µ,ν gµν xµ y ν , dove gµν è una matrice diagonale i cui elementi sono g00 = 1, g11 = g22 = g33 = −1. Notare anche stavolta la posizione degli indici. Si assume per convenzione che quando due indici sono uguali, ed uno si trova in alto e l’altro in basso, allora si somma su di essi. In questo modo si semplifica ulteriormente la formula:hx, yi = g µν xµ y ν . L’uso della matrice metrica gµν serve per il momento solamente ad evitare il problema dei segni che cambiano. Ci si può spingere ancora più in là nella semplificazione: si definiscono i cosiddetti vettori controvarianti secondo la formula: x µ = gµν xν : un vettore controvariante ha quindi componenti x0 = x0 , x1 = −x1 , x2 = −x2 , x3 = −x3 , ovvero xµ = (x0 , −~x). In questo modo il prodotto scalare si scrive nella forma: hx, yi = xµ y µ = xµ yµ . Da notare che qualunque tra i due vettori x o y può essere trasformato nell’equivalente controvariante. Cosa sono questi vettori controvarianti? I fisici di solito si trovano spaesati di fronte a questo nuovo concetto: in fondo un vettore controvariante sembra uguale ad un vettore covariante, a parte i segni cambiati. Per i matematici invece la differenza è più chiara, in quanto riconoscono nei vettori controvarianti gli elementi di uno spazio duale. Il fatto che la forma di g sia così semplice è dovuta essenzialmente al fatto che stiamo adoperando coordinate cartesiane. Se avessimo adoperato ad esempio coordinate pola- ri nello spazio, allora la matrice g avrebbe avuto una forma completamente differente e i vettori controvarianti sarebbero risultati completamente diversi dai vettori covarianti, al punto di non avere neanche le stesse dimensioni. 5 Nei testi più vecchi, si utilizzano gli indici da 1 a 4: le componenti spaziali del quadrivettore sono le prome tre, mentre la quarta componente è puramente immaginaria. In questo modo il prodotto scalare assume la forma consueta, ma assume segno opposto a quello da noi definito: hx, yi = x 1 y 1 + x2 y 2 + x3 y 3 + (ix4 · iy 4 ) = ~x · ~y − x4 y 4 . Questa notazione apparentemente più semplice risulta perè alla lunga macchinosa e non è estendibile alla relatività generale.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 9 Il vantaggio di adoperare questa notazione risulterà evidente quando si passerà a siste- mi di coordinate qualsiasi (nella relatività generale).6 Allo stesso modo in cui abbiamo definito la matrice gµν possiamo definire una matrice g µν che ritrasforma il vettore controvariante in un vettore covariante. Nel linguaggio gergale, moltiplicare per una matrice gµν abbassa un indice, mentre moltiplicare per g µν lo alza. In questa semplice rappresentazione, gli elementi di g µν sono uguali a quelli di gµν . Si noti inoltre che gν µ = gνµ = δνµ dove δ indica il simbolo di kronecker. 3.1. Il gruppo di Lorentz. Fino a questo punto abbiamo costruito uno spazio quadri- dimensionale, e l’abbiamo dotato di una sua metrica. Adesso definiamo le trasformazioni di Lorentz come quelle trasformazioni lineari che lasciano invariato il prodotto scalare tra due quadrivettori, ovvero quelle che, dati due quadrivettori di componenti xµ , xν , le trasformano in x0µ , y 0µ , in modo tale che x0µ yµ0 = xµ y µ . Entrando nel dettaglio, data una qualsiasi trasformazione lineare definita dalla ma- trice Λµ ν tale che x0µ = Λµ ν xν (si noti che l’ordine degli indici è importante, la matrice in generale non è simmetrica), e definita la matrice covariante Λ µ ν ottenu- ta abbassando un indice ed alzandone un altro tramite la matrice metrica g µν , allora deve aversi:x0µ yµ0 = Λµ k xk Λµ λ yλ , ovvero Λµ k Λν k = δνµ . Questa è una relazione di ortogonalità tra matrici. Si può dimostrare facilmente come il determinante della ma- trice Λ debba essere uguale a ±1. A noi interessano solamente quelle trasformazioni che possono essere ricondotte con continuità alla matrice identità, ovvero quelle con determinante 1. Inoltre, vogliamo considerare solamente quelle trasformazioni che non cambiano se- gno alla coordinata temporale (trasformazioni ortocrone) : si verifica che queste cor- rispondono al caso Λ00 > 0. Queste due condizioni definiscono le cosiddette trasfor- mazioni di Lorentz proprie. Si dimostra che costituiscono un gruppo, il gruppo di Lorentz. Le rotazioni costituiscono un sottogruppo del gruppo di Lorentz: infatti, mantengono invariato il modulo della parte spaziale e non toccano la parte temporale. Si può dimostrare anche intuitivamente che una qualunque trasformazione del gruppo è scrivibile come l’applicazione successiva di un massimo di 6 trasformazioni succes- sive: una rotazione intorno a ciascuno dei dei tre assi, ed una spinta (la spinta è una Trasformazione di Lorentz che non prevede rotazioni del sistema di riferimento) lungo ciascuno dei tre assi. Le matrici che effettuano le trasformazioni sono7: 6Nell’eseguire materialmente i conti, conviene pensare ai vettori controvarianti come vettori colonna, mentre i vettori covarianti sono vettori riga. Nel passare da un vettore controvariante al corrispondente covariante, si traspone e si cambia il segno agli indici 1, 2 e 3. 7Consideriamo il primo indice come il numero di riga ed il secondo come numero di colonna.
10 italianISIDORO FERRANTE rotazioni spinte 1 0 0 0 γ −βγ 0 0 0 1 0 0 −βγ γ 0 0 x 0 0 cos θx sin θx 0 0 1 0 0 0 − sin θx cos θx 0 0 0 1 1 0 0 0 γ 0 −βγ 0 0 cos θy 0 sin θy 0 1 0 0 y 0 0 1 0 −βγ 0 γ 0 0 − sin θy 0 cos θy 0 0 0 1 1 0 0 0 γ 0 0 −βγ 0 cos θz sin θz 0 0 1 0 0 z 0 − sin θz cos θz 0 0 0 1 0 0 0 0 1 −βγ 0 0 γ dove, seguendo la notazione usuale, abbiamo posto per brevità β = vc , γ = √ 1 . 1−β 2 3.2. Scalari, quadrivettori, tensori. Fin qui abbiamo incontrato due tipi di grandez- ze: quelle che per trasformazioni di Lorentz rimangono invarianti, e li chiameremo scalari, e i quadrivettori, che invece si trasformano tramite la matrice Λ. Possiamo generalizzare la nozione di quadrivettore considerando una grandezza mu- nita di N indici, ciascuno dei quali si può alzare od abbassare tramite la matrice g µν , che da un sistema all’altro si trasforma tramite moltiplicazione di ciascuno degli indici per una matrice Λ: si parla allora di tensori di rango N. Gli scalari sono quindi tensori di rango 0 e i quadrivettori tensori di rango 1. Adoperemo nel seguito quasi esclusi- vamente tensori di rango 2, che quindi i trasformano sotto T.L. secondo la formula: T 0µν = Λµ k Λµ λ T κλ . A partire da due vettori si possono costruire due tensori indipendenti, uno simmetrico e uno asimmetrico: S µν = xµ y ν + xν y µ Aµν = xµ y ν − xν y µ I tensori antisimmetrici posseggono una strana proprietà molto utile: sotto rotazioni, gli elementi A0i , con i = 1, 2, 3, si comportano esattamente come un vettore tridi- mensionale. Non solo, ma gli elementi (A23 , −A13 , A21 ) si comportano analogamente come un normale vettore tridimensiale sotto rotazioni. La verifica si può effettuare moltiplicando esplicitamente la generica matrice antisimmetrica per una delle matri- ci che effettuano rotazioni lungo uno qualunque degli assi. Se però si effettua una operazione di parità, ovvero si cambia la direzione di tutti e tre gli assi spaziali (tra- sformazione a determinante -1, e quindi non appartenenente al gruppo di Lorentz), gli
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 11 elementi A0i cambiano di segno, mentre gli elementi (A23 , −A13 , A21 ) rimangono in- variati. Insomma, un tensore antisimmetrico corrisponde, nello spazio tridimensionale, ad un vettore ed uno pseudovettore, e si può scrivere nella forma: 0 Vx Vy Vz −Vx 0 Pz −Py Aµν = −Vy −Pz 0 Px −Vz Py −Px 0 Si può moltipicare un vettore per un tensore contraendo due indici, ovvero facendo in modo che uno di questi sia covariante ed uno controvariante, ponendoli uguali, e sommando su di essi: B µ = T µν Vν = Tν µ V ν Si possono moltiplicare anche due tensori tra di loro: K µν = T µλ Sλ ν Il risultato del prodotto di più tensori eseguito secondo queste regole è un altro tensore, di rango pari al numero di indici liberi. La traccia di un tensore di rango 2, ottenuta contraendo i due indici tra di loro, è un invariante: T r(T ) = T µµ = T 00 + T 11 + T 22 + T 33 = T 00 − T 11 − T 22 − T 33 Insomma, le regole d’oro per lavorare con i tensori sono: quando si contraggono due indici, uno deve essere in alto ed uno in basso. Dalla contrazione di due indici, si ottie- ne un tensore di rango inferiore di due unità. A destra e a sinistra di una uguaglianza, si devono trovare lo stesso numero di indici, con lo stesso nome e nella stessa posi- zione. Queste regolette ci permettaranno di procedere alla formalizzazione della teo- ria ella relatività procedendo pressocché alla velocità della luce (senza mai superarla, ovviamente). Possiamo osservare, en passant, come le matrici gµν e Λµ ν siano dei tensori (cosa di per sé non banale). La dimostrazione è lasciata come esercizio. 3.3. Invarianza sotto trasformazioni di Lorentz. A questo punto possiamo capire cosa vuol dire che le equazioni della meccanica e dell’elettromagnetismo devono es- sere invarianti sotto trasformazioni di Lorentz: vuol dire che possiamo scriverle in forma cosiddetta covariante a vista ovvero del tipo: Aµ = B µ , dove Aµ e B µ sono due quantità fisiche che si trasformano entrambe come quadrivettori. Ovviamente anche le forme T µν = S µν od anche Aµ = T µν B ν sono forme covarianti, e quindi possibili leggi fisiche. La cosa importante è che a destra e a sinistra delle equazioni si abbiano oggetti che si trasformano allo stesso modo da un sistema di riferimento inerziale all’altro. Adesso possiamo tornare alla fisica, e classificare le quantità che conosciamo in base alle proprietà di trasformazione.
12 italianISIDORO FERRANTE 3.4. Coordinate, separazione. Il primo quadrivettore con cui avremo a che fare sarà il vettore posizione, che individua univocamente un evento dello spazio tempo, dato un particolare riferimento inerziale. Sarà xµ = (ct, ~x). Dati due eventi vicini a e b, e indicate con xµa e xµb le coordinate dei due eventi, definiamo come separazione tra gli eventi la differenza tra le due coordinate ∆xµ = xµb − xµa . Sia inoltre tb > ta in quel particolare riferimento, ovvero a precede b. Il modulo quadro (con la metrica relativistica) di questo quadrivettore è l’intervallo tra i due eventi: ∆s2 = ∆xµ ∆xµ = c2 (tb − ta )2 − (~xb −~xa )2 . Questo intervallo può essere positivo, negativo o nullo. Se l’intervallo è positivo, allora si dice di tipo tempo. In questo caso esiste un sistema di riferimento in cui gli eventi a e b avvengono nello stesso q luogo, ma con un certo intervallo di tempo. In questo caso, la quantità ∆τ = ∆s rappresenta l’intervallo 2 c2 temporale tra i due eventi. Si può verificare facilmente che in ogni altro sistema di riferimento la distanza temporale tra i due eventi risulterà maggiore: la quantità ∆τ costituisce l’intervallo di tempo proprio tra i due eventi a e b. I due eventi posso- no (ma non debbono necessariamente) essere collegati da un nesso di tipo causale, e precisamente a è la causa e b l’effetto. Se l’intervallo è negativo, è detto di tipo spazio. Esiste un sistema di riferimento in cui i due eventi avvengono nello stesso istante, ma in luoghi diversi. √ In quel sistema di riferimento, la componente temporale si annulla. La quantità ∆l = −∆s2 costituisce la distanza propria tra i due eventi. Stavolta i due eventi NON sono collegati da un nesso causale. Infine particolare importanza riveste il caso ∆s2 = 0: in questo caso, esiste un raggio di luce che partendo dall’evento a raggiunge l’evento b : i due eventi sono separati da un intervallo di tipo luce. Può esistere anche in questo caso un nesso causale tra l’evento a e l’evento b. 4. C INEMATICA . Si consideri un punto materiale (o particella) che descrive una certa traiettoria nello spazio. Siamo abituati a descrivere la traiettoria come una curva nello spazio tridi- mensionale, data da tre equazioni parametriche ~x(t). La descrizione relativistica del moto della stessa particella non cambia di molto: stavolta abbiamo un quadrivettore ~ xµ (t) = (ct, x(t)). Rispetto al caso non relativistico, la traiettoria deve soddisfare in più alla condizione che la velocità risulti inferiore alla velocità della luce. Ovviamente i valori delle coordinate cambiano a seconda del sistema di riferimento che abbiamo scelto per descrivere il moto: supponiamo di averne scelto uno in modo assolutamente casuale ed arbitrario. 4.1. Tempo proprio. Consideriamo due punti della traiettoria, agli istanti t e t + dt. La separazione tra questi due eventi è uguale a dxµ = (cdt, ~v dt).L’intervallo è ovvia- mente di tipo temporale, come del resto si osserva calcolandolo esplicitamente:ds 2 =
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 13 F IGURA 4.1. Diagramma spazio temporale del paradosso dei gemelli ct ct1 1/2 cdτ =(c2 dt2 −dx2 ) t1 . Questo non è altro che il R t1 R t1 dτ paradosso dei gemelli esposto in modo formalmente rigoroso. 4.2. Velocità. La velocità ordinaria di una particella risulta dal rapporto tra la parte spaziale e quella temporale di un quadrivettore:~v = d~x dt . Quindi le proprietà di trasfor- mazione da un sistema di riferimento all’altro non sono per niente ovvie: la velocità non è un quadrivettore. Per questo motivo, le sue proprietà di trasformazione da un sistema di riferimento all’altro risultano particolari: per ottenerle, basta scrivere le trasformazioni di Lorentz in forma differenziale: dx0 = γ (dx − βcdt) cdt0 = γ (cdt − βcdx) dy 0 = dy dz 0 = dz dove β = v0 /c è la velocità di S 0 rispetto ad S, e poi dividere membro a membro:
14 italianISIDORO FERRANTE dx0 dx − βcdt vx − v 0 vx0 = = = dt0 dt − βdx/c 1 − vxc2v0 dy 0 dy vy (4.1) vy0 = = = γ 1 − vxc2v0 0 dt γ (dt − βdx/c) dz 0 dz vz vz0 = = = γ 1 − vxc2v0 dt0 γdt − βdx/c Si lascia come esercizio la dimostrazione che qualunque siano ~v e v 0 , si ha sempre |~v 0 | < c, e che se |~v | = c allora anche |~v 0 | = c 4.3. Quadrivelocità. Dividendo invece la separazione infinitesima tra due punti del- la traiettoria di una particella (quadrivettore) per il corrispondente intervallo di tem- po proprio (invariante) si ottiene ovviamente un quadrivettore: u µ = dx . Il nome µ dτ che viene dato a questa quantità fisica è quadrivelocità. Le sue componenti sono: uµ = (γc, γ~v ). Il concetto di quadrivelocità non scalza quello di semplice velocità di una particella: infatti, la velocità di un punto materiale risulta facilmente accessibile alla misurazione, in quanto coinvolge il rapporto tra grandezze misurate nello stesso sistema di riferimento (mentre l’intervallo di tempo proprio è definito nel sistema di quiete della particella). Si noti inoltre che la quadrivelocità non risulta definita per un raggio di luce, in quanto l’intervallo di tempo proprio risulta identicamente uguale a zero. Moltiplicando la quadrivelocità per se stessa, si trova facilmente: uµ uµ = γ 2 c2 − γ 2~v 2 = c2 . Un esercizio interessante consiste nel ricavare la trasformazione della velocità a partire dalla quadrivelocità : infatti, se in un sistema di riferimento una particella ha velocità ~v , ed in un altro sistema di riferimento, in moto con velocità ~v 0 rispetto a questo, ha velocità ~v 0 , allora sarà uµ = (cγ, γ~v ) e u0µ = (cγ 0 , γ 0~v 0 ). Ma d’altro canto u ed u0 devono essere collegati da una T.L. di velocità ~v0 . Sfruttando queste relazioni, è possibile trovare la relazione esistente tra ~v e ~v 0 4.4. Quadriaccelerazione. La derivata della quadrivelocità rispetto al tempo proprio si chiama quadriaccelerazione: aµ = udτ . La quadriaccelerazione ha la particolarità di µ essere ortogonale (con la metrica di Minkowsky) alla quadrivelocità: infatti u µ aµ = uµ du = 12 dudτuµ = 12 dc = 0. La relazione tra l’accelerazione e la parte spaziale della µ µ 2 dτ dτ quadriaccelerazione è piuttosto complicata: si lascia per esercizio la dimostrazione che i due vettori puntano in lgenerale in direzioni diverse. 5. D INAMICA La dinamica è la parte più delicata della relatività speciale: infatti è quella parte del- la teoria in cui i principi della dinamica newtoniana vengono messi in discussione e
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 15 modificati in modo da rimanere consistenti con gli altri postulati della relatività. Ov- viamente, in questo come in altri casi, la parola ultima delle modifiche apportate spetta agli esperimenti, che finora hanno verificato solidamente i risultati ottenuti. 5.1. Massa di quiete. Un primo concetto che vogliamo definire è quello di massa di quiete di un corpo. Vogliamo che la massa costituisca una proprietà del corpo, che non dipenda dal sistema di riferimento. Non esistono motivi di principio per cui si debba effettuare una richiesta del genere: infatti proprietà come il volume, le dimensioni, anche il colore (vedremo in seguito) possono cambiare da un sistema di riferimento all’altro, e quindi dipendere dalla velocità del corpo. Del resto, alcuni testi di relati- vità parlano tranquillamente di massa relativistica di un corpo come dipendente dalla velocità. Però esistono tutta una serie di ragioni pratiche e teoriche non disprezzabili che fanno preferire una definizione invariante: ad esempio, le particelle subatomiche sono caratterizzate da una serie di proprietà che le identificano, ed una di esse è la massa. Tutti gli elettroni, e i protoni, ad esempio, hanno la stessa massa quando que- sta viene misurata nel sistema di riferimento in cui essi sono in quiete, e così tutti i neutroni e tutti i mesoni K, π, e qualunque altro riusciate ad immaginare. Sembra un delitto mascherare questo fatto della natura utilizzando una definizione di massa che dipenda dalla velocità. Inoltre, e questo lo vedremo in seguito, la massa a riposo di una particella fornisce una misura dell’energia interna di legame dei vari costituenti. La scelta che risulterà alla fine più elegante sarà quella di definire la massa di un corpo tramite misure effettuate nel suo riferimento di quiete. In questo modo la massa risulta uno scalare (possiede ovviamente lo stesso valore in ogni sistema di riferimento) , e può essere misurata tranquillamente adoperando i metodi della meccanica newtoniana, misurando ad esempio l’accelerazione che il corpo subisce quando viene sottoposto ad una forza nota, purché le velocità che entrano in gioco nel misuramento risultino molto piccole. 5.2. Quadriimpulso. Possiamo creare un nuovo tensore moltiplicando la quadrivelo- cità per la massa a riposo di un corpo: (5.1) P µ = muµ = (mcγ, mγ~v ) Concentriamo momentaneamente la nostra attenzione sulla parte spaziale: osserviamo come a bassa velocità il fattore γ tende ad 1, e quindi la parte spaziale tende alla quan- tità di moto della particella. Adesso il problema è: la definizione di quantità di moto newtoniana è corretta, oppure è solamente il limite a bassa velocità della espressione relativistica8? Il punto focale è: dato un sistema di due particelle che interagiscono tra di loro, vo- gliamo che la quantità di moto risulti definita in modo tale che si conservi durante l’urto. Questa proprietà, dovendo rimanere valida in ogni sistema di riferimento, ci fa 8 In questi appunti, considero sinonimi i termini quantità di moto, impulso e momento della particella (anche se a stretto rigore il secondo è l’integrale della forza, mentre l’ultimo termine è una cattiva traduzione dell’inglese momentum) in quanto ormai questo è l’uso corrente.
16 italianISIDORO FERRANTE F IGURA 5.1. Esempio adoperato per il calcolo della forma relativistica dell’impulso: supponiamo che le masse siano uguali, e che la compo- nente y dell’impulso totale sia nulla. Allora la massa 1 torna indietro con la stessa velocità, mentre la massa 2 cambia il segno della compo- nente y. Lo stesso urto, visto nel sistema S 0 che si muove con velocità v0 , appare praticamente uguale, tranne che per il fatto che le masse 1 e 2 si scambiano il ruolo. −v u1 −u1 u2 u2 u1 v Urto visto in S’ Urto visto in S immediatamente sospettare che la quantità di moto debba essere la parte spaziale di un quadrivettore. Per corroborare questa ipotesi, possiamo considerare un urto in due sistemi di riferimento, scelti in modo che i conti siano particolarmente facili. questo esempio è adoperato dalla maggior parte dei libri, ma una trattazione più generale si trova nel libro di Jackson. Supponiamo allora di trovarci in un sistema di riferimento in cui si ha un urto come in figura 5.1: le masse siano uguali, e la massa 1 torni indietro dopo l’urto con la stessa velocità u1 . La massa 2, d’altro canto, prima dell’urto ha una velocità ~v di componenti vx = v0 , vy = u2 : dopo l’urto, la componente x rimane invariata, mentre quella y cambia di segno. Supponiamo di osservare adesso lo stesso urto da un sistema di riferimento S 0 che si muove con velocità v0 rispetto ad x: stavolta, nel nuovo sistema di riferimento, la massa 2 avrà una componente x della velocità nulla sia prima che dopo l’urto; al contrario, la massa 1 avrà sia prima che dopo l’urto una componente x della velocità pari a vx = −v0 . In pratica, le due masse si saranno scambiate il ruolo! quindi per simmetria, osser- vando la figura, possiamo concludere che nel sistema di riferimento S 0 la massa 1 avrà velocità lungo y pari ad u2 , mentre la massa 1 avrà velocità lungo y uguale a u2 . Ma le due velocità sono collegate da una trasformazione di Lorentz, ovvero: u 01 = u2 ed anche u02 = u1 . quindi varrà, applicando le 4.1: u1 (5.2) u2 = u01 = γ
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 17 Passiamo adesso a considerare la quantità di moto: supponiamo inanzitutto che questa abbia una forma del tipo: P~ = mg(v)~v dove g(v) è una funzione del modulo della velocità della particella. In entrambi i sistemi, visto che le masse 1 e 2 tornano indie- tro con la stessa velocità, la componente y della quantità di moto totale deve essere nulla: quindi deve risultare mg(u1 )u1 = mg(v)u2 . Applicando la relazione 5.2 si trova:g(u1) = g(v)/γ. Prendendo il limite per piccole velocità, ed osservando che perché risulti valido il limite newtoniano deve essere g(0) = 1, si trova: g(v) = γ. 5.3. L’energia. Adesso che abbiamo giustificato l’ipotesi che la parte spaziale del quadriimpulso corrisponda alla quantità di moto, occupiamoci della componente tem- porale. Una prima osservazione che possiamo fare è la seguente: noi vogliamo che la quantità di moto totale si conservi in un urto indipendentemente dal sistema di riferimento dal quale compiamo la misura. Ma una trasformazione di Lorentz da un sistema di riferi- mento all’altro comporta mescolamenti tra la parte spaziale e quella temporale: quindi, se vogliamo che la conservazione sia indipendente dal sitema scelto, allora dobbiamo concludere che anche la parte temporale rappresenta una quantità conservata. Per capire di cosa si tratta, facciamo il limite per piccole velocità: 1 v2 0 1 2 1 2 P = mcγ w mc 1 + 2 = mc + mv 2c c 2 Come si vede, a parte il termine mc2 , non è altro che l’energia cinetica della particella divisa per la velocità della luce. Ma cosa significa il termine mc2 ? La tentazione è quella di attribuirgli il significato di energia posseduta dalla particella in assenza di velocità. Si tratterebbe quindi di un termine che tiene conto di tutta l’energia interna della particella. Ma è giustificata una ipotesi di questo tipo? Evidentemente si tratta di una congettura molto forte, in quanto non esiste assolutamente niente del genere in meccanica newtoniana! Ci viene incontro in questa supposizione un argomento molto semplice: immaginiamo di avere un sistema composto da due masse uguali M tenute ad una distanza L da un sistema di asticciole rigido (vedi figura 5.2). Da una di queste masse parte una certa quantità di energia sotto forma di onda elettromagnetica che viene assorbita dall’altra. Sappiamo che la relazione tra l’energia e l’impulso della radiazione elettromagnetica è E = cP : quindi, in seguito all’emissione, le due masse rinculano e si muovono in direzione opposta alla radiazione con velocità v = P/2M . Quando la radiazione viene assorbita dall’altra massa, dopo un tempo circa L/c, il sistema si trova nuovamente a riposo: nel frattempo però si è spostato in direzione della massa che ha emesso l’energia di una quantità ∆x = vL/c = EL/(2M c2 ). D’altro canto, però, per la conservazione della quantità di moto, la posizione del centro di massa deve essere rimasta invariata! L’unica possibilità a questo punto è che una piccola quantità di massa ∆M si sia spostata dal’emettitore all’assorbitore, in maniera che il baricentro non si trovi più al centro delle due masse, ma si sia spostato verso la massa più pesante
18 italianISIDORO FERRANTE F IGURA 5.2. Schema dell’esperimento mentale in grado digiustifica- re l’equivalenza tra massa ed energia: due masse uguali sono connesse rigidamente a distanza L. Il centro di massa si trova al centro. Dalla massa di sinistra un fotone di energia E viene emesso verso destra: le due masse rinculano con velocità v = P/2M . Quando il fotone vie- ne assorbito, dopo un tempot = L/c, il sistema torna in quiete, ma si è spostato di una quantità ∆x = vt = P L/(2M c). Essendo però il sistema isolato, il centro di massa deve essere rimasto in quiete: pertan- to, si deve supporre che la massa di sinistra abbia perduto una quantità di massa ∆M e che una uguale quantità sia stata acquisita dall’altra massa. Imponendo che lo spostamento del centro di massa sia uguale ed opposto allo spostamento del sistema formato dalle due masse, si ottiene:∆M = E/c2 . M L M E=cP v=P/2M ∆x M−∆ M M+ ∆ M di una quantità ∆x. Insomma, bisogna avere:∆x = ∆M L/2M = EL/(2M c 2 ) ovvero ∆M = E/c2 . Quindi si trova che appunto la variazione di massa dell’emettitore è uguale all’energia della radiazione emessa diviso la velocità della luce al quadrato! Ovviamente questo ragionamento è solamente approssimativo, in quanto mescola con- cetti provenienti dall’elettrodinamica e dalla meccanica newtoniana per giungere ad un risultato relativistico: un conteggio più accurato porta tuttavia allo stesso risultato. Siamo quindi autorizzati ad ipotizzare che l’energia di una particella relativistica sia data dalla formula E = √ mc 2 2 . Le conferme sperimentali di questo risultato sono 2 1−v /c ormai così tante che non avrebbe senso elencarle tutte: questa formula è adoperata ormai correntemente in tutti quei calcoli che coinvolgono le particelle all’interno degli acceleratori che si muovono a velocità molto vicine a quella della luce, e non si sono mai osservate deviazioni significative. Quindi il quadriimpulso assume definitivamente la forma: P µ = (E/c, P ~ ).
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 19 Prendendone il quadrato, si ottiene: m2 c2 = E 2 /c2 − P~ 2 od anche E 2 = m2 c4 + c2 P~ 2 . Nel caso di corpi di massa 0, allora E = c|P~ |. Inoltre, dal semplice esame delle formule 5.1 che danno energia ed impulso in termini della velocità, si ricava: P~ = ~v E/c2 Nel caso m = 0 si trova |~v | = c: le particelle prive di massa possono muoversi solamente alla velocità della luce! 5.3.1. Urti. Definiamo dapprima il concetto di urto in modo preciso: in un processo di urto si hanno due corpi non interagenti, ciascuno in moto rettilineo uniforme. I due corpi vengono portati ad interagire brevemente in una regione limitata di spazio e per un intervallo di tempo finito, dopo di ché l’interazione cessa e i corpi ricominciano a viaggiare con velocità costante. Come abbiamo visto, nell’urto tra due particelle si conserva il quadriimpulso totale: questo significa che nel trattamento relativistico degli urti l’energia totale si conserva sempre. La cosa non è in contrasto con l’esperienza quotidiana: infatti, in un urto ane- lastico, l’energia cinetica dei due corpi coinvolti nella collisione si converte in energia interna, di legame o di agitazione termica. Questa energia rientra nel calcolo della massa dei corpi: pertanto, in un urto anelastico relativistico, esiste la possibilità che le masse delle particelle dopo l’urto (dette anche prodotti di reazione) risultino differenti da quelle che si avevano prima dell’urto! Nel caso di corpi macroscopici, solitamente le energie cinetiche in gioco sono cosi’ piccole rispetto alla massa a riposo che una conversione di energia in massa corrisponde ad un trascurabile aumento della massa, che passa inosservato, a fronte di una grande perdita di energia cinetica, facilmente osservabile. Per una trattazione relativistica completa degli urti dobbiamo allora considerare la possibilità che le masse cambino. Avremo quindi 2 particelle, a e b, con masse ma ed mb , prima dell’urto, e quadrimo- menti Paµ e Pbµ , prima dell’urto, ed altre due particelle c e d dopo l’urto, con quadri- momenti Pcµ e Pdµ . Se sia la particella a a trasformarsi nella c, o se sia la particella b, è una questione inessenziale, e sostanzialmente indecidibile, soprattutto se consideriamo particelle microscopiche. La conservazione del quadriimpulso si scrive nella forma: Paµ + Pbµ = Pcµ + Pdµ e contiene sia la conservazione dell’impulso che quella dell’energia. Una quantità molto utile è il modulo quadro dell’impulso totale, moltiplicato per la velocità della luce al quadrato: 2 s = c2 (Pa + Pb )µ (Pa + Pb )µ = (Ea + Eb )2 − c2 P~a + P~b Il significato di questa quantità diventa chiaro calcolandola nel sistema del centro dei momenti, impropriamente detto spesso anche sistema del centro di massa: infatti si
20 italianISIDORO FERRANTE F IGURA 5.3. Scattering Compton: un fotone urta contro un elettrone in quiete; a seguito dell’urto, l’elettrone rincula e il fotone cambia la sua energia ed il suo impulso. /home/ferrante/tex/relativita/compton.eps not f tratta di un invariante, e possiamo calcolarlo dove i conti sono più semplici. Nel si- stema del centro di massa, appunto, la somma dei momenti delle particelle è nulla. Pertanto, la quantità s si riduce al quadrato della somma delle energie delle due parti- celle nel centro di massa, ovvero più semplicemente il quadrato dell’energia nel centro di massa. Se si ricorda che l’energia di una particella è sempre maggiore alla sua massa per c2 , si ottiene che per ottenere due particelle di un tipo dato, condizione necessaria (ma non sufficente) è che l’energia del centro di massa debba essere maggiore della somma delle masse dei prodotti finali, moltiplicata per c2 . Example 5.1. Scattering Compton. Uno degli esempi più interessanti è l’effetto Compton, che consiste nell’urto di un fotone con un elettrone in quiete (vedere figura 5.3). Si tratta in questo caso di un urto elastico, in quanto le masse dei prodotti finali sono uguali a quelle dei prodotti iniziali. In questo caso, Paµ = hν/c(1, k̂); Pbµ = (me c, 0), ~ mentre P µ = hν 0 /c(1, k̂), c µ Pd = (me γc, me γ~v ). Le incognite sono sei (le tre componenti dell’impulso per ognuna delle particelle), mentre le equazioni sono 4. Una incognita è però eliminabile facilmente osservando che l’impulso iniziale e i due finali giacciono sullo stesso piano: quindi un angolo di rotazione intorno alla direzione dell’impulso iniziale è arbitrario, e non cambia le energie delle particelle finali. Dopo essersi ridotti ad un piano, rimangono 4 equazioni e tre incognite. Una ulteriore quantità rimane indeterminata: assumiamo che sia l’an- golo formato tra la direzione del fotone entrante e quella del fotone uscente, ovvero l’angolo di scattering del fotone. Allora scriviamo la conservazione del quadriimpulso nella forma: Pdµ = Paµ + Pbµ − Pcµ e calcoliamo il prodotto scalare di questa espressione per sè stessa. Ricordiamo che in base alla definizione Pdµ Pdµ = Pbµ Pbµ = m2e c2 ed inoltre Pcµ Pcµ = Paµ Paµ = 0; rimangono i doppi prodotti Paµ Pbµ = hνme , Pcµ Pbµ = hν 0 me ed infine Paµ Pcµ = h2 νν 0 c2 (1 − cos θ). Mettendo assieme tutti i pezzi, si ha: c c 0 h − = λ − λ = (1 − cos θ) ν0 ν me c Example 5.2. Energia di soglia
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA 21 Un altro esempio interessante riguarda il concetto di energia di soglia. Si suppon- ga di voler inviare un positrone (Particella avente la stessa massa dell’elettrone, ma di carica positiva: è l’antiparticella dell’elettrone) contro un elettrone, in modo che nella reazione finale si ottengano un protone ed un antiprotone (protone con cari- ca negativa). L’ elettrone, inoltre, sia in quiete e il positrone venga sparato addos- so con impulsoq indidente P~i ed energia Ei . L’energia del centro di massa è allora: √ √ Ecm = s = (Ei + me c2 ) − P~ 2 = 2Ei me c2 . Perché si possano produrre due i m2 protoni, deve risultare Ecm > 2mp c , ovvero 2E i me c2 > 4m2p c4 , ed infine E i > 2 mpe c2 . 2 La massa dell’elettrone è di 9.1 × 10−31 Kg, corrispondente ad una energia a riposo di circa 8 × 10−14 Joule. La massa del protone è circa 1.7 × 10−27 Kg, pari a circa 1.5 × 10−10 Joule. Inserendo i numeri, si trova allora che il positrone deve avere un’energia di 5.5 × 10−7 , ovvero 6.7 milioni di volte maggiore della sua massa a riposo 9. Se invece elettrone e positrone vengono fatti collidere sparandoli uno contro l’altro con la stessa velocità ed energia Ei , allora l’energia nel centro di massa è semplicemente 2Ei , e quindi basterà che sia Ei > mp c2 , ovvero l’energia incidente deve essere sempli- cemente maggiore dell’energia a riposo del protone, pari a circa 1800 volte l’energia a risposo dell’elettrone, decisamente minore di quella calcolata nel caso precedente. E’ proprio su questo principio che si basa il funzionamento dei collisionatori, od anche, usando il termine inglese, colliders, in cui le particelle vengono scagliate l’una contro l’altra con uguale velocità. 5.4. Forze. Il concetto di forza in relatività risulta problematico. Innanzitutto, si perde il concetto di azione a distanza: se ad esempio considero l’in- terazione tra due elettroni in moto, allora l’informazione sulla posizione di uno dei due elettroni giunge all’altro con un ritardo che dipende dalla distanza. Nel frattempo, il primo elettrone si è spostato e quindi la forza non potrà in principio essere diretta lungo la congiungente, se non in casi speciali. Viene a mancare così il principio di azione e reazione, fondamentale nella meccanica newtoniana. In fisica relativistica le interazioni avvengono non tra corpi, bensì tra i corpi ed il campo (elettrico, magnetico, gravitazionale, o di altra natura) nelle immediate vicinanze di ogni corpo. Rimane valido però il principio della conservazione della quantità di moto, a patto di tenere conto della quantità di moto associata al campo che trasporta l’interazione. Quale sarà la forma assunta dall’equazione F~ = m~a ? Una ipotesi potrebbe essere qualcosa del tipo: maµ = F µ , dove F µ è un quadrivettore la cui parte spaziale si ridu- ce alla forza newtoniana nel limite di piccole velocità. Ma questo non ci dice molto: infatti le forme γ F~ , F~ , F~ /γ si riducono tutte alla forma newtoniana per basse velocità, e niente ci impedisce di pensarne mille altre. Si rende necessario dare parola all’espe- rimento: ad esempio, considerando la deflessione di un elettrone a velocità prossima 9 Per confronto, un insetto di massa intorno ad 1 mg, che vola ad una velocità di circa 50 cm/s ha una energia cinetica di circa 10−4 Joule. La sua energia a riposo, per contro, è di circa 1014 Joule.
Puoi anche leggere