Relativitás elmélet

A Fizipedia wikiből



Törölni!!! Speciális relativitáselmélet címen új cikket hoztam létre (Sz.Zsolt)

A hírek, azaz az információ megszerzése és továbbítása az Emberiség történelmének egyik fontos tényezője volt. Győzelem vagy vereség függött a gyors, pontos információáramlástól. De lehet-e vajon tetszőleges gyorsasággal hírt közölni? Az elektrodinamikából tudjuk, hogy a csillagos égbolt éppen c fénysebességgel küld felénk információt az Univerzum állapotáról. Ha „távolra” nézünk, egyben a „múltba” is tekintünk. Mit „látnánk”, ha utolérnénk a fényt? Vajon lehetséges-e kitalálni egy fénynél sebesebb információközlési módszert? Vagy talán a fénysebesség valóban egy „objektív” áttörhetetlen korlát?

Tartalomjegyzék


Elvek (posztulátumok)

Inerciarendszer a Newtoni mechanikában

Mint azt a klasszikus mechanikában már megtanultuk, a Newton-féle tér- és időszemlélet tükrözi a hétköznapi, egyszerű elképzelésünket. Azt gondoljuk, hogy létezik egy végtelen nagy (az egész Univerzumra kiterjedő) „álló” inerciarendszer, azaz van egy univerzális „Színpad” (tér) amelyen a Világ eseményei megtörténnek. Ebben mozognak a galaxisok, ebben mozog a Földünk is és a Föld felszínén lévő testek mozgását is ehhez az abszolút rendszerhez kellene viszonyítanunk. Valamint létezik (egy nagyon absztrakt) „valami”, amit időnek nevezünk. Ez „egyenletesen telik” a végtelen távoli múlttól a „jelen pillanatig” és tudjuk, hogy ezt teszi a jövőben is „az idők végezetéig”. Az abszolút inerciarendszerben a távolságokat (azaz a „Teret”) méterrúddal mérjük, az „Időt” pedig órával. Mindezt eleve (a priori) adottnak, mintegy természetesnek vesszük.

Nem vitatjuk e szemlélet jogosságát. Pedig megtehetnénk, ugyanis mindez csupán egy kulturális örökség és így meglehetősen speciális. A görögöktől kapott Euklideszi geometria a végtelen (homogén) tér szemléletét hagyta ránk. A geometriai törvények szigorú (logikai) rendje szinte evidensé teszi a térszemléletünk helyességét. A kereszténység (teremtéselméletén alapuló) lineáris időszemlélete hosszú generációkon keresztül ivódott belénk. Tudjuk, hogy más kultúrákban az időt más tulajdonságúnak képzelik az emberek. Például a hinduk időszemléletét a linearitás helyett a periodikusság jellemzi. Ennek vallási vetülete pl. a reinkarnációban való hit is.

Az álló, univerzális (abszolút) inerciarendszerhez képest minden egyenletes sebességgel mozgó vonatkoztatási rendszer szintén inerciarendszer. Azaz, ha létezik egy inerciarendszer, akkor végtelen sok is létezik! A Newton axiómák inerciarendszerekben érvényesek. Ez fordítva is igaz: (definíciószerűen) inerciarendszerek azok, amelyekben a Newton axiómák teljesülnek. Ez azt jelenti, hogy ha bezárkózunk egy inerciarendszerbe, akkor semmiféle mechanikai kísérlettel nem tudjuk eldönteni, hogy az abszolút rendszerben vagyunk-e vagy pedig nem. De ez azt is jelenti, hogy bármelyik inerciarendszert tekinthetjük állónak. Ezt egyszerűsített formában úgy mondjuk, hogy mechanikai kísérlettel nem tudjuk eldönteni, hogy állunk-e vagy mozgunk. Természetesen „mozgó” rendszeren mindig egyenletesen mozgót kell érteni.

Ezen az egyáltalán nem triviális problémán már Galileo Galilei is gondolkodott és tökéletesen megfogalmazta az inerciarendszerek ekvivalenciáját. Gondolatait a Discorsi e dimostrazioni matematiche, intorno due nuove scienze attenenti alla mecanica & i movimenti locali (Matematikai érvelések és bizonyítások) című 1638-ban kiadott művében igen részletesen és precízen fejtette ki. Ez még Isaac Newton előtt volt, így itt „csak” (!) a mozgások matematikai leírását adja meg (pl. a jól ismert s=a t^2 /2 itt szerepel először a fizika történetében). A „tehetetlenség” törvényének az első megfogalmazását is itt találhatjuk meg. Newton ezeket már „készen kapta”. Az ő érdeme ezen gondolatok matematizálása és egységbe foglalása volt (Newton axiómák).

Az elmondottakból következik, hogy elegendő csak két (tetszőleges) inerciarendszert vizsgálni. A kettő közül az egyiket (bármelyiket) tekinthetjük állónak és a másikat (ehhez épest) mozgónak. Az, hogy melyik melyik, pusztán megállapodás kérdése. Az állónak tekintett rendszert K-val, mozgónak tekintett rendszert K'-vel szoktuk jelölni. Az élő beszédben pedig „vesszős” és „vesszőtlen” rendszert mondunk. Ezek után azt vizsgáljuk, hogy ugyanazt a mechanikai jelenséget milyennek észleli a K-ban illetve a K'-ben lévő megfigyelő. Ezeket gyakran „álló megfigyelőnek” illetve „mozgó megfigyelőnek” hívjuk. Mármost azt várjuk, hogy bizonyos mért adatok (pl. a hely, a sebesség) a két inerciarendszerben ugyan mások lesznek, de ezek egymásba átszámolhatók. Ezt az átszámolási technikát nevezzük Galilei-féle transzformációnak.

A konkrét matematikai tárgyalás érdekében (a szokásos módszert követve) definiálnunk kell mind az álló, mind pedig a mozgó inerciarendszerben egy-egy koordinátarendszert. Célszerű lesz a „legegyszerűbb”, Descartes koordináták választása. K-ban a koordinátákat és az időt (x,y,z)-vel és t-vel, K'-ben (x',y',z')-vel és t'-vel jelöljük. Mivel a fizikai eredmény nem függ sem a koordinátarendszer konkrét helyzetétől, sem az időszámítás kezdetétől, ezeket úgy válaszjuk meg, hogy:

  1. a megfelelő koordinátatengelyek egymással párhuzamosak,
  2. az x és x' tengelyek abba az irányba mutatnak, amit a két rendszer egymáshoz képesti (egyenletes, u nagyságú) sebessége kitüntet,
  3. a t=t'=0 időpillanatban a koordinátarendszerek origója (O és O') egybeesik (következésképpen az x és x' tengelyek minden időpillanatban egybeesnek).
Fiz2 Rel 01.jpg

Az elkövetkezőkben mindig ezt a konvenciót fogjuk követni. Modern szóval élve ez lesz a default vagy az „alapértelmezés”. A relativitáselmélet szakirodalmában ezt standard boost-nak hívják.

Egy valamilyen erő hatására mozgó tömegpont esetében a Galilei-transzformáció a következő (triviális) összefüggéseket jelenti (lásd a 2.ábra):

\displaystyle  x' = x - u t,
\displaystyle  y' = y,
\displaystyle  z' = z,
\displaystyle  t' = t.

<<2. abra>>

Az utolsó egyenlet azt a természetes tényt rögzíti, hogy az időt mindkét inerciarendszerben ugyanolyan módon mérjük (ugyanazt a naptárt és órát használjuk). A sebességek és a gyorsulások egyszerű t=t' szerinti deriválással kaphatók:

\displaystyle  \dot{x}' = \dot{x} - u
\displaystyle \dot{y}' = \dot{y}
\displaystyle \dot{z}' = \dot{z}
\displaystyle  \ddot{x}' = \ddot{x}
\displaystyle \ddot{y}' = \ddot{y}
\displaystyle \ddot{z}' = \ddot{z}
\displaystyle  {\rm ahol}\quad \dot{x}' = \frac{{\rm d} x'}{{\rm d} t'} = \frac{{\rm d} x'}{{\rm d} t}, \quad\cdots

Tehát a sebesség nem, de a gyorsulás mindkét rendszerben ugyannak adódik. Tegyük fel (mert igazából semmi nem indokolná az ellenkezőjét), hogy a pont m tömege és a rá ható \bf{F} erő mindkét rendszerből mérve ugyanaz. Így valóban a Newton-féle mozgásegyenlet (mind a vesszős, mind pedig a vesszőtlen rendszerben) ugyanolyan alakú lesz:

\displaystyle  m \ddot{\bf r}' = {\bf F} \quad\leftrightarrow\quad m \ddot{\bf r} = {\bf F}.

Ezt nevezzük Galilei-féle relativitás elvnek. Nyilvánvaló, hogy ha egyetlen tömegpont mozgástörvényét ismerjük, akkor nagyon sok, egymással kölcsönható tömegpontokból álló rendszer mozgását is meg tudjuk határozni (lásd: merev testek, folyadékok, gázok mechanikáját). Ezek után megállapíthatjuk, hogy a Galilei-féle relativitási elv szerint:

A mechanika törvényei minden inerciarendszerben ugyanazok (azaz egyforma matematikai alakban fogalmazhatók meg).

A speciális relativitáselmélet posztulátumai

A leggyorsabb haladás érdekében az „axiomatikus utat” fogjuk követni: egy egyszerűsített „felvezetés” után kimondjuk a speciális relativitáselmélet alaptörvényeit (ezek neve „Einstein-posztulátumok”) majd ezek következményeit részletesen megtárgyaljuk. A kapott „relativisztikus” effektusok mindegyikét (közvetlen vagy közvetett) kísérletek sokasága igazolja illetve (és ez a fontosabb) az elmúlt 100 évben még nem találkoztunk olyan természeti jelenséggel, amely cáfolta volna ezen törvények valamelyikét.

Hiba! Nincs fentebb említve semmi!

A fentebb említett „áltudományos” művekkel kapcsolatban célszerű egy igen egyszerű „prakticista” álláspontra helyezkedni. A Természetet semmiféle filozófiai okoskodással nem lehet kitalálni. Ezért ne filozofálgassunk a relativitáselméletről! Elegendő csupán az, ha valaki elvégez egyetlen egy olyan kísérletet, amely az einsteni posztulátumok bármelyikét egyértelműen és reprodukálható módon megcáfolja. Azaz mér egy c-nél nagyobb hatásterjedési sebességet vagy egy fizikai méréssel megállapítja, hogy mozog-e vagy nyugalomban van! Ennél több nem is kell! Minden egyéb csak szócséplés és üres „filozofálgatás”!

Galilei (1564-1642) és Newton (1642-1727) után mintegy 200 évvel James Clerk Maxwell (1831-1879) megalkotta az elektrodinamika alaptörvényeit, az ún. Maxwell egyenleteket. Az 1864-ben megjelent művének a címe: Az elektromágneses mező dinamikájának elmélete”. Joggal merülhet fel a kérdés, hogy vajon ezek az egyenletek melyik vonatkoztatási rendszerben érvényesek. Ha következetesek akarunk lenni, akkor azt kell mondanunk, hogy természetesen a Newton-féle Univerzális (abszolút) Rendszerben (a Világszínpadon) biztosan jónak kell lennie. Hiszen ezért fogadjuk el alaptörvénynek. De mi a helyzet a többi (mozgó) inerciarendszerrel? Vajon ezek az „új” törvények ugyanúgy viselkednek, mint a Newton-féle mechanika, vagy esetleg másképpen? Azaz változatlanok maradnak-e, ha az abszolút rendszerből áttérünk egy mozgó rendszerre. Erre csak a tapasztalat adhatja meg a választ!

Mint azt már láttuk, a Maxwell-egyenletek szerint léteznie kell elektromágneses hullámoknak (EMH). Mivel a vákuum homogén és izotróp, így az EMH-k terjedése is ilyen kell hogy legyen. Valóban, Heinrich Hertz (1857-1894) kísérletileg kimutatta ezek létezését (1885-1889) ami még érdekesebbé tette a fenti kérdést. Ugyanis a klasszikus tapasztalatok szerint egy hullámjelenség mindig valamilyen anyagi közegben lép fel. Jól ismert példaként a hanghullámokat (levegőben), a rugalmas hullámokat (szilárd anyagban) vagy a felületi vízhullámokat említhetnénk. Így aztán nyilvánvaló volt, hogy az elektromágneses hullámnak is valamilyen anyagi közegre van szüksége. Ez a közeg azonban (a mechanikai szemlélet szerint) igen szokatlan tulajdonságú. Láttuk, hogy a (sík) EMH szerkezete olyan, hogy a térben és időben változó („hullámzó”) elektromos és mágneses térerősség merőleges a terjedési irányra, azaz ún. tranzverzális hullámról van szó.

Fiz2 Rel 03.jpg

A mechanikában tranzverzális hullámok csak szilárd anyagokban (ahol nyírási erőhatások ébredhetnek) lépnek fel. Az EMH-t hordozó közeg tehát a szilárd anyagokra emlékeztet. Ugyanakkor ebben a közegben a testek akadálytalanul mozoghatnak (pl. az égitestek), így ez a közeg a tömeggel bíró testek számára érzékelhetetlen. Ezért elnevezték „éternek”. Az éter görög szó (aithér). A mitológia szerint földi levegő felett lévő (könnyű, fénylő és tiszta) égi levegő, amelyben az istenek laknak.

Tehát – gondolták a régiek – az abszolút, álló Univerzális Rendszert kitölti az éter és az EMH (pl. a fény) ebben terjed éppen c sebességgel. Az EMH pedig a töltések között fellépő elektromágneses kölcsönhatások hordozója, közvetítője. Mint azt láttuk, a Maxwell-egyenletekben egyetlen sebességadat szerepel, ezt jelöltük c-vel. Az egyenletekből levezethető hullámegyenletben éppen ez a c jelenik meg. Ennek megoldásaként adódó EMH sebességére is ugyanez a c adódik. Mindezt már részletesen tárgyaltuk az elektrodinamikában. A kérdés mármost az, hogy mekkora lesz az x tengely mentén pozitív irányban haladó EMH sebessége, ha az éterhez képest mozgó inerciarendszerben mérjük azt meg (alapértelmezés!). A hullámoknál tapasztaltak szerint ennek különböznie kell a c-től. Valóban, ha a Maxwell egyenletekből levezethető hullámegyenletet a fenti módon áttranszformáljuk a mozgó rendszerbe, akkor az új hullámegyenlet megoldására egy c'=c+u, illetve c'=c-u sebességű fényhullámot kapunk, attól függően, hogy szembe mozgunk-e a fénnyel (-x) vagy vele egyező irányban (+x). De ez azt is jelentené, hogy ami a mechanikában lehetetlen volt, az most lehetővé válik: egy egyszerű fénysebesség méréssel meg tudnánk mondani, hogy „állunk-e vagy mozgunk”.

Van azonban egy érdekes tény! Ugyanis, ha a Maxwell-egyenleteken (külön-külön mind a négyen) végrehajtjuk az (x,y,z,t)-re vonatkozó Galilei-transzformációt, akkor olyan „új” tagok jelennek meg az egyenletekben, amelyet semmiféle kísérlet nem igazol. Az érdekesség az, hogy ezek a „felesleges tagok” a hullámegyenlet képzésekor éppen kiesnek! Ezért ez ott nem okozott gondot. Kimondhatjuk tehát, hogy a Galilei-transzformáció alkalmazása az elektrodinamikában rossz eredményt ad. De ez egyben azt is jelenti, hogy a mozgó rendszerben kapott c' sebességérték sem helyes. Erre a problémára a legegyszerűbb választ Albert Einstein adta meg.

Tételezzük fel – mondta –, hogy a Maxwell-egyenletek minden inerciarendszerben ugyanolyan alakúak. Tehát minden inerciarendszerben az EMH (fény) sebessége ugyanaz a c érték. Ekkor viszont az abszolút nyugvó éter fogalma tarthatatlanná válik. Mondjuk tehát ki, hogy az éter nem létezik! Mindezekből következik, hogy nem csak mechanikai, hanem elektrodinamikai kísérlettel sem lehet eldönteni, hogy „nyugvó, vagy pedig mozgó” rendszerben vagyunk. Az inerciarendszerek ezen egyenértékűsége és a c, mint az elektromágneses kölcsönhatások terjedési sebességének állandósága (invarianciája) nem lehet véletlen. Einstein azt javasolta, hogy legyenek ezek alapvető természeti törvények. Az elmondottak lehető legszélesebb körű általánosítása vezet az Einstein-féle posztulátumokhoz. Ezek szerint

  1. a Természettörvények minden inerciarendszerben ugyanolyan alakúak,
  2. bármilyen fizikai hatás maximum c sebességgel terjedhet.

A c (homogén, izotrop) sebesség invarianciáját nem kell külön kimondani, mert ez az első posztulátumnak a következménye. Ha ez nem így volna, akkor fénysebesség méréssel különbséget tudnánk tenni két inerciarendszer között. Ha ezt a két alaptörvényt elfogadjuk, akkor ebből az egész speciális relativitáselmélet felépíthető: minden törvénye igazolható vagy cáfolható.

Mint azt tudjuk, a Fizikában a természeti jelenségek leírása úgy történik, hogy a kiválasztott térrész minden (x,y,z) pontjában és minden t időpontban meghatározzuk valamely F fizikai mennyiség értékét. Ez szükségképpen mindig egy skalár mennyiség (szám + mértékegység). Az ismert természettörvények segítségével az F(x,y,z,t) függvény kiszámítható és az eredmény mérésekkel ellenőrizhető. A speciális relativitáselmélet arról szól, hogy milyen kapcsolat van az állónak tekintett K és a mozgó K' rendszerben meghatározott adatok között:

\displaystyle  (x,y,z,t)\quad\leftrightarrow\quad(x',y',z',t'),\qquad F \quad\leftrightarrow\quad F'.

Láttuk, hogy a mechanikában az álló és a mozgó megfigyelő által mért helykoordináta és idő adatok között a Galilei-transzformáció teremt kapcsolatot. Az erő komponensek és a tömeg pedig ugyanaz mind a két rendszerben (azaz nem transzformálódik). Az már rögtön látszik, hogy a Galilei-transzformáció nem teljesíti azt a posztulátumot, amely szerint a fénysebesség minden inerciarendszerben ugyanaz a c érték. Ez a már bemutatott sebesség összeadási formulából következik (\dot{x}'=\dot{x}-u). Ezért egy új transzformációt kell keresnünk. Ezt a transzformációt már Einsteintől függetlenül Hendrik Antoon Lorentz és Henri Poincaré megtalálta. Ők arra a transzformációra jöttek rá, amely a Maxwell-egyenleteket változatlanul hagyja. Tehát egy speciális jelenségkört, az elektrodinamikát vizsgálták. Ezt a transzformációt a fizikus társadalom Lorentz-transzformációnak nevezte el. Einstein egyik nagy érdeme többek között az, hogy meglátta ennek a transzformációnak az alapvető és univerzális voltát, amely gyökeresen megváltoztatta a térről és az időről alkotott newtoni szemléletünket. És ennek megfelelően a természeti törvények fontos szimmetriatulajdonságára mutatott rá (lásd Einstein első posztulátumát).

A jelen tanulmányink során mi csak a relativisztikus kinematikával és a relativisztikus dinamikával tudunk foglalkozni. Az elektrodinamika relativisztikus tárgyalása (azaz az elektromos és a mágneses térerősség komponensek transzformációs tulajdonságainak ismertetése) már jócskán meghaladja e kurzus színvonalát.

A Lorentz transzformáció

Az első feladatunk tehát az, hogy meghatározzuk azt a transzformációt, amelyik változatlanul hagyja a fény c sebességét, ha az egyik inerciarendszerből egy másikra térünk át. Ezt a Maxwell-egyenletek nélkül is meg lehet csinálni (ez is Einstein ötlete volt!).

A gondolatmenet a következő. Tekintsük az álló és a mozgó vonatkoztatási rendszert az alapértelmezés szerinti Descartes koordinátákkal ellátva.

Fiz2 Rel 04.jpg

A koordinátatengelyek kalibrálása (azaz tetszőleges méretű egyforma szakaszok kijelölése az x, y, z tengelyeken) geometriai feladat és így egzaktul megoldható.

Alapvetően más a helyzet az időt mérő órákkal. Pontos órát igen sokféle módon lehet készíteni. A technikatörténet a görögök által használt vízi óráktól kezdve az inga-, a rugós- és a kvarcórákon át a mai modern atomórákig (lásd GPS) rengeteg fajta megoldást ismer. Ezek működésében a Fizika szinte minden ismert törvénye jelen van. Mondhatjuk tehát, hogy egy óra használata a természeti törvények „használatát” (is) jelenti. Egy adott rendszeren belül lévő óráknak pontosan egyformán kell járniuk. Nem kell, hogy ugyanolyan típusúak legyenek, de az időt egyformán kell mutatniuk. Ez egyszerű „kalibrálással” megoldható: az órákat egy „etalon” órához („ősórához”) kell igazítani. Hasonlóan ahhoz, mint amikor a hosszúság mérés etalonjának az „Ősmétert” használtuk. Így az órák használata (ami az Idő mérésének egyedüli lehetséges módja) a természeti törvények objektív megnyilvánulását jelenti. Hiszen minden óra (bármilyen típusú is legyen) a természeti törvényeknek megfelelően működik.

Ez egy alapvetően fontos gondolat! Ezzel ugyanis megszabadítottuk az „Idő” fogalmát azoktól a szubjektív elemektől amelyeket az életünk során a mindennapi élményeink vetítettek rá. Hála a kísérleti pszichológia fejlődésének mára már könyvtárnyi irodalom tárgyalja az emberi időérzékelés pszichés folyamatait. A természeti törvények szerint működő órák által definiált idő a természeti jelenségek objektív tulajdonságát tükrözik. Ezért mondhatjuk, hogy ezek az órák valóban az „Időt” mérik. Azt a valamit, ami a természeti jelenségek egymásutániságának a mértékét tükrözik. Mivel a biológiában is a Természet törvényei érvényesülnek így pl. a biológiai öregedés folyamatát is egy „óraként” lehet értelmezni. Világítsuk meg ezt egy igen egyszerű példával! Tegyük fel, hogy egy kutya az álló rendszerben lévő óra szerint 10 évig élt, és a mozgó rendszerben egy macska az ottani óra szerint szintén 10 évig élt. Ekkor joggal mondjuk azt, hogy a két állat ugyanolyan hosszú életet élt, függetlenül attól, hogy a két óra melyik rendszerben mérte az időt. A gazdik egymásnak elküldött táviratában ugyanaz az „élt 10 évig” mondat fog szerepelni.

Vizsgáljuk meg, hogy mit kell tapasztalnia az álló és a mozgó megfigyelőnek, ha az Einstein-posztulátumok valóban jól tükrözik a Természet „működését”. Mint tudjuk, az alapértelmezés (sztenderd elrendezés) szerint az időszámítás kezdete mindkét rendszerben ugyanaz az esemény definiálja. Nevezetesen, amikor az origók éppen fedték egymást, azaz:

\displaystyle  t=t'=0,\qquad O=O'.

Az ábrán a következő kísérlet elvi vázlata látható. Indítsunk el egy fényjelet a t=t'=0 időpillanatban és nézzük meg, hogy a megfigyelőknek a posztulátumok érvényességének a következtében mit kell tapasztalniuk.

Fiz2 Rel 05.jpg

A válasz egyszerű: az álló megfigyelő azt látja, hogy az x helyen lévő óra t időt mutat, a mozgó megfigyelő pedig azt tapasztalja, hogy az x' helyen lévő óra t' időt jelez. És természetesen a fénysebesség állandósága szerint

\displaystyle  t=x/c,\qquad t'=x'/c.

Természetesen ugyanez a helyzet, ha a tér bármely P(x,y,z) illetve P'(x',y',z') pontját tekintjük, Ekkor értelemszerűen a

\displaystyle  t=r/c,\qquad t'=r'/c,\quad{\rm ahol}\quad r=\sqrt{x^2 + y^2 + z^2}\quad{\rm stb...}

összefüggések érvényesek (lásd ábra).

Fiz2 Rel 06.jpg

Ezt a kísérletet felfoghatjuk úgy is, hogy ellenőriztük az órák (relativisztikusan) helyes működését. Azaz megnéztük, hogy mind az álló, mindpedig a mozgó rendszerben lévő órák eleget tesznek-e az Einsteini posztulátumoknak, azaz valóban teljesül-e a c=c' feltétel? Ránézésre látszik, hogy a Galilei-transzformáció ezt nem elégíti ki. Az első egyenletét (x'=x-ut) osztva c-vel azt kapjuk, hogy

\displaystyle  \frac{x'}{c}=\frac{x}{c}-\frac{u}{c}t,\qquad t'=t\left(1-\frac{u}{c}\right)\qquad\Longrightarrow\qquad t'\neq t,

és ez ellentmondásban van a negyedik egyenlettel (t'=t). Tehát a Galilei-transzformáció és a fénysebesség invarianciája egyszerre nem lehet igaz! Nincsen más választás, mint feladni a Galilei-transzformációt és egy olyan másikat keresni, amely ezt a feltételt teljesíti.

Van még egy fontos támpontunk, amit a fizikai törvények megalkotásánál igen gyakran használunk: az ún. korrespondencia-elv. Ez azt mondja ki, hogy egy adott jelenségre vonatkozó „új” törvénynek határesetben mindig vissza kell adnia a „régit”. Ugyanis az „új” törvény mindig megváltoztatja a „réginek” az érvényességi körét. Ettől még a régi állítások nem válnak hamissá, hiszen azokat továbbra is a „régi” feltételek között használjuk.

Fiz2 Rel 07.jpg

Jelen esetben ez azt jelenti, hogy ha a mechanikát a c-hez mérten kis sebességeknél vizsgáljuk, akkor nyugodtan használhatjuk a Galilei-transzformációt. Például az előbbi esetben az u/c arány sokkal kisebb lesz mint egy. Ezért határesetben (pl. c\to\infty) visszakapjuk a Galilei féle t=t' összefüggést.

Az előzőekben már megbeszéltük, hogy két inerciarendszer a természeti jelenségek leírása szempontjából ekvivalens egymással. Ezért az „álló” és a „mozgó” szerepek kijelölése önkényes. Így, ha az egyik a másikhoz képest +u sebességgel mozog, akkor a másik az egyikhez képest -u-val fog mozogni. Az eddig elmondottaknak megfelelően kézenfekvőnek tűnik, ha az „új” transzformációt következő alakban keressük:

\displaystyle  x'=\Gamma(x-ut),\quad x=\Gamma(x'+ut'),\quad t'\leftrightarrow t,

ahol a korrespondencia-elv következtében a még ismeretlen \Gamma-ra teljesülnie kell annak, hogy

\displaystyle  \lim_{u\to 0} \Gamma = 1.

Végezzük el most is a fenti óraellenőrzési kísérletet és nézzük meg, hogy miként kezeli ezt a mostani transzformáció! Írjuk be a t=x/c és t'=x'/c kifejezéseket a transzformációba. Azt kapjuk, hogy:

\displaystyle  x'=\Gamma x \left(1-\frac{u}{c} \right),\quad x=\Gamma x' \left(1+\frac{u}{c} \right).

Összeszorozva a két egyenletet az xx' szorzat kiesik az egyenletből és \Gamma meghatározható:

\displaystyle  x'x = \Gamma^2\cdot xx' \left(1-\frac{u}{c} \right) \left(1+\frac{u}{c} \right),\quad \Gamma=\frac{1}{\sqrt{1-{u^2}/{c^2}}}.

A korrespondencia tényleg teljesül, hiszen:

\displaystyle  \lim_{c\to\infty} \Gamma=1 \quad (u\ll c).

Ezek után áttérhetünk az idő transzformációjának a meghatározására (t'\leftrightarrow t). x'=\Gamma(x-ut)-t beírva az x=\Gamma(x'+ut') egyenletbe, x'-t ki tudjuk ejteni. Azt kapjuk, hogy

\displaystyle  x = \Gamma^2 (x - ut) + \Gamma ut'.

Ebből t' kifejezhető és átrendezés után megkapjuk az idő transzformációs tulajdonságát (a részletek házi feladat):

\displaystyle  t' = \Gamma t + \frac{x}{u}\frac{1-\Gamma^2}{\Gamma}, \quad t' = \Gamma \left( t - \frac{u}{c^2} x \right).

Erre is teljesül a korrespondencia elv, hiszen

\displaystyle  \lim_{u\to 0} t' = t,

azaz visszakaptuk a Galilei-féle abszolút idő fogalmát. Ezzel megszületett a Lorentz transzformáció:

\displaystyle  x' = \Gamma(x-ut),
\displaystyle  y' = y,
\displaystyle  z' = z,
\displaystyle  t' = \Gamma \left( t - \frac{u}{c^2} x \right).

A következőkben megvizsgáljuk, hogy milyen következményei vannak ennek az új, relativisztikus szemléletnek. Az alkalmazások megkövetelik egy régi-új fogalom bevezetését. Ez az esemény. Ez azt jelenti, hogy a tér egy (x,y,z) pontjában (ez az esemény helye) a t időpillanatban (ez az esemény időpontja) az F fizikai mennyiség felvesz egy értéket (ez maga az esemény).

Fiz2 Rel 08.jpg

Ahhoz tehát, hogy egy eseményt meghatározzunk, a tér minden pontjához hozzárendeljük az ő helyét meghatározó Descartes koordinátákat és elhelyezünk egy („pontszerű”) órát, amelyiket az imént bemutatott szinkronizálási eljárással kalibráltunk. Ez mutatja az adott pontban a mindenkori t időpontot. Ugyanezt az F eseményt szemlélhetjük a mozgó rendszerből is. Ekkor természetesen x', y', z', t' és F' értékeket mérünk. Minden természeti jelenség ilyen elemi események sokaságából épül fel. Ezért (az általánosság minden csorbítása nélkül) elegendő az adott fajta események közül csak egynek a transzformációs tulajdonságait megvizsgálni.

Ha rátekintünk a Lorentz transzformációra, láthatjuk, hogy a t' meghatározásához nem csak a t-re, de még az x-re is szükségünk van. Azaz nem csak az számít, hogy mikor, hanem az is, hogy hol történik az az esemény, amelynek a mozgó rendszerbeni időpontját meg szeretnénk tudni. Az Időnek ez a furcsa tulajdonsága azt mutatja, hogy az idő és a térkoordináták mintegy „összefonódnak” és egységes egészként transzformálódnak. Ezért a (ct,x,y,z) számnégyest a „Téridő” egy pontjának nevezzük. Olyan tulajdonságai vannak, mint egy négydimenziós vektortérnek. Az események tehát a téridőben zajlanak. A K-ból a K'-be való átszámolás a téridő transzformációs tulajdonsága. Ez az amit Lorentz-transzformációnak neveztünk. A téridő igen szemléletes geometriai reprezentációját Hermann Minkowski (1907) alkotta meg.

Mint említettük, mi csak a kinematikával és a dinamikával fogunk foglalkozni. Ekkor az F mennyiség felépíthető az (x,y,z,t) mennyiségekből (sebesség, gyorsulás). Mivel a „tér+idő” adatok (Lorentz) transzformációja ismert, így az ezekből származtatott F transzformációja definíció szerint meghatározható. A következőkben ezt részletesen is tárgyalni fogjuk. Minden más esetben (pl. erőkomponensek, elektromos és mágneses térerősség komponensei stb) az F transzformációját külön meg kell határozni. A fizikusok kidolgoztak erre egy „koherens” és „szisztematikus” módszert, de ez meghaladja ennek a kurzusnak a lehetőségeit.

A számolásaink tovább egyszerűsödnek, ha figyelembe vesszük azt a tényt, hogy az alapértelmezés (standard boost) szerint az y és z koordináta adatok nem transzformálódnak. Így az esemény tér-idő adatait (x,t) fogja jelenteni.

A Lorentz transzformáció a kinematikában (relativisztikus kinematika)

A hosszkontrakció

Tekintsük a következő feladatot! Az álló K rendszerben lévő megfigyelő mérje meg a mozgó K' rendszer x' tengelyén fekvő, L_0 hosszúságú rúdnak a hosszát. A rúd végeinek koordinátáit jelölje (x_2', x_1’).

Einstein szemléletes példájával élve az a kérdés, hogyan lehet meghatározni egy száguldó vonat hosszát a sínpár mellett állva? A megoldás igen egyszerű. Állítsunk fel a sín mentén (egy sorban) nagyon sok megfigyelőt, akik szorosan egymás mellett állnak. Minden megfigyelőnek a kezében legyen egy óra. Minden megfigyelőnek az a feladata, hogy állítsa meg az óráját, amikor a vonat eleje éppen elhalad az orra előtt. Mi is álljunk be a sorba és állítsuk meg az óránkat, ha megpillantjuk a vonat végét. Amikor a vonat elrobog a sor előtt, minden megfigyelő (magunkat is beleértve) megállítja az óráját a kapott utasításnak megfelelően. Nyílvánvaló, hogy csak egyetlen olyan megfigyelő lesz, akinek az órája éppen a mi óránkkal egyező időpontot mutat. Ennek a megfigyelőnek a tőlünk mért távolsága lesz a mozgó vonat hossza. Hiszen ugyanabban a pillanatban láttuk meg mi a vonat végét, mint amikor a másik megfigyelő a vonat elejét. Azt mondjuk, hogy ez a két megfigyelés egy időben történt. Az elmondottak könnyen lefordíthatók az „események nyelvére” a következőképen.

Az álló rendszerben a rúd hosszát két esemény definiálja. Az egyik amikor megpillantjuk a rúd elejét (x_2, t_2), a másik, amikor a végét (x_1, t_1). A két esemény egyidejű, tehát t_1 = t_2 = t. A mozgó rúd hosszát a K rendszerben az L = x_2 - x_1 kifejezés definiálja. A rúd hossza a (vele együtt) mozgó K' rendszerben nyilvánvalóan L_0 = x_2' - x_1'. Ezt nevezzük nyugalmi hossznak, hiszen ekkor a szakaszhoz képest nyugalomban vagyunk.

Fiz2 Rel 09.jpg

A két esemény kapcsolata a Lorentz transzformációnak megfelelően:

\displaystyle  x_1'=\Gamma(x_1 - ut),\quad x_2'=\Gamma(x_2 - ut).

A fent bevezetett jelöléseket használva

\displaystyle  L_0 = x_2' - x_1' = \Gamma(x_2 - x_1) = \Gamma L,\quad L = L_0 \sqrt{1 - \frac{u^2}{c^2}}.

A jelenség neve hosszkontrakció. Eszerint egy mozgó rúd hossza a mozgás irányában „megrövidül”. Az inerciarendszerek ekvivalenciájából következik, hogy mindez „fordítva” is igaz: ha ugyanekkor elhelyezünk egy L_0 nyugalmi hosszúságú rudat az álló K rendszer x tengelye mentén, akkor ennek a hosszát a mozgó rendszerből mérve észleljük rövidebbnek.

Joggal felmerülhet a kérdés, hogy mármost kinek van igaza? Az eddigiek szellemében csak azt mondhatjuk, hogy mindkét megfigyelőnek igaza van! Ezen nem kell csodálkozni, hiszen a két mérés teljesen másképpen történt. A „nyugalmi hossz” és a „mozgási hossz” meghatározása valójában két különböző típusú mérés volt. A „hagyományos eljárás”, azaz a rudak közvetlen összehasonlítása lehetetlen, hiszen nem tudunk „átugrani” (kezünkben a rúddal) K-ból K'-be!

Természetesen, az iménti levezetés akkor is elvégezhető, ha nincsenek jelen a merev (fizikai) rudak, csak a kijelölt x_1 és x_2 koordinátapontok. Ezért azt mondhatjuk, hogy a hosszkontrakció nem az anyagi rudak tulajdonsága, hanem magának a Térnek a sajátossága.

Erre a merész következtetésre Einstein jutott először. Lorerntz-Fitzgerald ugyanis a rudak… Pozitivizmus…

!!! Befejezni !!!

Az idődilatáció

Mint az eddig kiderült, a relativitáselmélet megfosztotta az Időt a rárakodott pszichológiai és az ebből fakadó filozófiai rétegektől és egzaktul mérhető mennyiséggé tette. Az Idő az a paraméter, amely a lezajló események sorrendiségét regisztrálja. Az Időt órával mérjük. Egy órát bármilyen objektummal megvalósíthatunk, ha az eleget tesz a méréseknél használt általános követelményeknek. Az óra lehet tehát akár fizikai, kémiai, vagy biológiai képződmény (szerkezet) is.

Helyezzünk el a mozgó K' rendszer x' koordinátájú pontjába egy órát (lásd ábra). Az óra által mért egységnyi időtartamot jelölje T_0. Azaz adjon az óra jeleket a t_1', t_2', t_3', … időpontokban, amelyek T_0-al követik egymást. A jelek tetszőlegesek: ketyegés, mutató elmozdulás, digitális kijelzés stb. Ezek a jelek az események.

Fiz2 Rel 10.jpg

A kérdés az, hogy milyen T egység időtartamot mér az álló megfigyelő? Nyilvánvalóan elegendő csak két egymást követő eseményt vizsgálni. Azaz határozzuk meg, hogy az álló megfigyelő milyen adatokat detektál az (x', t_1') és az (x', t_2') eseményeket mérve. Az álló megfigyelő azt látja, hogy az óra x koordinátája állandóan változik. Azaz a szóban forgó két esemény tér-idő adatait (x_1, t_1) illetve (x_2, t_2) lesznek.

Mint tudjuk, az álló és a mozgó megfigyelő adatai között a Lorentz transzformáció teremt kapcsolatot. Azaz írhatjuk, hogy:

\displaystyle  t_1 = \Gamma\left( t_1' - \frac{u}{c^2} x' \right),\quad t_2 = \Gamma\left( t_2' - \frac{u}{c^2} x' \right).

Majd ebből kapjuk, hogy:

\displaystyle  T = t_2-t_1 = \Gamma(t_2' - t_1') = \Gamma T_0,\quad T = \frac{T_0}{\sqrt{1-u^2/c^2}}.

Látható tehát, hogy T > T_0, azaz az álló megfigyelő szerint a mozgó óra lassabban jár. Például ha u = c\sqrt{1-1/25} \,(= 293 735 420 \rm{m/s}), az álló megfigyelő óráján T = 5 óra telik el, amíg a mozgó óra csak T_0 = 1 órát megy tovább. Az inerciarendszerek ekvivalenciája miatt a mozgó megfigyelő ugyanezt állítja az álló óráról. Természetesen jelen esetben is mindkét állítás helyes. Ezen most sem kell csodálkoznunk, hiszen mérési eljárás most is más volt az álló rendszerben, mint a mozgóban. Mint azt láttuk, egyrészt ugyanazon mozgó óra által mutatott két időpontot (t_1', t_2') határoztunk meg. Másrészt az álló rendszerben történt méréskor két különböző helyen (x_1, x_2) lévő, két különböző óra által mutatott (t_1, t_2) időpontokat kellett használnunk. Az álló és a mozgó óra közvetlen összehasonlításra most sincsen lehetőség, hiszen a megfigyelők (zsebükben az óráikkal) nem hagyhatják el a saját rendszerüket.

Ha az órák közvetlen összehasonlítását is lehetővé tesszük, akkor egy másik problémához jutunk, amelynek a találó neve „ikerparadoxon”.

Paradoxonnak egy elméleten belüli látszólagos ellentmondást nevezünk. Azért látszólagos, mert abból fakad, hogy valami lényeges tényt nem vettünk figyelembe vagy valamit rosszul értelmeztünk. A paradoxonok feloldása azért nehéz, mert rutinszerű gondolkodunk. Például hallgatólagosan olyan dolgokat feltételezünk, amelyek esetleg ellentmondanak az elmélet tételeinek. A relativitáselmélet állításai igen szokatlanok (pl. hoszkontrakció, idődilatáció) a hétköznapi tapasztalatoknak ellentmondanak. Ezért megszületésekor paradoxonok sokaságával próbálták cáfolni állításait. Mivel a relativitáselmélet jól tükrözi a Természetben lezajló jelenségeket (azaz egy „jó elmélet”) így a paradoxonok mind feloldhatóak voltak. Némelyik olyan „szellemes”, hogy ma is használjuk az elmélet jobb megértetésének a céljából. Az egyik ezek közül éppen az „ikerparadoxon”.

Az ikerparadoxon

25 évesen válnak el

A: a Földön 50 év telik el és A úgy számolja, hogy az űrhajón csak 20.

B: ha az úrhajón 20 év telik el, B úgy számolja, hogy a Földön csak 8.

A gondolatmenete:

 A: 25 50 75
 B: 25 35 45

B gondolatmenete:

 B: 25 35 45
 A: 25 29 33

Képzeljünk el egy (egypetéjű) ikerpárt. Legyen a nevük A (pl. Aladár) és B (pl. Béla). 25 éves korukban B beül egy űrhajóba és közel fénysebességgel, egyenletesen mozogva távolodik a Földtől, majd (a megbeszélt terv szerint) megfordul és ugyanazzal az állandó sebességgel visszatér a Földre. Mit vár A és mit vár B amikor újra találkoznak és mit fognak valójában tapasztalni?

Fiz2 Rel 11.jpg

Tegyük fel, hogy az űrhajó sebessége akkora, hogy T=\Gamma T_0 szerint T_0 = 0.4T. Ez kb. u=0.9c sebességnek felel meg.

A gondolatmenete a következő. A a Földet természetesen állónak tekinti. Tudja jól, hogy a testvére, B, lassabban öregszik, mert megtanulta, hogy a mozgó óra lassabban jár mint az álló. Amikor A 50 éves, B még csak 35 (ugyanis 25 + 0.4\cdot 25 = 35). A terveknek megfelelően ekkor az űrhajó visszafordul és ugyanazzal az egyenletes sebességgel a Föld felé tart. A szerint a testvére továbbra is lassabban öregszik. A éppen 75 éves, amikor B megérkezik. A visszaút B számára ugyanolyan hosszú volt, mint az elmenetele, azaz szintén 10 évig tartott. A arra számít, hogy B éppen 45 évesen száll ki az űrhajóból. Így egy 45 éves és egy 75 éves ikerpár fog összeölelkezni.

Ezek után lássuk, a történetet B szemszögéből! Ő szintén önmagát tekinti állónak. Egyenletes sebességgel távolodik tőle a Föld, ahol testvére A lassabban öregszik mint ő. Ezt B logikusnak tarja, hiszen az egyenletesen mozgó Földön az órák lassabban járnak. Amikor B 35 éves, A csak 29 (hiszen 25 + 0.4\cdot 10 = 29). Ekkor B megfordul és változatlan nagyságú, egyenletes sebességgel hazafelé tart. 10 év múlva megérkezik a Földre. Ekkor tehát 45 éves. De a visszaút alatt a testvére, A, szintén csak 4 évet öregedett, azaz 33 évesnek kell lennie. B azt várja, hogy amikor 45 évesen kiszáll az űrhajóból, a 33 éves (fiatalabb) ikertestvérét fogja megölelni.

Ez nyilvánvaló ellentmondás (paradoxon), hiszen a 45 éves B vagy a 75 éves, vagy a 33 éves A-val találkozik. A két gondolatmenet egyszerre nem lehet igaz! Az eredmény azonban ténykérdés és az összeölelkezéskor kiderül, hogy melyikük gondolkodott helyesen. A paradoxon feloldása viszonylag egyszerű. B gondolatmenete azért helytelen, mert az űrhajó az utazása során nem mindig viselkedett inerciarendszerként. Az elindulás, a fordulás és a fékezés alatt az űrhajó gyorsuló mozgást végzett. Ezzel a szimmetria megtört. Tehát egy 45 és egy 75 éves ember fog találkozni.

A tárgyalt probléma egy új fogalom bevezetését generálja. Ez a sajátidő. A sajátidő a megfigyelővel együtt mozgó óra által mért idő, bármilyen is legyen a megfigyelő mozgása. Jelen estben az A sajátideje 75 év, a B-jé 45 év volt.

A sajátidő

Nézzük meg a sajátidő fogalmát általános esetben is. Mozogjon egy pont tetszőleges térbeli pályán!

A pálya két végpontja adott (P_1, P_2). A pont végighalad a teljes pályán és a vele együtt mozgó megfigyelő méri a t' időt a nála lévő órával. Ez lesz a sajátidő, amelynek értéke legyen most \tau_{12}. Ugyanezt a mozgást nagyon sok inerciarendszerből megvizsgálhatjuk. Nyilvánvaló, hogy a mozgó óra által mutatott \tau_{12} időtartam egyértelmű fizikai tény és ez nem függ attól, hogy a mozgást melyik inerciarendszerből figyeljük. Válasszunk ki tetszőlegesen két inerciarendszert és jelöljük őket K-val és K'-vel. A szokásos alapértelmezés szerint definiáljuk a Descartes koordinátákat és a rendszeridőket. Az itt lévő megfigyelők a mozgó órát különböző képen látják mozogni. Ki-ki a saját rendszerében meg tudja mérni a mozgó óra futási idejét, legyen ez T_{12} és T_{12}'. Ugyanakkor mind a ketten ki tudják számítani a \tau_{12} is, amelyre ugyanazt a (helyes) értéket fogják kapni. Azt mondjuk, hogy a \tau_{12} sajátidő egy invariáns mennyiség, azaz nem függ attól, hogy melyik inerciarendszerből nézve határozzuk meg az értékét.

A K-beli megfigyelő számolási módja a következő. Osszuk fel a pályát infinitezimális (egyenesnek tekinthető) szakaszokra!

Fiz2 Rel 12.jpg

Egy ilyen kicsiny szakasz megtételéhez a K-beli megfigyelő szerint {\rm d} t idő kell. A pályán mozgó óra ezalatt {\rm d}\tau időt mér. Ezen infinitezimális szakaszon a pont (és az óra) mozgási sebessége állandónak tekinthető, így az idődilatáció T_0=T\sqrt{(1-v^2/c^2)} formulája használható:

\displaystyle  {\rm d}\tau = {\rm d}t\sqrt{(1-v^2/c^2)}.

Mármost (a K-ból mérve) legyen a mozgó óra a pálya kezdeti pontjában t_1 időpillanatban és a végpontban t_2 pillanatban! Így a következő írható:

\displaystyle  \tau_{12} = \int_{\tau_1}^{\tau_2} {\rm d}\tau = \int_{t_1}^{t_2} {\rm d}t \sqrt{1-v^2 / c^2} \leq \int_{t_1}^{t_2} {\rm d}t = t_2 - t_1 = T_{12}.

Ugyanez a számolás megtehető a másik K' inerciarendszerben is. Természetesen mindenhol a vesszős rendszerben lévő megfigyelő által mért vesszős adatokat (t_1', t_2', {\rm d}t', v', T_{12}') kell használni. Ezek ugyan mások, mint a K-beliek, de a mozgó óra \tau_{12} sajátidejére ugyanazt fogjuk kapni.

(29)

Az egyidejűség relativitása

Mint azt már a bevezetésben említtettük, a speciális relativitáselmélet megalapozásában sokan részt vettek. Lorentz és Poincare munkái vezettek a legmesszebbre. Az elektrodinamika Maxwell egyenleteinek a vizsgálata során ők is eljutottak az idő „relatív” voltáig: az álló és a mozgó inerciarendszerben mért idők transzformációs tulajdonságához. Ezek az eredmények azonban mintegy „be voltak zárva” az elektrodinamikába. Albert Einstein volt az, aki mindezt a teljes általánosság szintjére emelte. Felismerte azt, hogy itt alapvető természeti törvényekről van szó, amelyek (többek között) a Térről és az Időről tesznek alapvető kijelentéseket és száműzte az éter fogalmát a Fizikából. Ennek megfelelően ő volt az, aki egyszerű, áttekinthető, logikus rendszerbe (axiómák) szervezte a relativisztikus törvényeket. Ezért aztán (természetesen elismerve az elődök munkáit is) méltán beszélünk Einstein-féle speciális relativitáselméletről.

Az elődökön való túllépést jelenti az az igen fontos einsteini felismerés is, hogy az egyidejűség is relatív fogalom. Nincsen „abszolút” egyidejűség: ha két esemény az egyik inerciarendszerben egy időben történik, akkor (lehetséges), hogy egy másikban a két esemény két különböző időpontban következik be. Sőt még az események sorrendje is megváltozhat. A következőkben erről lesz szó.

Tekintsünk az álló rendszerben két eseményt, amelyeket az (x_1, t_1) és az (x_2, t_2) téridő adatokkal adunk meg. Ugyanezen két eseményt a mozgó rendszerben (x_1', t_1') és az (x_2', t_2') mennyiségek jellemzik.

Fiz2 Rel 15.jpg

Az időviszonyokat külön is ábrázolhatjuk. A következőkben ezt vizsgáljuk.

Írjuk fel a két esemény időadatainak a Lorentz transzformációját:

\displaystyle  t_1' = \Gamma(t_1 - u/c^2 x_1),\quad t_2' = \Gamma(t_2 - u/c^2 x_2).

A két egyenletet vonjuk ki egymásból. Ekkor megkapjuk az események közötti időkülönbségek kapcsolatát, tehát

\displaystyle  t_2' - t_1' = \Gamma(t_2 - t_1) - \Gamma u/c^2 (x_2 - x_1).

Legyen a két esemény egyidejű az álló rendszerben! Ez azt jelenti, hogy t_1=t_2. Ezért aztán adódik, hogy

\displaystyle  t_2' - t_1' = \Gamma u/c^2 (x_2 - x_1).

Látható, hogy két egyidejű esemény akkor lesz egyidejű a mozgó rendszerben is, ha az álló rendszerben egy helyen történtek: x_1 = x_2 és t_1' = t_2'. Az egyidejű események sorrendje a mozgó rendszerben az események álló rendszerbeli helyétől függ, azaz az x_1-x_2 előjelétől.

Az ok-okozat relativisztikus tárgyalása

Tekintsünk két (nem egy helyen és nem egy időben történő) eseményt!

Fiz2 Rel 13.jpg

Az események időadatainak Lorentz transzformációját kivonva egymásból, átrendezéssel az adódik, hogy

\displaystyle  t_2' - t_1' = \Gamma(t_2 - t_1)\left(1 - u/c^2 \frac{x_2 - x_1}{t_2 - t_1}\right).

A kapott algebrai kifejezésnek igen szemléletes fizikai jelentése van. Tegyük fel, hogy t_2 > t_1, azaz az első esemény előbb történik meg, mint a második. Ekkor létezik egy olyan mozgó rendszer, amelyben a két esemény sorrendje megcserélődik. Ez akkor következik be, ha a második szorzótényező értéke negatív. Ez a tény azonban felvet egy alapvető problémát. Ha ugyanis a két esemény ok-okozati viszonyban van egymással (azaz az első esemény okozza a másodikat) akkor a sorrendcsere fizikai lehetetlenség. Hiszen nem létezhet olyan inerciarendszer, amelyben az okozat megelőzi az okot (pl. előbb törik össze a pohár és csak utána esik le)! Látható, hogy ez a paradoxon akkor következne be, ha

\displaystyle  u \frac{\Delta x}{\Delta t} > c^2,\quad \Delta x = x_2 - x_1,\quad \Delta t = t_2 - t_1.

Ennek pedig az a szükséges feltétele, hogy u és \Delta x / \Delta t közül valamelyik, esetleg mindkettő nagyobb legyen c-nél. A második axióma szerint c minden hatás terjedési sebességének a felső határa. Ez alapján u\leq c triviális, mivel u K' sebessége K-ban, \Delta x / \Delta t pedig annak a hatásnak az átlagsebessége, amelyet az első esemény elindít és amely aztán előidézi a második bekövetkezését, tehát ennek is c-nél kisebb-egyenlőnek kell lennie. Ezzel tulajdonképpen igazoltuk a második axióma jogosságát.

A sebességek relativisztikus összegződése

Eddig a téridő pontjainak transzformációjával és ennek a fizikai értelmezésével foglakoztunk. Most rátérünk a sebesség, mint alapvető kinematikai mennyiség transzformációs tulajdonságainak a tárgyalására.

Tekintsünk egy pontot, amelynek mozgását a téridő négy koordinátájával adunk meg. A pont mozgását vizsgáljuk a szokásos álló és mozgó rendszerben.

Fiz2 Rel 16.jpg

Mint tudjuk, a sebesség az elmozdulás-vektor idő szerinti deriváltja, amelyet a Descartes komponenseivel (is) megadhatunk. Mivel a Lorentz transzformáció lineáris művelet, így változatlanul igaz lesz infinitezimális koordináta- és idő megváltozásokra is:

\displaystyle  {\rm d}x' = \Gamma({\rm d}x - u {\rm d}t),
\displaystyle  {\rm d}y' = {\rm d}y,
\displaystyle  {\rm d}z' = {\rm d}z,
\displaystyle  {\rm d}t' = \Gamma({\rm d}t - u/c^2 {\rm d}x),

ahol (\Delta\xi\to 0)={\rm d}\xi és \xi\in\lbrace x,y,z,t \rbrace. Az infinitezimálisok „hányadosai” (definíciószerűen) éppen a klasszikus analízis deriváltjait adja. Az x komponensre kapjuk tehát, hogy

\displaystyle  \frac{{\rm d}x'}{{\rm d}t'} = \frac{\Gamma({\rm d}x - u {\rm d}t)}{\Gamma({\rm d}t - u/c^2 {\rm d}x)} = \frac{{\rm d}x/{\rm d}t - u}{1 - (u/c^2)({\rm d}x/{\rm d}t)} \equiv \frac{\dot{x} - u}{1 - (u/c^2)\dot{x}}.

Az y komponensre pedig:

\displaystyle  \frac{{\rm d}y'}{{\rm d}t'} = \frac{{\rm d}y'}{\Gamma({\rm d}t - u/c^2 {\rm d}x)} = \frac{{\rm d}y/{\rm d}t}{\Gamma(1 - (u/c^2)({\rm d}x/{\rm d}t))} \equiv \frac{\dot{y}}{\Gamma(1 - (u/c^2)\dot{x})}.

Látható, hogy kis sebességek esetén éppen a jól ismert Galilei-féle sebességösszeadási formulát kapjuk. A kapott eredményeket két feladattal világítjuk meg.

Első példa a sebességek összeadására

Fiz2 Rel 17.jpg

Mozogjon egy fénysugár c sebességgel az álló K rendszer y tengelye mentén. Határozzuk meg a fénysugár sebességét a mozgó K' rendszerhez képest! Az álló rendszerben a sebességadatok a következők:

\displaystyle  \dot{x} = 0,\quad \dot{y} = c.

Így a mozgó rendszerben mért sebesség komponensek relativisztikus összegződés alapján:

\displaystyle  \dot{x}' = \frac{\dot{x} - u}{1 - (u/c^2)\dot{x}} = -u,
\displaystyle  \dot{y}' = \frac{\dot{y}}{\Gamma(1 - (u/c^2)\dot{x})} = \frac{c}{\Gamma} = c\sqrt{1 - \frac{u^2}{c^2}}.

A fénysugár sebességének a nagysága az x és az y sebességkomponensekből adódik:

\displaystyle  {c'}^2 = u^2 + c^2(1 - u^2/c^2) = c^2.

Tehát a fény a posztulátumoknak megfelelően, a mozgó rendszerben is c sebességgel terjed, de az iránya egy kissé megváltozik.

Fiz2 Rel 18.jpg

A csillagászatból jól ismert jelenségről van szó. A mozgó Földön lévő megfigyelő éppen ezt a szögelhajlást tapasztalja, amikor az állócsillagok helyét (fél év időkülönbséggel, Föld sebességére merőleges irányban) pl. tavasszal és ősszel megméri. Ennek az effektusnak a neve csillagászati aberráció.

Második példa a sebességek összeadására

Indítsunk el egy fénysugarat a mozgó K' rendszer x' tengelye mentén.

Fiz2 Rel 19.jpg

Mekkora ennek a sebessége az álló K rendszerben?

A mozgó rendszerben mérhető sebességadatok a következők:

\displaystyle  \dot{x}' = c.

A relativisztikus sebességösszeadás értelmében az álló rendszerben azt kapjuk, hogy

\displaystyle  \dot{x} = \frac{\dot{x}' + c}{1 + (u/c^2) \dot{x}'} = \frac{c+u}{1+u/c}.

Tehát ismét teljesül az einsteni axióma. Sőt, ez még akkor is igaz, ha a mozgó rendszer fénysebességgel halad az állóhoz képest, azaz u=c.

A következőkben három olyan kinematikai kísérletet mutatunk be, amelyek megerősítik a speciális relativitáselmélet téridővel kapcsolatos állításait.

Fény mozgása áramló folyadékban

Ezt a kísérletet Hippolyte Fizeau már 1851-ben elvégezte. Korrekt magyarázatot a speciális relativitáselmélet sebességösszeadási technikája szolgáltatja. A mérés vázlata az ábrán látható.

Fiz2 Rel 20.jpg

Az „U” alakúra hajlított üvegcsőben u sebességgel folyadék áramlik. A félig áteresztő tükörrel két részre osztott fénynyaláb az egyik ágban a folyadék áramlásával egy irányban, a másik ágban vele szemben halad. Így a fénysugarak a két ágban, tükrökhöz képest különböző sebességgel mennek. Az ágak geometriai hossza (elvileg) megegyezik. Az üvegcsövet elhagyó nyalábokat egy másik féligáteresztő tükörrel újra egyesítjük. A sebességkülönbségekből adódó optikai úthossz-különbség miatt az egyesülő nyalábok interferenciavonalakat hoznak létre a felfogó ernyőn (ez a detektor). Ezt az optikai elrendezést Fabry-Perot interferométernek hívják.

Alkalmazzuk a relativitáselméletet a jelen kísérletre! A tükrök és a detektor alkotják az álló K rendszert. Az áramló folyadék lesz a mozgó K' rendszer. Ebből kettő is van, az interferométer két ágában. Elegendő csak az egyiket megvizsgálni, mert a másik (fizikailag) ugyanilyen, csak a végső formulában folyadék sebességének az előjelét kell megváltoztatni (u helyett -u).

Alkalmazva a relativisztikus sebességösszeadási formulát, kapjuk, hogy

\displaystyle  v_x = \frac{v_x' + u}{1 + (u/c^2)v_x'},\quad u v_x' \ll c.

Mivel a sebességek jóval c alatt vannak, ezért a nevező sorfejtéssel közelíthető:

\displaystyle  v_x \approx (v_x' + u)(1 - (u/c^2)v_x') = v_x' + u - u\frac{{v_x'}^2}{c^2} - \frac{u^2}{c^2}v_x' \approx v_x' + u - u\frac{{v_x'}^2}{c^2}.

A fény terjedési sebessége a folyadékban az n törésmutatótól függ

\displaystyle  v_x' = c/n.

Ezt felhasználva, megkapjuk a fény sebességét az interferométer tükreihez képest:

\displaystyle  v_x \approx c/n + u - u/n^2 = c/n + u(1 - 1/n^2).

Ugyanez igaz a másik ágban is, de ekkor az u helyére -u-t kell írnunk:

\displaystyle  v_x \approx c/n - u(1 - 1/n^2).

A két ágban fellépő sebességkülönbség optikai úthossz különbséget ad. Ezt már az interferométer ki tudja mutatni.

A mű-mezon (műon) bomlása

A „μ-mezon” vagy „műon” egy instabil (szubatomi, azaz a protonnál kisebb, de az elektronnál nagyobb) részecske, amely \tau_0=2.2 {\rm \mu s} alatt elbomlik. Ezek a részecskék a Föld felső légkörében, H=4700 {\rm m} magasan keletkeznek, a kozmikus sugárzás eredményeképpen. A mérések azt mutatják, hogy a Föld felszínén is detektálunk mű-mezonokat. Ez azért meglepő, mert a részecske átlagsebessége

\displaystyle  v_{\mu} = \frac{4700{\rm m}}{2.2\cdot 10^{-6}{\rm s}} = 2.1\cdot 10^9 {\rm m/s} \approx 7c .

Ez pedig a relativitáselmélet axiómája szerint lehetetlen. A kérdés mármost az, miként magyarázható ez a mérési eredmény?

Fiz2 Rel 21.jpg

A válasz az idődilatációban és/vagy a hosszkontrakcióban rejlik. A szóban forgó jelenséget mind a Földhöz rendelt álló K, mind pedig a Föld felszíne felé száguldó mű-mezonhoz rögzített mozgó K' (inercia)rendszerből is megvizsgáljuk.

A földi megfigyelő szerint azért éri el a mezon a Föld felszínét, mert a K-ban v_μ sebességgel mozgó K'-ben az idő lassabban telik. Azaz \beta\equiv u/c szerint

\displaystyle  H = u \frac{\tau_0}{\sqrt{1-\beta^2}} = u\cdot\tau.

A mű-mezon szempontjából, a Föld mozog u sebességgel, így a hosszkontrakció miatt a H távolságot a mezonnal együtt mozgó megfigyelő (ez maga a mű-mezon) rövidebbnek méri, azaz

\displaystyle  H' = u\tau_0,\quad H\sqrt{1 - \beta^2} = u\cdot\tau_0.

Rögtön látható, hogy az utolsó két formula pontosan ugyanaz. Számítsuk még ki a mezon sebességét! Átrendezés és \beta beírása után kapjuk, hogy

\displaystyle  \sqrt{1 - \beta^2} = \beta \frac{c\tau_0}{H} = \beta \cdot A,\quad A\equiv \frac{c\tau_0}{H},\quad 1-\beta^2 = A^2\beta^2.

Ebből az ismereten \beta = u/c kiszámítható:

\displaystyle  1 = (1+A^2)\beta^2,\quad \beta = \frac{1}{\sqrt{1+A^2}} < 1.

Az A értékére kapjuk, hogy:

\displaystyle  A = \frac{c\tau_0}{H} = \frac{3\cdot 10^8\cdot 2,2 \cdot 10^{-6}}{4,7\cdot 10^3} = \frac{0,66}{4,7} = 0,14.

Mivel A\ll 1 ezért jó közelítéssel

\displaystyle  \beta\approx 1 - \frac{1}{2}A^2.

És így u\approx 0,99c. Ez pedig eleget tesz az einsteini axiómának!

A Doppler-effektus

Az akusztikában már hallottunk a Doppler-effektusról. A közeledő hangforrás frekvenciáját magasabbnak, a távolodóét alacsonyabbnak halljuk. A hang sebessége hat nagyságrenddel kisebb, mint c, ezért a relativisztikus tárgyalás gyakorlatilag érdektelen. Egészen más a helyzet a fénnyel. Mivel a sebessége c, csakis a relativisztikus számolás adhat helyes eredményt!

Tekintsük a szokásos (standard, K, K') koordinátarendszereket. A fényforrás legyen a K-ban és haladjon a fény (sík)hullám a +x tengely mentén.

Fiz2 Rel 22.jpg

A kérdés az, hogy mekkora frekvenciájú fényt érzékel a (fényforráshoz képest) mozgó megfigyelő?

Mint azt az elektrodinamikából tudjuk, a fényhullámot alkotó elektromos és mágneses mező bármelyik (Descartes) komponense ugyanolyan függvény szerint változik. Jelölje ezt \Psi(x,t). A hullámfüggvény matematikai alakja a K-ban:

\displaystyle  \Psi = A \sin{(kx - \omega t)} = A \sin{\omega (x/c - t)}.

A Lorentz transzformáció szerint x = \Gamma(x' + ut') és t = \Gamma(t' + (u/c^2)x'), így a hullámfüggvény a mozgó K'-ben így írható fel:

\displaystyle  \Psi' = A' \sin{\left[ \omega\Gamma\left( \frac{x'}{c} + \frac{u}{c}t' - t' - \frac{u}{c^2}x' \right) \right]}.

A szinusz függvény argumentuma csak egy szám (fizikai skalár) lehet, hiszen pl. a \sin{(5 {\rm kg})}-nak nincsen értelme. Az előző egyenletben szereplő szinusz függvény argumentuma tehát skalár, ezért egy invariáns mennyiség, azaz minden inerciarendszerben ugyanaz az értéke. Például „3 darab alma” bármelyik inerciarendszerből megszámolva mindig 3 darab lesz. Az egyenletben található zárójeles kifejezés átalakítható (a részletek házi feladat):

\displaystyle  \Psi' = A' \sin{\left[ \omega\Gamma \left( 1 - \frac{u}{c} \right) \left( \frac{x'}{c} - t' \right) \right]}.

Ezt összevetve \Psi K'-beli alakjával:

\displaystyle  \omega' = \omega\Gamma \left( 1 - \frac{u}{c} \right) = \omega \sqrt{\frac{c-u}{c+u}}, \quad \Psi' = A' \sin{\left[ \omega' \left( \frac{x'}{c} - t' \right) \right]}.

Ez tehát az optikai Doppler-effektus. Kis sebességeknél visszakapjuk a „klasszikus” Doppler-formulát:

\displaystyle  \omega' \approx \omega \sqrt{ \left( 1- \frac{u}{c} \right) \left( 1- \frac{u}{c} \right)} = \omega \left( 1 - \frac{u}{c} \right), \quad u\ll c.

Ha a fénnyel szemben mozgunk, akkor u helyett -u-t kell írnunk és ezért kapjuk, hogy

\displaystyle  \omega' = \omega \sqrt{\frac{c+u}{c-u}}, \quad \lim_{u\to c}{\omega'} = \infty.
Fiz2 Rel 23.jpg

A Mechanika (Dinamika) relativisztikus törvényei

Az előzőekben megtanultuk, hogyan kell átformálnunk a Térről és az Időről alkotott hétköznapi elképzelésünket. Megértettük, hogy mi az oka annak, hogy szakítanunk kellett a Newton által definiált abszolút Tér és abszolút Idő szemléletes fogalmával. Elcsodálkoztunk a kinematikai effektusokon amelyek ennek a szakításnak az eredményeképpen szükségszerűen adódtak. Csodálkoztunk, mert a hétköznapi mozgások világában ezek megnyilvánulása 6-7 nagyságrenddel kisebbek az érzékszerveink által észlelhető effektusoknál. Így a szokatlanságuk a tapasztalat (szükségképpeni) hiányából fakad.

Előítéleteink rabjai vagyunk. Azon előítéleteké, amelyeket születésünktől fogva az érzékszervi észlelések (létfenntartó) sokasága épített ki bennünk. De hála absztrakciókészségünknek, a „függöny mögé pillanthatunk”. A Matematika pedig megadja azt az igen hatékony szerszámot, amellyel a dolgok (Természeti jelenségek rendszere) mélyére áshatunk.

A következőkben (a relativisztikus kinematikára támaszkodva) megnézzük, hogy a dinamikai törvények hogyan teljesítik az Einstein-féle posztulátumokat.

A klasszikus mechanika Newton-féle axiómarendszerének az ellenőrzésére legalkalmasabb módszer két tömegpont ütközésének a vizsgálata (volt). Ütközés előtt a két tömegpont egyenes vonalú egyenletes mozgást végez (Newton 1). Ütközéskor a tömegpontokra ható erők nagysága egyenlő (Newton 3). A tökéletesen rugalmas ütközés (igen rövid) ideje alatt az impulzusok megváltoznak (Newton 2), a rendszer összimpulzusa azonban állandó marad (impulzustétel). Az ütközés után a tömegpontok által (egy adott időtartam alatt) megtett távolságok aránya a tömegek reciprok arányával egyenlő (dinamikus tömegfogalom és mérése). Tökéletesen rugalmatlan ütközéskor (a tömegpontok összetapadnak) a mechanikai (kinetikus) energia nem lesz állandó a folyamat során, de impulzustétel továbbra is érvényes marad.

A nagyobb általánossága miatt célszerű az impulzustételt megvizsgálni a speciális relativitáselmélet eddig megtanult fogalmi rendszerén belül. Az álló K rendszer x tengelye mentén két, azonos nagyságú, m tömegű, pontszerű test +u és -u sebességgel egymással szembe halad. Összeütköznek és összetapadnak. Az ütközés tökéletesen rugalmatlan.

Fiz2 Rel 24.jpg

Az ütközés előtt a rendszer összimpulzusa zérus (mu - mu = 0) és az impulzusmegmaradás tétele miatt az ütközés után továbbra is nulla marad. Következésképpen az összetapadt tömeg nyugalomban lesz (M\cdot 0 = 0).

Rögzítsük a K' koordinátarendszerünket a -u sebességgel mozgó tömegponthoz. Vizsgáljuk meg, hogy miként észleli az ütközés folyamatát ebben a mozgó rendszerben lévő (hipotetikus) megfigyelő. (Pl. ha most egy töréstesztben szereplő, két frontálisan ütköző gépkocsiról lenne szó, akkor az egyik próbabábú által regisztrált mérési adatokat akarjuk megjósolni. Mindezt azoknak a kinematikai és dinamikai mérési adatoknak az ismeretében, melyeket az ütközés során az álló laborban végeztünk el.)

Fiz2 Rel 25.jpg

A matematikai általánosság végett a K' rendszerben álló tömegpont tömegét m_2'-vel, a mozgó pontét m_1'-vel, az ütközés utáni (összetapadt) tömeget pedig M'-vel fogjuk jelölni. Az m_1' tömegpont ütközés előtti sebessége legyen v_1'. Felírható az impulzusmegmaradás törvénye:

\displaystyle  m_1' v_1' = M' u.

A tömeg(anyag-)megmaradás elve szerint pedig

\displaystyle  m_1' + m_2' = M'.

A két egyenletet összevonva, majd átrendezve, adódik, hogy:

\displaystyle  m_1' (v_1' - u) = m_2' u.

Ebből az ütközés előtti tömegek arányára kapjuk a következő összefüggést:

\displaystyle  \frac{m_1'}{m_2'} = \frac{u}{v_1' - u} = \frac{1}{v_1'/u - 1}.

Alkalmazzuk ezt az eredményt a mostani példánkra! A Newton-féle dinamika szerint a tömegek ugyanazok, mint az álló rendszerben voltak, azaz m_1' = m_2' = m, ezért az előző egyenletből a tömegek kiesnek és v_1'-re azt kapjuk, hogy

\displaystyle  1 = \frac{u}{v_1' - u}, \quad v_1' = 2u.

Tehát az impulzustétellel mintegy „levezettük” a Galilei-féle sebességösszeadási törvényt. Tudjuk azonban, hogy a relativisztikus sebességösszeadási formula szerint az eredmény más lesz, mégpedig a következő:

\displaystyle  v_1' = \frac{u+u}{1 - \frac{u\cdot(-u)}{c^2}} = \frac{2u}{1+u^2/c^2} = \frac{2u}{1+\beta^2},

ahol \beta = u/c. Ha továbbra is newtoni tömegfogalmat használjuk, akkor nyilvánvalóan m_1' = m_2' = m és M' = 2m. Az impulzusmegmaradás tétele ekkor

\displaystyle  m v_1' = M' u.

Beírva ide a relativisztikus sebesség értékét, azt kapjuk, hogy

\displaystyle  m \frac{2u}{1+\beta^2} \neq 2mu.

Tehát K' koordinátarendszerben az impulzusmegmaradás tétele nem teljesül, csak kicsi sebességekre (u\ll c, azaz u/c\ll 1). Mindez azonban ellentmond a relativitáselmélet első posztulátumának, azaz a természeti törvények invarianciájának. Ezért aztán nincsen más választásunk, mint a Newton-féle dinamika átalakítása. Ezt úgy kell megtennünk, hogy az impulzusmegmaradás törvénye mind a K, mind pedig a K' rendszerben igaz legyen! Végigkövetve az eddigieket, látható, hogy a „tömeg” az az egyetlen szabad dinamikai mennyiség, amin (a siker reményében) változtatnunk kell. A következőkben ezt fogjuk megtenni. A relativisztikus sebesség kifejezése alapján határozzuk meg következő sebességarányt:

\displaystyle  \frac{v_1'}{u} = \frac{2}{1+\beta^2}.

Beírva ezt a tömegarányt megadó összefüggésbe,

\displaystyle  \frac{m_1'}{m_2'} = \frac{1}{\frac{2}{1+\beta^2} - 1} = \frac{1 + \beta^2}{1 - \beta^2}.

A szokásos jelölés bevezetésével legyen \beta_1 = v_1' / c. A relativisztikus sebesség kifejezését felhasználva

\displaystyle  \beta_1 = \frac{v_1'}{c} = \frac{2u/c}{1+\beta^2} = \frac{2\beta}{1+\beta^2}.

Képezzük az 1-\beta_1^2 kifejezést:

\displaystyle  1-\beta_1^2 = 1 - \frac{4\beta^2}{(1+\beta^2)^2} = \frac{1+2\beta^2 + \beta^4 - 4\beta^2}{(1+\beta^2)^2} = \frac{(1-\beta^2)^2}{(1+\beta^2)^2}.

A gyökvonás elvégzése után, a (relativisztikus) tömegarányt kifejező összefüggés felhasználásával azt kapjuk, hogy

\displaystyle  \frac{m_1'}{m_2'} = \frac{1+\beta^2}{1-\beta^2} = \frac{1}{\sqrt{1 - \beta_1^2}}, \quad m_1' = \frac{m_2'}{\sqrt{1-(v_1'/c)^2}}.

Látható azonban, hogy az m_1' és m_2' két ugyanakkora pontszerű testnek a tömege mozgó, illetve álló helyzetben. Tételezzük fel, hogy mindez teljes általánosságban (pl. egyetlen pontszerű testre) is igaz. Így, ha egy álló pontszerű test tömege m_0 , akkor ugyanennek a testnek a tömege, ha az v sebességgel mozog, a következő:

\displaystyle  m = \frac{m_0}{\sqrt{1-(v_1'/c)^2}}.

Ez az ún. relativisztikus tömegnövekedés. Az m_0-t nyugalmi tömegnek nevezzük. (Lásd Tömeg a speciális relativitáselméletben (Wikipedia cikk))

Tehát, a tömegpontok ütközése csak akkor zajlik le minden inerciarendszerben ugyanolyan törvények szerint (ami éppen a speciális relativitáselmélet első posztulátumának a követelménye), ha a relativisztikus kinematikát és a relativisztikus tömeg fogalmat használjuk. A kérdés ezek után az, hogy milyen lesz a relativisztikus mozgásegyenlet (axióma)? Természetesen ezt nem lehet „levezetni” semmiből! Ezt valami módon ki kell találni, hasonlóan mint azt tettük a Newton-féle 2. axióma esetén. A mérési tapasztalatok majd megerősítik vagy cáfolják a hipotézisünket. Kézenfekvő a feltevés, hogy a mozgásegyenlet formája legyen olyan mint a Newton-egyenlet, azaz

\displaystyle  \dot{\bf p} = {\bf F}.

De most az impulzus a relativisztikus impulzus legyen, azaz

\displaystyle  {\bf p} = \frac{m_0 {\bf v}}{\sqrt{1 - v^2 / c^2}}.

Látható, hogy a korrespondencia-elvnek megfelelően ha v/c\ll 1 (vagy v\ll c), akkor az új egyenletünk átmegy a Newton-féle (nem-relativisztikus) mozgásegyenletbe.

Az elmúlt száz évben tapasztalati tények milliói támasztották alá a relativisztikus dinamika helyességét. Valamint nem találkoztunk egyetlen egy olyan reprodukálható kísérleti eredménnyel sem, amely ennek ellene mondott volna. A modern kísérleti technikában használt részecskegyorsítok százait építették meg ezen relativisztikus dinamika ismeretében. Mivel ezekkel a berendezésekkel a felgyorsított elektronok, protonok (töltött részecskék) közel fénysebességgel mozognak, a relativisztikus tömegnövekedés figyelembevétele a tervezői munka során kihagyhatatlan.

Mindezek alapján (nagyon nagy valószínűséggel) kijelenthetjük, hogy a Speciális Relativitáselméletben a Természet egyik alapvető (szimmetria-) tulajdonságát ismertük fel.

Tömegpont mozgása állandó erő hatására

Most egy jól ismert példán keresztül bemutatjuk a relativisztikus dinamika működését. Az álló x tengely mentén, az origóból, nyugalomból indulva egy tömegpont állandó F_0 erő hatására mozog.

Fiz2 Rel 26.jpg

Határozzuk meg a kinematikai jellemzőit (sebesség, megtett út)!

Először elevenítsük föl a feladat jól ismert, klasszikus (newtoni dinamika) szerinti megoldását, így láthatjuk majd a lényegi különbséget, amit a relativisztikus mechanika jelent a klasszikussal szemben és ellenőrizhetjük a korrespondencia-elvet is.

A Newton-féle mozgástörvény szerint a tömegpont gyorsulása, sebessége és elmozdulása könnyen számolható. A kezdeti feltételeknek megfelelően („az origóból, nyugalomból indul”, x_0 = 0, v_0 = 0 ) kapjuk, hogy:

\displaystyle  m_0 \ddot{x} = F_0,\quad \ddot{x} = F_0 / m_0 \equiv a_0,
\displaystyle  \dot{x} = v_0 + a_0 t = a_0 t, \quad x = x_0 + v_0 t + (a_0/2)t^2 = (a_0/2)t^2.
Fiz2 Rel 27.jpg

A relativisztikus tárgyalás matematikailag kissé bonyolultabb. A mozgásegyenlet összevetve a relativisztikus impulzus kifejezésével,

\displaystyle  \frac{\rm d}{{\rm d}t} \left[ \frac{m_0}{\sqrt{1-(\dot{x}/c)^2}} \dot{x} \right] = F_0.

Mind a két oldal idő szerint könnyen integrálható

\displaystyle  \left[ \frac{m_0 \dot{x}}{\sqrt{1-(\dot{x}/c)^2}} \right]_{0}^{\dot{x}} = F_0 t.

Felhasználva a határfeltételeket, adódik, hogy:

\displaystyle  \dot{x} = a_0 t \sqrt{1-(\dot{x}/c)^2}.

Négyzetre emelés után az egyenlet átrendezhető:

\displaystyle  \dot{x}^2 = \left( 1 - \frac{\dot{x}^2}{c^2} \right) a_0^2 t^2,  \quad \dot{x}^2 \left[ 1 + (a_0 t/c)^2 \right] = a_0^2 t^2.

Innen a sebesség keresett időfüggvénye megkapható:

\displaystyle  \dot{x} = \frac{a_0 t}{\sqrt{1 + (a_0 t/c)^2}}.

Látható, hogy t \to 0 esetén, amikor még kicsi a sebesség, a newtoni eredmény adódik. A t\to \infty határérték pedig a fénysebességhez tart.

\displaystyle  \lim_{t\to \infty} \dot{x} = c, \quad \lim_{t\to 0} \dot{x} = a_0 t.
Fiz2 Rel 28.jpg

Ez eleget tesz a speciális relativitáselmélet Einstein-féle axiómáinak.

A sebesség ismeretében (integrálással) megkaphatjuk az elmozdulás x(t) függvényt is.

\displaystyle  [x]_0^t = \int_0^t \frac{a_0 t}{\sqrt{1 + (a_0 t/c)^2}} {\rm d}t = \left[ \frac{c^2}{a_0} \sqrt{1 + (a_0 t/c)^2} \right]_0^t.

A határfeltétel ismeretében adódik a végeredmény

\displaystyle  x(t) = \frac{c^2}{a_0} \left( \sqrt{1 + (a_0 t/c)^2} - 1 \right).

x az időnek hiperbolikus függvénye. Ennek a hiperbolának az aszimptotája egy c meredekségű egyenes. Mint tudjuk, a klasszikus esetben az x(t) parabola, amely nem rendelkezik ezzel az aszimptotikus tulajdonsággal. (29.ábra)

Fiz2 Rel 29.jpg

A tömeg-energia ekvivalencia

Talán nincsen még egy olyan matematikai formula, amely annyit szerepelne a nyilvánosság előtt, mint az E=mc^2. Található pólókra festve és a vicclapok karikatúráiban is. Nézzük meg, hogy miről is van szó.

Mozogjon egy tömegpont az x tengely mentén. A tömegpont nyugalomból indul és valamilyen tetszőleges F erő hatására gyorsul.

Fiz2 Rel 30.jpg

Számítsuk ki az F erő W munkáját, mialatt a pont az álló helyzetéből v sebességűre gyorsul! A munkavégzés definíciója szerint

\displaystyle  W = \int_0^x F {\rm d} x.

A tömegpont mindvégig a relativisztikus mozgásegyenletnek megfelelően viselkedik, azaz

\displaystyle   \frac{{\rm d} p}{{\rm d} t} = F, \quad p = mv = \frac{m_0 v}{\sqrt{1 - (v/c)^2}}.

Ezt felhasználva a W definíciós kifejezésében, kapjuk, hogy

\displaystyle  W = \int_0^x F {\rm d} x = \int_0^x \frac{{\rm d} p}{{\rm d} t} {\rm d} x = \int_0^p \frac{{\rm d} x}{{\rm d} t} {\rm d} p = \int_0^p v {\rm d}p.

Az impulzus szerinti integrálásról áttérhetünk sebesség szerintire. A változócserét legegyszerűbben az infinitezimális {\rm d} v –vel való „bővítéssel” érhetjük el.

\displaystyle  W = \int_0^v v \frac{{\rm d} p}{{\rm d} v} {\rm d}v.

Ezután egy parciális integrálással léphetünk tovább. Tehát

\displaystyle  W = [pv]_0^v - m_0 \int_0^v p {\rm d}v.

A relativisztikus impulzus a v sebesség jól ismert függvénye, ezért írhatjuk, hogy

\displaystyle  W = [pv]_0^v - m_0 \int_0^v \frac{v}{1-(v/c)^2} {\rm d}v.

A kijelölt integrálás könnyen elvégezhető, mert az integrálandó függvény primitív függvénye ismert:

\displaystyle  W = m_0 \frac{v^2}{\sqrt{1 - (v/c)^2}} - m_0 \left[ -c^2 \sqrt{1 - (v/c)^2} \right]_0^v = m_0 \frac{v^2}{\sqrt{1 - (v/c)^2}} + m_0 c^2 \sqrt{1 - (v/c)^2} - m_0 c^2.

Bevezethető a szokásos \beta \equiv v/c jelölés is. A nyilvánvaló adódó kiemelés után kapjuk, hogy

\displaystyle  W = m_0 c^2 \left[ \frac{\beta^2}{\sqrt{1-\beta^2}} + \sqrt{1-\beta^2} - 1 \right].

Elvégezve a zárójelben kijelölt műveletet, a következő kifejezésre jutunk:

\displaystyle  W = m_0 c^2 \left[ \frac{1}{\sqrt{1-\beta^2}} - 1 \right].

Mint az jól ismert, a munkatétel szerint: egy tömegpont E_K kinetikus energiájának a \Delta E_K megváltozása egyenlő a ponton ható erő W munkájával. Alkalmazzuk a munkatételt a mostani esetben is! Ekkor a W-re kapott kifejezés alapján írhatjuk, hogy

\displaystyle  \Delta E_K = W = \frac{m_0}{1-(v\c)^2} c^2 - m_0 c^2 \equiv E-E_0,

ahol definíció szerint megkapjuk a „híres összefüggést”:

\displaystyle  E = mc^2,

melynek neve: tömeg-energia ekvivalencia.

A newtoni mechanikához képest, a fogalmak szintjén megjelenik egy érdekes újdonság. Ez a \Delta E_K kifejezésében szereplő E_0, amit nyugalmi energiának nevezünk. Evvel minden, nyugalomban lévő m_0 tömegű test rendelkezik. Ez joggal veti fel a kifejezés fizikai értelmezésének az igényét.

Mint azt tudjuk, a c fénysebesség egy invariáns skalár és egyben egy „természeti állandó” is. Az E-vel jelölt energia bevezetése egy definícióval történt. Azaz a mozgó tömegpont kinetikus energiáját az E energia és az E_0 nyugalmi energiának a különbségeként definiáltuk. Tehát az E=mc^2-ben az egyenlőség jel nem egy „ok-okozat” viszonyt fejez ki mint pl. az F=ma kifejezésben.

Mint azt tudjuk, az SI mértékegység rendszerben a c\approx 3\cdot 10^8 [{\rm m/s}]. Választhatnánk olyan hosszúság- és időegységet, hogy c=1 [hossz/idő] adódjék. Ekkor E és m mindig ugyanaz a számérték lenne, de más mértékegységgel. Ez olyan, mintha ugyanarról a fizikai mennyiségről lenne szó, csak más mértékegységgel kifejezve. Ezért beszélhetünk „tömeg-energia ekvivalenciáról”.

Einstein kiterjesztette ennek az érvényességét pontrendszerekre is. Egy pontrendszer nyugalmi energiája az összetevők kinetikus energiájának és (a részecskék kölcsönhatásából származó) potenciális energia(ák) összegéből áll. Így pl. a rendszer nyugalmi tömege változni fog, ha bármelyik belső energia (kinetikus, potenciális) megváltozik. Tehát nem arról van szó, hogy „a tömeg energiává alakul”, hanem arról, hogy az energia megváltozását egyben tömegváltozásként is detektálhatjuk.

It followed from the special theory of relativity that mass and energy are both but different manifestations of the same thing – a somewhat unfamiliar conception for the average mind. Furthermore, the equation E is equal to m c-squared, in which energy is put equal to mass, multiplied by the square of the velocity of light, showed that very small amounts of mass may be converted into a very large amount of energy and vice versa. The mass and energy were in fact equivalent, according to the formula mentioned above. This was demonstrated by Cockcroft and Walton in 1932, experimentally. (Albert Einstein)

Tömegdefektus

A fenti eredmények igen szépen igazolódnak az ún. „tömegdefektus” jelenségében. Ennek szerepe a nukleáris technikában alapvető.

Mint tudjuk, a Hélium atom magja két protonból és két neutronból áll. A tapasztalat szerint azonban két proton és két neutron tömegének az összege nagyobb, mint a Hélium atom magjáé. Vajon miért?

Fiz2 Rel 31.jpg

A megoldás a tömeg-energia ekvivalencia ténye. Ha a négy darab részecske egymástól végtelen (mikroszkopikus skálán nagyon nagy) távolságra van egymástól, akkor az így tekintett rendszer tömege a részecskék tömegének az összege lesz. Ha azonban a részecskék egy Hélium atommá állnak össze, akkor közöttük egy vonzó kölcsönhatásnak kell fellépni. Ez sokkal nagyobb kell, hogy legyen, mint a protonok közötti taszító Coulomb-erő. A vonzó kölcsönhatás távolságokban már igen nagy. Ezt az újfajta kölcsönhatást magerőnek hívjuk. Ez a nukleonok (neutronok és protonok) között hat. Mivel vonzó erőhatásról van szó, ez negatív potenciális energiát jelent, azaz lecsökken a rendszer (\rm He) nyugalmi energiája.

Ez a tömegkülönbség (\Delta E=\Delta m c^2) kb. 28 {\rm MeV} energiakülönbséget jelent. Egy mol (6\cdot 10^{23} db) \rm He atom esetén ez 10^{11} Joule energiát ad. Makroszkopikus skálán ez hatalmas mennyiség. Ezt az effektust használjuk fel a jövendő fúziós reaktoroknál.

Az energia mint a sebesség és az impulzus függvénye

Ismeretes, hogy a klasszikus mechanikában az E_K kinetikus energia definíció szerint (1/2)mv^2 és/vagy p^2/2m, ahol p=mv. Érdemes megkeresni ugyanezek megfelelőit a relativisztikus mechanikában!

Az E_K(v) valójában már ismert, hiszen

\displaystyle  E = mc^2 = \frac{m_0 c^2}{\sqrt{1 - (v/c)^2}}.
Fiz2 Rel 32.jpg

Könnyen belátható, hogy kis sebességeknél (v\ll c) visszakapjuk klasszikus definíciót:

\displaystyle  E_K = mc^2 - m_0 c^2 \approx (1/2) m_0 v^2, \quad v\ll c.

Az E_K(p) kiszámítása már bonyolultabb (a tömeg időfüggő!). Ezért itt csak azt bizonyítjuk, hogy a megadott formula teljesíti a korrespondencia-elvet, azaz „kis” impulzusok (p\to 0) esetén visszakapjuk a klasszikus eredményt. Tehát

\displaystyle  E = \sqrt{m_0^2 c^4 + c^2 p^2}.

és így

\displaystyle  E_K = \sqrt{m_0^2 c^4 + c^2 p^2} - m_0 c^2 \approx \frac{p^2}{2m}, \quad p \ll m_0 c.
Fiz2 Rel 33.jpg

Mint azt vártuk, a v sebesség (kinetika) mindig kisebb, mint c, de az impulzus (dinamika) tetszőlegesen nagy lehet.