Matrismekanik

Matrismekanik är en formulering av kvantmekanik skapad av Werner Heisenberg , Max Born och Pascual Jordan 1925. Det var den första konceptuellt autonoma och logiskt konsekventa formuleringen av kvantmekanik. Dess redogörelse för kvanthopp ersatte Bohr- modellens elektronbanor . Det gjorde det genom att tolka de fysikaliska egenskaperna hos partiklar som matriser som utvecklas i tiden. Det är likvärdigt med Schrödinger-vågformuleringen av kvantmekanik, som manifesteras i Diracs bra -ket-notation .

I viss kontrast till vågformuleringen producerar den spektra av (för det mesta energi) operatörer genom rent algebraiska stegoperatormetoder . Med hjälp av dessa metoder Wolfgang Pauli väteatomspektrumet 1926, före utvecklingen av vågmekaniken.

Utveckling av matrismekanik

1925 formulerade Werner Heisenberg , Max Born och Pascual Jordan kvantmekanikens matrismekanikrepresentation.

Trettondagshelgen på Helgoland

1925 arbetade Werner Heisenberg i Göttingen på problemet med att beräkna vätespektrallinjerna . I maj 1925 började han försöka beskriva atomsystem endast genom observerbara . Den 7 juni, efter att ha misslyckats i flera veckor med att lindra sin hösnuva med aspirin och kokain, åkte Heisenberg till den pollenfria ön Helgoland i Nordsjön . Medan han var där, mellan klättring och memorering av dikter från Goethes West-östlicher Diwan , fortsatte han att fundera över den spektrala frågan och insåg så småningom att antagande av icke-pendlande observerbara objekt kunde lösa problemet. Han skrev senare:

Klockan var ungefär tre på natten när slutresultatet av beräkningen låg framför mig. Först var jag djupt skakad. Jag var så upprymd att jag inte kunde tänka på att sova. Så jag lämnade huset och väntade på soluppgången på toppen av en sten.

De tre grundläggande dokumenten

Efter att Heisenberg återvänt till Göttingen visade han Wolfgang Pauli sina beräkningar och kommenterade vid ett tillfälle:

Allt är fortfarande vagt och oklart för mig, men det verkar som om elektronerna inte längre kommer att röra sig i banor.

Den 9 juli gav Heisenberg samma papper om sina beräkningar till Max Born och sa att "han hade skrivit en galen tidning och inte vågade skicka in den för publicering, och att Born borde läsa den och ge honom råd" innan publiceringen. Heisenberg reste sedan ett tag och lämnade Born för att analysera tidningen.

I artikeln formulerade Heisenberg kvantteori utan skarpa elektronbanor. Hendrik Kramers hade tidigare beräknat de relativa intensiteterna för spektrallinjer i Sommerfeld-modellen genom att tolka banornas Fourierkoefficienter som intensiteter. Men hans svar, som alla andra beräkningar i den gamla kvantteorin , var bara korrekt för stora banor .

Heisenberg, efter ett samarbete med Kramers, började förstå att övergångssannolikheterna inte var helt klassiska storheter, eftersom de enda frekvenserna som förekommer i Fourier-serien borde vara de som observeras i kvanthopp, inte de fiktiva som kommer från Fourier -analys av skarpa klassiska banor. Han ersatte den klassiska Fourier-serien med en matris av koefficienter, en luddig kvantanalog av Fourier-serien. Klassiskt sett ger Fourier-koefficienterna intensiteten av den emitterade strålningen , så i kvantmekaniken var storleken på matriselementen hos positionsoperatören intensiteten av strålningen i det ljusa linjespektrumet. Storheterna i Heisenbergs formulering var den klassiska positionen och momentumet, men nu var de inte längre skarpt definierade. Varje kvantitet representerades av en samling Fourier-koefficienter med två index, motsvarande initiala och slutliga tillstånd.

När Born läste tidningen, kände han igen formuleringen som en som kunde transkriberas och utökas till det systematiska språket i matriser , som han hade lärt sig från sin studie under Jakob Rosanes vid Breslau University . Born, med hjälp av sin assistent och tidigare elev Pascual Jordan, började omedelbart göra transkriptionen och förlängningen, och de lämnade in sina resultat för publicering; tidningen mottogs för publicering bara 60 dagar efter Heisenbergs tidning.

Ett uppföljningsdokument lämnades in för publicering före årets slut av alla tre författarna. (En kort genomgång av Borns roll i utvecklingen av matrismekanikens formulering av kvantmekanik tillsammans med en diskussion av nyckelformeln som involverar icke-kommutiviteten för sannolikhetsamplituderna finns i en artikel av Jeremy Bernstein. En detaljerad historisk och teknisk redogörelse finns i Mehra och Rechenbergs bok The Historical Development of Quantum Theory. Volym 3. The Formulation of Matrix Mechanics and Its Modifications 1925–1926. )

De tre grundläggande dokumenten:

  •   W. Heisenberg, Über quantentheoretische Umdeutung kinematischer und mechanischer Beziehungen , Zeitschrift für Physik , 33 , 879-893, 1925 (mottagen 29 juli 1925). [Engelsk översättning i: BL van der Waerden, redaktör, Sources of Quantum Mechanics (Dover Publications, 1968) ISBN 0-486-61881-1 (Engelsk titel: Quantum-Theoretical Re-interpretation of Kinematic and Mechanical Relations ). ]
  •   M. Born och P. Jordan, Zur Quantenmechanik , Zeitschrift für Physik , 34 , 858-888, 1925 (mottagen 27 september 1925). [Engelsk översättning i: BL van der Waerden, redaktör, Sources of Quantum Mechanics (Dover Publications, 1968) ISBN 0-486-61881-1 (engelsk titel: On Quantum Mechanics ) .]
  •   M. Born, W. Heisenberg och P. Jordan, Zur Quantenmechanik II , Zeitschrift für Physik , 35 , 557-615, 1926 (mottagen 16 november 1925). [Engelsk översättning i: BL van der Waerden, redaktör, Sources of Quantum Mechanics (Dover Publications, 1968) ISBN 0-486-61881-1 (engelsk titel: On Quantum Mechanics II ) .]

Fram till denna tid användes matriser sällan av fysiker; de ansågs tillhöra den rena matematikens rike. Gustav Mie hade använt dem i en uppsats om elektrodynamik 1912 och Born hade använt dem i sitt arbete med gitterteorin för kristaller 1921. Medan matriser användes i dessa fall kom inte algebra av matriser med deras multiplikation in i bilden som de gjorde i matrisformuleringen av kvantmekaniken.

Born hade dock lärt sig matrisalgebra av Rosanes, som redan nämnts, men Born hade också lärt sig Hilberts teori om integralekvationer och kvadratiska former för ett oändligt antal variabler, vilket framgick av ett citat av Born av Hilberts verk Grundzüge einer allgemeinen Theorie der Linearen Integralgleichungen publicerades 1912.

Även Jordan var väl rustad för uppgiften. Under ett antal år hade han varit assistent åt Richard Courant i Göttingen vid utarbetandet av Courant och David Hilberts bok Methoden der mathematischen Physik I , som gavs ut 1924. Denna bok innehöll, som tur var, en hel del av de matematiska verktyg som behövs för den fortsatta utvecklingen av kvantmekaniken.

1926 blev John von Neumann assistent till David Hilbert, och han skulle mynta termen Hilbert space för att beskriva algebra och analys som användes i utvecklingen av kvantmekaniken.

Ett nyckelbidrag till denna formulering uppnåddes i Diracs omtolkning/syntesuppsats från 1925, som uppfann språket och ramverket som vanligtvis används idag, i full visning av den icke-kommutativa strukturen av hela konstruktionen.

Heisenbergs resonemang

Innan matrismekaniken beskrev den gamla kvantteorin en partikels rörelse i en klassisk bana, med väldefinierad position och momentum X ( t ), P ( t ), med begränsningen att tidsintegralen över en period T av momentum gånger hastigheten måste vara en positiv heltalsmultipel av Plancks konstant

Även om denna begränsning korrekt väljer banor med mer eller mindre rätt energivärden E n , beskrev den gamla kvantmekaniska formalismen inte tidsberoende processer, såsom emission eller absorption av strålning.

När en klassisk partikel är svagt kopplad till ett strålningsfält, så att strålningsdämpningen kan försummas, kommer den att avge strålning i ett mönster som upprepar sig varje omloppsperiod . Frekvenserna som utgör den utgående vågen är då heltalsmultiplar av orbitalfrekvensen, och detta är en återspegling av det faktum att X ( t ) är periodisk, så att dess Fourierrepresentation endast har frekvenserna 2π n / T .

Koefficienterna Xn . är komplexa tal De med negativa frekvenser måste vara de komplexa konjugaten av de med positiva frekvenser, så att X ( t ) alltid kommer att vara verklig,

En kvantmekanisk partikel kan å andra sidan inte sända ut strålning kontinuerligt, den kan bara sända ut fotoner. Om man antar att kvantpartikeln startade i omloppsbana nummer n , avgav en foton och sedan hamnade i omloppsbana nummer m , är fotons energi E n E m , vilket betyder att dess frekvens är ( E n E m )/ h .

För stora n och m , men med n m relativt liten, är dessa de klassiska frekvenserna enligt Bohrs överensstämmelseprincip

I formeln ovan är T den klassiska perioden för antingen bana n eller bana m , eftersom skillnaden mellan dem är högre i h . Men för n och m små, eller om n m är stor, är frekvenserna inte heltalsmultiplar av någon enskild frekvens.

Eftersom frekvenserna som partikeln avger är desamma som frekvenserna i Fourierbeskrivningen av dess rörelse, tyder detta på att något i den tidsberoende beskrivningen av partikeln svänger med frekvensen ( E n E m ) / h . Heisenberg kallade denna kvantitet X nm och krävde att den skulle reduceras till de klassiska Fourierkoefficienterna i den klassiska gränsen. För stora värden på n , m men med n m relativt liten, är X nm ( n m ) :te Fourierkoefficienten för den klassiska rörelsen i omloppsbana n . Eftersom X nm har motsatt frekvens till X mn blir villkoret att X är reellt

Per definition har X nm bara frekvensen ( En , E m )/ h så dess tidsutveckling är enkel:

Detta är den ursprungliga formen av Heisenbergs rörelseekvation.

Givet två arrayer X nm och P nm som beskriver två fysiska storheter, skulle Heisenberg kunna bilda en ny array av samma typ genom att kombinera termerna X nk P km , som också oscillerar med rätt frekvens. Eftersom Fourier-koefficienterna för produkten av två kvantiteter är faltningen av Fourier-koefficienterna för var och en separat, gjorde överensstämmelsen med Fourier-serier det möjligt för Heisenberg att härleda regeln med vilken arrayerna ska multipliceras,

Born påpekade att detta är lagen för matrismultiplikation, så att positionen, rörelsemängden, energin, alla observerbara storheter i teorin, tolkas som matriser. Enligt denna multiplikationsregel beror produkten på ordningen: XP skiljer sig från PX .

X - matrisen är en fullständig beskrivning av rörelsen hos en kvantmekanisk partikel. Eftersom frekvenserna i kvantrörelsen inte är multipler av en gemensam frekvens, kan matriselementen inte tolkas som Fourier-koefficienterna för en skarp klassisk bana . Icke desto mindre, som matriser, X ( t ) och P ( t ) de klassiska rörelseekvationerna; se även Ehrenfests sats nedan.

Grunderna i matrisen

När det introducerades av Werner Heisenberg, Max Born och Pascual Jordan 1925, accepterades inte matrismekanik omedelbart och var en källa till kontrovers, till en början. Schrödingers senare introduktion av vågmekanik gynnades mycket.

En del av anledningen var att Heisenbergs formulering var på ett udda matematiskt språk, för tiden, medan Schrödingers formulering baserades på välbekanta vågekvationer. Men det fanns också ett djupare sociologiskt skäl. Kvantmekaniken hade utvecklats genom två vägar, en ledd av Einstein, som betonade våg-partikeldualiteten som han föreslog för fotoner, och den andra ledd av Bohr, som betonade de diskreta energitillstånden och kvanthoppen som Bohr upptäckte. De Broglie hade reproducerat de diskreta energitillstånden inom Einsteins ram – kvanttillståndet är det stående vågtillståndet, och detta gav hopp till dem i Einsteinskolan att alla diskreta aspekter av kvantmekaniken skulle subsumeras i en kontinuerlig vågmekanik.

Matrismekaniken kom å andra sidan från Bohr-skolan, som sysslade med diskreta energitillstånd och kvanthopp. Bohrs anhängare uppskattade inte fysiska modeller som föreställde elektroner som vågor, eller som något alls. De föredrog att fokusera på de kvantiteter som var direkt kopplade till experiment.

Inom atomfysik gav spektroskopi observationsdata om atomövergångar som härrör från interaktioner mellan atomer och ljuskvanta . Bohrskolan krävde att endast de storheter som i princip var mätbara med spektroskopi skulle förekomma i teorin. Dessa kvantiteter inkluderar energinivåerna och deras intensiteter men de inkluderar inte den exakta platsen för en partikel i dess Bohr-bana. Det är mycket svårt att föreställa sig ett experiment som kan avgöra om en elektron i grundtillståndet för en väteatom befinner sig till höger eller till vänster om kärnan. Det var en djup övertygelse att sådana frågor inte hade något svar.

Matrisformuleringen byggdes på premissen att alla fysiska observerbara objekt representeras av matriser, vars element indexeras av två olika energinivåer. Uppsättningen av egenvärden för matrisen förstods så småningom vara uppsättningen av alla möjliga värden som det observerbara kan ha. Eftersom Heisenbergs matriser är hermitiska är egenvärdena reella.

Om en observerbar mäts och resultatet är ett visst egenvärde, är motsvarande egenvektor systemets tillstånd omedelbart efter mätningen. Mäthandlingen i matrismekaniken "kollapsar" systemets tillstånd. Om man mäter två observerbara objekt samtidigt, kollapsar systemets tillstånd till en gemensam egenvektor för de två observerbara. Eftersom de flesta matriser inte har några egenvektorer gemensamma, kan de flesta observerbara aldrig mätas exakt samtidigt. Detta är osäkerhetsprincipen .

Om två matriser delar sina egenvektorer kan de diagonaliseras samtidigt. I grunden där de båda är diagonala är det tydligt att deras produkt inte beror på deras ordning eftersom multiplikation av diagonala matriser bara är multiplikation av tal. Osäkerhetsprincipen är däremot ett uttryck för att två matriser A och B ofta inte alltid pendlar, dvs att AB − BA inte nödvändigtvis är lika med 0. Matrismekanikens grundläggande kommuteringsrelation,

innebär då att det inte finns några tillstånd som samtidigt har en bestämd position och momentum .

Denna osäkerhetsprincip gäller även för många andra par av observerbara objekt. Energin pendlar till exempel inte heller med positionen, så det är omöjligt att exakt bestämma positionen och energin för en elektron i en atom.

Nobelpriset

1928 nominerade Albert Einstein Heisenberg, Born och Jordan till Nobelpriset i fysik . Tillkännagivandet av Nobelpriset i fysik för 1932 dröjde till november 1933. Det var vid den tiden som det meddelades att Heisenberg vunnit priset för 1932 "för skapandet av kvantmekanik, vars tillämpning har bl.a. till upptäckten av de allotropa formerna av väte" och Erwin Schrödinger och Paul Adrien Maurice Dirac delade 1933 års pris "för upptäckten av nya produktiva former av atomteori".

Man kan mycket väl fråga sig varför Born inte tilldelades priset 1932, tillsammans med Heisenberg, och Bernstein ger spekulationer i denna fråga. En av dem handlar om att Jordan gick med i nazistpartiet den 1 maj 1933 och blev stormtrooper . Jordans partitillhörighet och Jordans kopplingar till Born kan mycket väl ha påverkat Borns chans till priset vid den tiden. Bernstein noterar vidare att när Born äntligen vann priset 1954, levde Jordan fortfarande, medan priset delades ut för den statistiska tolkningen av kvantmekaniken, hänförlig till Born ensam.

Heisenbergs reaktioner på att Born for Heisenberg fick priset 1932 och att Born fick priset 1954 är också lärorika för att utvärdera om Born borde ha delat priset med Heisenberg. Den 25 november 1933 fick Born ett brev från Heisenberg där han sa att han hade blivit försenad med att skriva på grund av "dåligt samvete" att han ensam hade fått priset "för arbete utfört i Göttingen i samarbete – du, Jordan och jag ." Heisenberg fortsatte med att säga att Born och Jordans bidrag till kvantmekaniken inte kan ändras av "ett felaktigt beslut från utsidan."

1954 skrev Heisenberg en artikel som hedrade Max Planck för hans insikt 1900. I artikeln gav Heisenberg Born and Jordan kredit för den slutliga matematiska formuleringen av matrismekanik och Heisenberg fortsatte med att betona hur stora deras bidrag var till kvantmekaniken, som var inte "tillräckligt erkänd i allmänhetens ögon."

Matematisk utveckling

När Heisenberg väl introducerade matriserna för X och P , kunde han hitta deras matriselement i speciella fall genom gissningar, styrda av korrespondensprincipen . Eftersom matriselementen är de kvantmekaniska analogerna av Fourier-koefficienterna för de klassiska banorna, är det enklaste fallet den harmoniska oscillatorn , där den klassiska positionen och rörelsemängden, X ( t ) och P ( t ), är sinusformade.

Harmonisk oscillator

I enheter där oscillatorns massa och frekvens är lika med ett (se icke-dimensionalisering ), är oscillatorns energi

Nivåuppsättningarna av H är de medurs banorna , och de är kapslade cirklar i fasrymden. Den klassiska omloppsbanan med energi E är

Det gamla kvantvillkoret dikterar att integralen av P dX över en bana, som är cirkelns area i fasrymden, måste vara en heltalsmultipel av Plancks konstant . Arean av cirkeln med radien 2 E är 2 πE . Så

eller, i naturliga enheter där ħ = 1 , är energin ett heltal.

Fourierkomponenterna för X ( t ) och P ( t ) är enkla , och mer så om de kombineras till kvantiteterna

Både A och A har bara en enda frekvens, och X och P kan återvinnas från summan och skillnaden.

Eftersom A ( t ) har en klassisk Fourier-serie med endast den lägsta frekvensen, och matriselementet A mn är ( m n ) -th Fourier-koefficienten för den klassiska omloppsbanan, är matrisen för A endast noll på linjen precis ovanför diagonalen, där den är lika med 2 E n . Matrisen för A är likaledes endast icke-noll på linjen under diagonalen, med samma element. Sålunda, från A och A , ger rekonstruktionen

och
som, upp till valet av enheter, är Heisenberg-matriserna för den harmoniska oscillatorn. Båda matriserna är hermitiska , eftersom de är konstruerade från Fourier-koefficienterna för verkliga kvantiteter.

Att hitta X ( t ) och P ( t ) är direkt, eftersom de är kvant-fourierkoefficienter så de utvecklas helt enkelt med tiden,

Matrisprodukten av X och P är inte hermitisk, utan har en verklig och imaginär del. Den reella delen är hälften av det symmetriska uttrycket XP + PX , medan den imaginära delen är proportionell mot kommutatorn

Det är enkelt att explicit verifiera att XP PX i fallet med den harmoniska oscillatorn är multiplicerat med identiteten .

Det är likaledes enkelt att verifiera att matrisen

är en diagonal matris , med egenvärden E i .

Bevarande av energi

Den harmoniska oscillatorn är ett viktigt fall. Att hitta matriserna är lättare än att bestämma de allmänna villkoren från dessa specialformulär. Av denna anledning undersökte Heisenberg den anharmoniska oscillatorn med Hamiltonian

I det här fallet är X- och P -matriserna inte längre enkla utanför diagonala matriser, eftersom de motsvarande klassiska banorna är något klämda och förskjutna, så att de har Fourier-koefficienter vid varje klassisk frekvens. För att bestämma matriselementen krävde Heisenberg att de klassiska rörelseekvationerna skulle följas som matrisekvationer,

Han märkte att om detta kunde göras så kommer H , betraktad som en matrisfunktion av X och P , att ha noll tidsderivata.

där A B är antikommutatorn ,

Med tanke på att alla off-diagonala element har en frekvens som inte är noll; Att H är konstant innebär att H är diagonal. Det stod klart för Heisenberg att i detta system kunde energin bevaras exakt i ett godtyckligt kvantsystem, ett mycket uppmuntrande tecken.

Processen med emission och absorption av fotoner verkade kräva att bevarandet av energi skulle hålla i bästa fall i genomsnitt. Om en våg som innehåller exakt en foton passerar över några atomer, och en av dem absorberar den, måste den atomen berätta för de andra att de inte kan absorbera fotonen längre. Men om atomerna är långt ifrån varandra, kan vilken signal som helst inte nå de andra atomerna i tid, och det kan sluta med att de absorberar samma foton ändå och sprider energin till miljön. När signalen nådde dem skulle de andra atomerna på något sätt behöva återkalla den energin. Denna paradox fick Bohr, Kramers och Slater att överge exakt bevarande av energi. Heisenbergs formalism, när den utvidgades till att omfatta det elektromagnetiska fältet, skulle uppenbarligen kringgå detta problem, en antydan om att tolkningen av teorin kommer att involvera kollaps av vågfunktioner .

Differentieringstrick — kanoniska kommuteringsrelationer

Att kräva att de klassiska rörelseekvationerna ska bevaras är inte ett tillräckligt starkt villkor för att bestämma matriselementen. Plancks konstant förekommer inte i de klassiska ekvationerna, så att matriserna skulle kunna konstrueras för många olika värden på ħ och ändå tillfredsställa rörelseekvationerna, men med olika energinivåer.

Så för att implementera sitt program behövde Heisenberg använda det gamla kvantvillkoret för att fixera energinivåerna, sedan fylla i matriserna med Fourier-koefficienter för de klassiska ekvationerna och sedan ändra matriskoefficienterna och energinivåerna något för att säkerställa att klassiska ekvationer är uppfyllda. Detta är uppenbarligen inte tillfredsställande. De gamla kvantförhållandena hänvisar till området som omges av de skarpa klassiska banorna, som inte existerar i den nya formalismen.

Det viktigaste som Heisenberg upptäckte är hur man översätter det gamla kvanttillståndet till ett enkelt uttalande inom matrismekanik.

För att göra detta undersökte han handlingsintegralen som en matriskvantitet,

Det finns flera problem med denna integral, alla härrörande från matrisformalismens oförenlighet med den gamla bilden av banor. Vilken period T ska användas? Semiklassiskt bör det vara antingen m eller n , men skillnaden är ordning ħ , och ett svar på ordning ħ söks. Kvantvillkoret säger oss att J mn är 2π n på diagonalen, så det faktum att J är klassiskt konstant säger oss att de off-diagonala elementen är noll.

Hans avgörande insikt var att differentiera kvanttillståndet med avseende på n . Denna idé är bara fullständigt meningsfull i den klassiska gränsen, där n inte är ett heltal utan den kontinuerliga handlingsvariabeln J , men Heisenberg utförde analoga manipulationer med matriser, där de mellanliggande uttrycken ibland är diskreta skillnader och ibland derivator.

I den följande diskussionen kommer för tydlighetens skull differentieringen att utföras på de klassiska variablerna, och övergången till matrismekanik kommer att göras i efterhand, styrd av korrespondensprincipen.

I den klassiska miljön är derivatan derivatan med avseende på J av integralen som definierar J , så den är tautologiskt lika med 1.

där derivatorna dP / dJ och dX / dJ ska tolkas som skillnader med avseende på J vid motsvarande tidpunkter på närliggande banor, exakt vad som skulle erhållas om Fourier-koefficienterna för omloppsrörelsen differentierades. (Dessa derivator är symplektiskt ortogonala i fasutrymme till tidsderivatorna dP / dt och dX / dt ).

Det slutliga uttrycket förtydligas genom att introducera variabeln kanoniskt konjugerat till J , som kallas vinkelvariabeln θ : Derivatan med avseende på tid är en derivata med avseende på θ , upp till en faktor på 2π T ,

Så kvanttillståndsintegralen är medelvärdet över en cykel av Poisson-parentesen för X och P .

En analog differentiering av Fourier-serien av P dX visar att de off-diagonala elementen i Poisson-fästet alla är noll. Poisson-parentesen för två kanoniskt konjugerade variabler, såsom X och P , är det konstanta värdet 1, så denna integral är verkligen medelvärdet på 1; så det är 1, som vi visste hela tiden, eftersom det trots allt är dJ/dJ . Men Heisenberg, Born och Jordan, till skillnad från Dirac, var inte bekanta med teorin om Poisson-parenteser, så för dem utvärderade differentieringen effektivt { X, P } i J, θ- koordinater.

Poisson-konsolen, till skillnad från handlingsintegralen, har en enkel översättning till matrismekanik - den motsvarar normalt den imaginära delen av produkten av två variabler, kommutatorn .

För att se detta, undersök den (antisymmetriserade) produkten av två matriser A och B i korrespondensgränsen, där matriselementen är långsamt varierande funktioner i indexet, med tanke på att svaret är noll klassiskt.

I korrespondensgränsen, när indexen m , n är stora och närliggande, medan k , r är små, är förändringshastigheten för matriselementen i diagonal riktning matriselementet för J -derivatan av motsvarande klassiska storhet. Så det är möjligt att flytta vilket matriselement som helst diagonalt genom korrespondensen,

där den högra sidan egentligen bara är den ( m n )':e Fourier-komponenten av dA / dJ i omloppsbanan nära m till denna semiklassiska ordning, inte en fullständig väldefinierad matris.

Den halvklassiska tidsderivatan av ett matriselement erhålls upp till faktorn i genom att multiplicera med avståndet från diagonalen,

eftersom koefficienten A m ( m + k ) är semiklassiskt den k': te Fourierkoefficienten för den m -:te klassiska omloppsbanan.

Den imaginära delen av produkten av A och B kan utvärderas genom att flytta matriselementen runt för att återskapa det klassiska svaret, som är noll.

Residualen som inte är noll ges sedan helt och hållet av växlingen. Eftersom alla matriselement är vid index som har ett litet avstånd från den stora indexpositionen ( m , m ), hjälper det att introducera två temporära notationer: A [ r , k ] = A ( m + r )( m + k ) för matriserna och ( dA / dJ )[ r ] för de r:te Fourierkomponenterna av klassiska storheter,

Om du vänder summeringsvariabeln i den första summan från r till r' = k r , blir matriselementet,

och det är tydligt att den huvudsakliga (klassiska) delen avbryts.

Den ledande kvantdelen, som försummar produkten av högre ordning av derivator i restuttrycket, är då lika med

så att äntligen
som kan identifieras med i gånger den k -:te klassiska Fourier-komponenten i Poisson-parentesen.

Heisenbergs ursprungliga differentieringstrick utökades så småningom till en fullständig semiklassisk härledning av kvanttillståndet, i samarbete med Born och Jordan. En gång kunde de konstatera det

detta villkor ersatte och utökade den gamla kvantiseringsregeln, vilket gjorde att matriselementen för P och X för ett godtyckligt system kunde bestämmas helt enkelt från formen av Hamiltonian.

Den nya kvantiseringsregeln antogs vara universellt sann , även om härledningen från den gamla kvantteorin krävde semiklassiska resonemang. (En fullständig kvantbehandling, men för mer utarbetade argument för parentesen, uppskattades på 1940-talet till att utvidga Poisson-parenteser till Moyal-parenteser .)

Tillståndsvektorer och Heisenbergsekvationen

För att göra övergången till standardkvantmekanik var det viktigaste ytterligare tillägget kvanttillståndsvektorn , nu skriven | ψ ⟩, som är vektorn som matriserna verkar på. Utan tillståndsvektorn är det inte klart vilken speciell rörelse som Heisenberg-matriserna beskriver, eftersom de inkluderar alla rörelser någonstans.

Tolkningen av tillståndsvektorn, vars komponenter är skrivna ψ m , tillhandahölls av Born. Denna tolkning är statistisk: resultatet av en mätning av den fysiska storheten som motsvarar matrisen A är slumpmässig, med ett medelvärde lika med

Alternativt och ekvivalent ger tillståndsvektorn sannolikhetsamplituden ψ n för att kvantsystemet ska vara i energitillståndet n .

När väl tillståndsvektorn introducerades kunde matrismekaniken roteras till vilken bas som helst , där H -matrisen inte längre behöver vara diagonal. Heisenbergs rörelseekvation i sin ursprungliga form säger att A mn utvecklas i tiden som en Fourier-komponent,

som kan omarbetas i differentiell form
och det kan omformuleras så att det är sant på godtycklig basis, genom att notera att H -matrisen är diagonal med diagonala värden E m ,
Detta är nu en matrisekvation, så den håller i vilken grund som helst. Detta är den moderna formen av Heisenbergs rörelseekvation.

Dess formella lösning är:

Alla dessa former av rörelseekvationen ovan säger samma sak, att A ( t ) är ekvivalent med A (0) , genom en basrotation av den enhetliga matrisen e iHt , en systematisk bild belyst av Dirac i sin bra–ket-notation .

Omvänt, genom att rotera basen för tillståndsvektorn vid varje tidpunkt med eiHt . , kan tidsberoendet i matriserna ångras Matriserna är nu tidsoberoende, men tillståndsvektorn roterar,

Detta är Schrödinger-ekvationen för tillståndsvektorn, och denna tidsberoende förändring av basen motsvarar transformation till Schrödinger-bilden , med ⟨ x | ψ ⟩ = ψ ( x ).

I kvantmekaniken i Heisenberg - bilden tillståndsvektorn | ψ ⟩ förändras inte med tiden, medan ett observerbart A uppfyller Heisenbergs rörelseekvation ,

Den extra termen är för operatörer som t.ex

som har ett explicit tidsberoende , förutom tidsberoendet från den diskuterade enhetliga evolutionen.

Heisenbergbilden skiljer inte tid från rymden, så den lämpar sig bättre för relativistiska teorier än Schrödinger-ekvationen . Dessutom är likheten med klassisk fysik mer uppenbar: Hamiltons rörelseekvationer för klassisk mekanik återvinns genom att ersätta kommutatorn ovan med Poisson-parentesen (se även nedan). Enligt Stone–von Neumann-satsen måste Heisenberg-bilden och Schrödinger-bilden vara enhetligt ekvivalenta, som beskrivs i detalj nedan.

Ytterligare resultat

Matrismekaniken utvecklades snabbt till modern kvantmekanik och gav intressanta fysikaliska resultat på atomernas spektra.

Vågmekanik

Jordan noterade att kommuteringsrelationerna säkerställer att P fungerar som en differentialoperatör .

Operatörens identitet

tillåter utvärdering av kommutatorn av P med vilken som helst potens av X , och det antyder det
vilket, tillsammans med linjäritet, innebär att en P -kommutator effektivt differentierar alla analytiska matrisfunktioner hos X .

Om man antar att gränser definieras på ett förnuftigt sätt, sträcker sig detta till godtyckliga funktioner - men förlängningen behöver inte göras explicit förrän en viss grad av matematisk rigor krävs,

Eftersom X är en hermitisk matris bör den vara diagonaliserbar, och det kommer att framgå av den eventuella formen av P att varje reellt tal kan vara ett egenvärde. Detta gör en del av matematiken subtil, eftersom det finns en separat egenvektor för varje punkt i rymden.

I grunden där X är diagonal kan ett godtyckligt tillstånd skrivas som en överlagring av tillstånd med egenvärden x ,

så att ψ ( x ) = ⟨ x | ψ ⟩, och operatorn X multiplicerar varje egenvektor med x ,

Definiera en linjär operator D som differentierar ψ ,

och notera det
så att operatorn − iD följer samma kommuteringsrelation som P . Således måste skillnaden mellan P och − iD pendla med X ,
så det kan diagonaliseras samtidigt med X : dess värde som verkar på valfritt egentillstånd för X är någon funktion f av egenvärdet x .

Denna funktion måste vara verklig, eftersom både P och − iD är ​​hermitiska,

roterar varje stat med en fas f ( x ) , det vill säga att omdefiniera fasen för vågfunktionen:
Operatörens ID omdefinieras med ett belopp:
vilket betyder att P i den roterade basen är lika med − iD .

Därför finns det alltid en grund för egenvärdena för X där P: s verkan på någon vågfunktion är känd:

och Hamiltonian på denna grund är en linjär differentialoperator på tillståndsvektorkomponenterna,

Således är rörelseekvationen för tillståndsvektorn bara en berömd differentialekvation,

Eftersom D är en differentialoperator, för att den ska kunna definieras vettigt, måste det finnas egenvärden för X som gränsar till varje givet värde. Detta antyder att den enda möjligheten är att utrymmet för alla egenvärden av X är alla reella tal, och att P är iD, upp till en fasrotation .

För att göra detta rigoröst krävs en förnuftig diskussion om funktioners begränsande utrymme, och i detta utrymme är detta Stone-von Neumann-satsen : alla operatorer X och P som följer kommuteringsrelationerna kan fås att verka på ett utrymme av vågfunktioner, med P en derivatoperator. Detta innebär att en Schrödinger-bild alltid är tillgänglig.

Matrismekaniken sträcker sig lätt till många frihetsgrader på ett naturligt sätt. Varje frihetsgrad har en separat X- operator och en separat effektiv differentialoperator P , och vågfunktionen är en funktion av alla möjliga egenvärden för de oberoende pendlande X -variablerna.

I synnerhet betyder detta att ett system av N interagerande partiklar i 3 dimensioner beskrivs av en vektor vars komponenter i en bas där alla X är diagonala är en matematisk funktion av 3 N -dimensionellt rymd som beskriver alla deras möjliga positioner , i praktiken en mycket större samling av värden än enbart samlingen av N tredimensionella vågfunktioner i ett fysiskt utrymme. Schrödinger kom självständigt till samma slutsats och bevisade så småningom att hans egen formalism var likvärdig med Heisenbergs.

Eftersom vågfunktionen är en egenskap hos hela systemet, inte av någon enskild del, är beskrivningen inom kvantmekaniken inte helt lokal. Beskrivningen av flera kvantpartiklar har dem korrelerade, eller intrasslade . Denna förveckling leder till konstiga korrelationer mellan avlägsna partiklar som bryter mot den klassiska Bells ojämlikhet .

Även om partiklarna bara kan vara i två positioner, kräver vågfunktionen för N partiklar 2 N komplexa tal, ett för varje total konfiguration av positioner. Detta är exponentiellt många tal i N , så att simulera kvantmekanik på en dator kräver exponentiella resurser. Omvänt antyder detta att det kan vara möjligt att hitta kvantsystem av storlek N som fysiskt beräknar svaren på problem som klassiskt kräver 2 N bitar för att lösa. Detta är ambitionen bakom kvantberäkning .

Ehrenfest-satsen

För de tidsoberoende operatorerna X och P är ∂ A /∂ t = 0 så Heisenbergs ekvation ovan reduceras till:

där hakparenteserna [ , ] betecknar kommutatorn. För en Hamiltonian som är uppfyller X- och P - operatorerna:
där den första är klassiskt hastigheten och den andra är klassiskt kraften eller potentialgradienten . Dessa återger Hamiltons form av Newtons rörelselagar . I Heisenberg-bilden X- och P- operatorerna de klassiska rörelseekvationerna. Du kan ta förväntningsvärdet för båda sidor av ekvationen för att se det, i vilket tillstånd som helst | ψ ⟩:

Så Newtons lagar följs exakt av de förväntade värdena för operatörerna i ett givet tillstånd. Detta är Ehrenfests sats , som är en uppenbar följd av Heisenbergs rörelseekvationer, men är mindre trivial i Schrödinger-bilden, där Ehrenfest upptäckte den.

Transformationsteori

Inom klassisk mekanik är en kanonisk transformation av fasrymdskoordinater en som bevarar strukturen hos Poisson-parenteserna. De nya variablerna x',p' har samma Poisson-parenteser med varandra som de ursprungliga variablerna x,p . Tidsutveckling är en kanonisk transformation, eftersom fasrummet vid vilken tidpunkt som helst är ett lika bra val av variabler som fasrummet vid någon annan tidpunkt.

Det Hamiltonska flödet är den kanoniska transformationen :

Eftersom Hamiltonian kan vara en godtycklig funktion av x och p , finns det sådana oändliga kanoniska transformationer som motsvarar varje klassisk storhet G , där G fungerar som Hamiltonian för att generera ett flöde av punkter i fasrymden under ett inkrement av tiden s ,

För en allmän funktion A ( x , p ) på fasrymd är dess oändliga förändring vid varje steg ds under denna karta

Storheten G kallas den infinitesimala generatorn för den kanoniska transformationen.

Inom kvantmekaniken är kvantanalogen G nu en hermitisk matris, och rörelseekvationerna ges av kommutatorer,

De oändliga kanoniska rörelserna kan formellt integreras, precis som Heisenbergs rörelseekvation integrerades,

där U = e iGs och s är en godtycklig parameter.

Definitionen av en kvantkanonisk transformation är alltså en godtycklig enhetlig förändring av basen på utrymmet för alla tillståndsvektorer. U är en godtycklig enhetlig matris, en komplex rotation i fasrymden,

Dessa transformationer lämnar summan av den absoluta kvadraten av vågfunktionskomponenterna invariant , medan de tar tillstånd som är multipler av varandra (inklusive tillstånd som är imaginära multipler av varandra) till tillstånd som är samma multipel av varandra.

Tolkningen av matriserna är att de fungerar som generatorer av rörelser på tillståndsrummet .

Till exempel kan rörelsen som genereras av P hittas genom att lösa Heisenbergs rörelseekvation med P som Hamiltonian,

Dessa är översättningar av matrisen X med en multipel av identitetsmatrisen,
Detta är tolkningen av derivatoperatorn D : e iPs = e D , exponentialen för en derivatoperator är en översättning (alltså Lagranges skiftoperator ).

X - operatorn genererar likaså översättningar i P . Hamiltonian genererar translationer i tid , vinkelmomentet genererar rotationer i det fysiska rummet , och operatorn X 2 + P 2 genererar rotationer i fasrymden .

När en transformation, som en rotation i det fysiska rummet, pendlar med Hamiltonian, kallas transformationen en symmetri (bakom en degeneration) av Hamiltonian - Hamiltonian uttryckt i termer av roterade koordinater är densamma som den ursprungliga Hamiltonian. Detta betyder att förändringen i Hamiltonian under den infinitesimala symmetrigeneratorn L försvinner,

Det följer då att förändringen i generatorn under tidsöversättning också försvinner,

så att matrisen L är konstant i tiden: den är bevarad.

En-till-en-föreningen av infinitesimal symmetrigeneratorer och bevarandelagar upptäcktes av Emmy Noether för klassisk mekanik, där kommutatorerna är Poisson-parenteser , men det kvantmekaniska resonemanget är identiskt. Inom kvantmekaniken ger varje enhetlig symmetritransformation en bevarandelag, eftersom om matrisen U har egenskapen att

så följer det
och att tidsderivatan av U är noll – den är bevarad.

Egenvärdena för enhetsmatriser är rena faser, så att värdet av en enhetlig bevarad storhet är ett komplext tal av enhetsstorlek, inte ett reellt tal. Ett annat sätt att säga detta är att en enhetlig matris är exponentialen av i gånger en hermitisk matris, så att additivets bevarade reella kvantitet, fasen, endast är väldefinierad upp till en heltalsmultipel av . Först när den enhetliga symmetrimatrisen är en del av en familj som kommer godtyckligt nära identiteten är de bevarade reella storheterna envärdiga, och då blir kravet på att de ska bevaras en mycket mer krävande begränsning.

Symmetrier som kontinuerligt kan kopplas till identiteten kallas kontinuerliga och översättningar, rotationer och förstärkningar är exempel. Symmetrier som inte kan kopplas kontinuerligt till identiteten är diskreta , och operationen av rymd-inversion, eller paritet , och laddningskonjugering är exempel.

Tolkningen av matriserna som generatorer av kanoniska transformationer beror på Paul Dirac . Överensstämmelsen mellan symmetrier och matriser visades av Eugene Wigner vara fullständig, om antiunitära matriser som beskriver symmetrier som inkluderar tidsomkastning ingår.

Urvalsregler

Det var fysiskt klart för Heisenberg att de absoluta kvadraterna för matriselementen i X , som är Fourier-koefficienterna för svängningen, skulle ge emissionshastigheten för elektromagnetisk strålning.

I den klassiska gränsen för stora banor, om en laddning med position X ( t ) och laddning q oscillerar bredvid en lika och motsatt laddning vid position 0, är ​​det momentana dipolmomentet q X ( t ) , och tidsvariationen av detta moment översätts direkt till rum-tidsvariationen av vektorpotentialen, vilket ger kapslade utgående sfäriska vågor.

För atomer är våglängden för det emitterade ljuset cirka 10 000 gånger atomradien, och dipolmomentet är det enda bidraget till strålningsfältet, medan alla andra detaljer i atomladdningsfördelningen kan ignoreras.

Om man ignorerar bakreaktion, är effekten som utstrålas i varje utgående mod en summa av separata bidrag från kvadraten av varje oberoende tid Fouriermode av d ,

Nu, i Heisenbergs representation, är Fourierkoefficienterna för dipolmomentet matriselementen för X . Denna överensstämmelse gjorde det möjligt för Heisenberg att tillhandahålla regeln för övergångsintensiteterna, den del av tiden som, från ett initialt tillstånd i, en foton emitteras och atomen hoppar till ett slutligt tillstånd j ,

Detta gjorde det sedan möjligt att tolka storleken på matriselementen statistiskt: de ger intensiteten hos spektrallinjerna, sannolikheten för kvanthopp från emissionen av dipolstrålning .

Eftersom övergångshastigheterna ges av matriselementen för X , där Xij . är noll, bör motsvarande övergång vara frånvarande Dessa kallades urvalsreglerna , som var ett pussel fram till tillkomsten av matrismekaniken.

Ett godtyckligt tillstånd för väteatomen, som ignorerar spinn, är märkt med | n ; , m ⟩, där värdet på ℓ är ett mått på den totala omloppsrörelsemängden och m är dess z -komponent, som definierar omloppsorienteringen. Komponenterna i vinkelmomentpseudovektorn är

där produkterna i detta uttryck är oberoende av ordning och verklighet, eftersom olika komponenter i X och P pendlar.

Kommuteringsrelationerna för L med alla tre koordinatmatriserna X, Y, Z (eller med vilken vektor som helst) är lätta att hitta,

vilket bekräftar att operatorn L genererar rotationer mellan de tre komponenterna i vektorn av koordinatmatriser X .

Från detta kan kommutatorn för Lz avläsas och koordinatmatriserna X, Y, Z ,

Detta betyder att storheterna X + iY , X iY har en enkel kommuteringsregel,

Precis som matriselementen för X + iP och X − iP för den harmoniska oscillatorn Hamiltonian, innebär denna kommuteringslag att dessa operatorer endast har vissa off-diagonala matriselement i tillstånd av bestämda m ,

vilket betyder att matrisen ( X + iY ) tar en egenvektor av L z med egenvärde m till en egenvektor med egenvärde m + 1. På samma sätt minskar ( X iY ) m med en enhet, medan Z inte ändrar värdet på m .

Så, på grundval av | , m ⟩ anger där L 2 och L z har bestämda värden, matriselementen för någon av de tre komponenterna i positionen är noll, förutom när m är lika eller ändras med en enhet.

Detta sätter en begränsning på förändringen i det totala vinkelmomentet. Vilket tillstånd som helst kan roteras så att dess rörelsemängd är i z -riktningen så mycket som möjligt, där m = ℓ. Matriselementet för positionen som verkar på | , m ⟩ kan bara producera värden på m som är större med en enhet, så att om koordinaterna roteras så att sluttillståndet är | ℓ',ℓ' ⟩, värdet på ℓ' kan vara högst ett större än det största värdet på ℓ som uppstår i initialtillståndet. Så ℓ' är högst ℓ + 1.

Matriselementen försvinner för ℓ' > ℓ + 1, och det omvända matriselementet bestäms av Hermiticitet, så dessa försvinner även när ℓ' < ℓ - 1: Dipolövergångar är förbjudna med en förändring i rörelsemängd på mer än en enhet.

Summa regler

Heisenbergs rörelseekvation bestämmer matriselementen för P i Heisenbergbasen från matriselementen för X .

som gör den diagonala delen av kommuteringsrelationen till en summaregel för storleken på matriselementen:

Detta ger en relation för summan av de spektroskopiska intensiteterna till och från ett givet tillstånd, även om för att vara absolut korrekt, måste bidrag från strålningsfångningssannolikheten för obundna spridningstillstånd inkluderas i summan:

Se även

Vidare läsning

externa länkar