Smith normal form
Inom matematik är Smiths normalform (ibland förkortad SNF ) en normalform som kan definieras för vilken matris som helst (inte nödvändigtvis kvadratisk) med poster i en principiell idealdomän (PID). Smith normala formen av en matris är diagonal och kan erhållas från den ursprungliga matrisen genom att multiplicera till vänster och höger med inverterbara kvadratiska matriser. I synnerhet är heltalen ett PID, så man kan alltid beräkna Smiths normala form av en heltalsmatris. Smith normalform är mycket användbar för att arbeta med ändligt genererade moduler över en PID, och i synnerhet för att härleda strukturen för en kvot av en fri modul . Den är uppkallad efter den irländska matematikern Henry John Stephen Smith .
Definition
Låt A vara en icke-noll m × n matris över en principiell idealdomän R . Det finns inverterbara och -matriser S, T (med koefficienter i R ) så att produkten SAT är
och de diagonala elementen uppfyller för alla . Detta är Smiths normala form av matrisen A . Elementen är unika upp till multiplikation med en enhet och kallas elementära divisorer , invarianter eller invarianta faktorer . De kan beräknas (upp till multiplikation med en enhet) som
där (kallad i -th determinant divisor ) är lika med den största gemensamma divisorn av determinanterna av alla moll i matrisen A och .
Algoritm
Det första målet är att hitta inverterbara kvadratiska matriser och så att produkten är diagonal. Detta är den svåraste delen av algoritmen. När diagonalitet väl har uppnåtts blir det relativt lätt att sätta matrisen i Smith normal form. Mer abstrakt formulerat är målet att visa att om man tänker på som en karta från (den fria - modul av rang ) till (den fria - modulen av rang ), det finns isomorfismer och så att har den enkla formen av en diagonal matris . Matriserna och kan hittas genom att börja med identitetsmatriser av lämplig storlek och ändra varje gång en radoperation utförs på i algoritmen av motsvarande kolumnoperation (till exempel om rad läggs till rad i ska kolumn från kolumn av för att behålla produktens invariant), och på liknande sätt modifiera för varje kolumnoperation som utförs. Eftersom radoperationer är vänstermultiplikationer och kolumnoperationer är högermultiplikationer, bevarar detta invarianten där betecknar aktuella värden och betecknar den ursprungliga matrisen; så småningom blir matriserna i denna invariant diagonala. Endast inverterbara rad- och kolumnoperationer utförs, vilket säkerställer att och förblir inverterbara matriser.
För , skriv för antalet primtalsfaktorer för (dessa finns och är unika eftersom alla PID också är en unik faktoriseringsdomän ). Speciellt också en Bézout-domän , så det är en gcd-domän och gcd för alla två element uppfyller en Bézouts identitet .
För att sätta en matris i Smiths normalform kan man upprepade gånger tillämpa följande, där går från 1 till .
Steg I: Välja en pivot
Välj för att vara det minsta kolumnindexet för med en post som inte är noll, starta sökningen på kolumnindex om .
Vi vill ha ; om så är fallet är detta steg komplett, annars finns det enligt antagandet några med , och vi kan byta raderna och , och erhåller därmed .
Vår valda pivot är nu i position .
Steg II: Förbättra pivoten
Om det finns en post vid position ( k , j t ) så att , sedan låter , vi vet genom Bézout-egenskapen att det finns σ, τ i R så att
Genom vänstermultiplikation med en lämplig inverterbar matris L kan det uppnås att raden t i matrisprodukten är summan av σ gånger den ursprungliga raden t och τ gånger den ursprungliga raden k , den raden k i produkten är en annan linjär kombination av dessa ursprungliga rader och att alla andra rader är oförändrade. Explicit, om σ och τ uppfyller ovanstående ekvation, då för och (vilka divisioner är möjliga enligt definitionen av β) har man
så att matrisen
är inverterbar, med invers
Nu kan L erhållas genom att anpassa i rader och kolumner t och k i identitetsmatrisen. Genom konstruktion har matrisen som erhålls efter vänstermultiplicering med L ingången β vid position ( t , j t ) (och på grund av vårt val av α och γ har den också en ingång 0 vid position ( k , j t ), vilket är användbart men inte nödvändigt för algoritmen). Denna nya post β delar posten som fanns där tidigare, och så i synnerhet ; därför måste upprepandet av dessa steg så småningom avslutas. Man slutar med en matris som har en post vid position ( t , j t ) som delar upp alla poster i kolumn j t .
Steg III: Eliminera poster
genom att lägga till lämpliga multiplar av rad t , kan det uppnås att alla poster i kolumn jt förutom den vid position ( t , jt ) är noll. Detta kan uppnås genom vänstermultiplikation med en lämplig matris. göra matrisen helt diagonal måste vi också eliminera poster som inte är noll på positionsraden ( t , jt ). Detta kan uppnås genom att upprepa stegen i steg II för kolumner istället för rader och använda multiplikation till höger genom att transponera den erhållna matrisen L . I allmänhet kommer detta att resultera i att nollposterna från den tidigare tillämpningen av steg III blir olik noll igen.
Observera dock att varje tillämpning av steg II för antingen rader eller kolumner måste fortsätta att minska värdet på och så processen måste så småningom stoppa efter ett antal iterationer, vilket leder till en matris där posten vid position ( t , jt ) är den enda posten som inte är noll i både dess rad och kolumn.
behöver bara blocket av A längst ned till höger om ( t , j t ) diagonaliseras, och konceptuellt kan algoritmen tillämpas rekursivt och behandla detta block som en separat matris. Med andra ord kan vi öka t med ett och gå tillbaka till steg I.
Sista steget
Genom att tillämpa stegen som beskrivs ovan på de återstående kolumnerna som inte är noll i den resulterande matrisen (om någon), får vi en -matris med kolumnindex där . Matrisposterna är icke-noll, och varannan post är noll.
Nu kan vi flytta nollkolumnerna i denna matris till höger, så att posterna som inte är noll är på positioner för . Kort sagt, ställ in för elementet i position ( .
Villkoret för delbarhet för diagonala poster kanske inte är uppfyllt. För alla index för vilka kan man reparera denna brist genom operationer endast på rader och kolumner och : lägg först till kolumn till kolumn för att få en post i kolumn i utan att störa inmatningen vid position , och använd sedan en radoperation för att göra inmatningen vid position lika med som i steg II; fortsätt slutligen som i steg III för att göra matrisen diagonal igen. Eftersom den nya posten vid position är en linjär kombination av den ursprungliga , den är delbar med β.
Värdet ändras inte av ovanstående operation (det är δ för determinanten för den övre submatrisen), varav den operationen minskar (genom att flytta primtalsfaktorer åt höger) värdet på
Så efter ändligt många tillämpningar av denna operation är ingen ytterligare tillämpning möjlig, vilket betyder att vi har erhållit efter önskemål.
Eftersom alla rad- och kolumnmanipulationer som är involverade i processen är inverterbara, visar detta att det finns inverterbara och -matriser S, T så att produkt SAT uppfyller definitionen av en Smith normal form. Detta visar i synnerhet att Smiths normalform existerar, vilket antogs utan bevis i definitionen.
Ansökningar
Smiths normala form är användbar för att beräkna homologin för ett kedjekomplex när kedjemodulerna i kedjekomplexet genereras ändligt . Till exempel, i topologi , kan den användas för att beräkna homologin för ett ändligt förenklat komplex eller CW-komplex över heltal, eftersom gränskartorna i ett sådant komplex bara är heltalsmatriser. Den kan också användas för att bestämma de invarianta faktorerna som förekommer i struktursatsen för ändligt genererade moduler över en principiell idealdomän, som inkluderar grundsatsen för ändligt genererade abelska grupper .
Smiths normalform används också i styrteori för att beräkna överförings- och blockeringsnollor i en överföringsfunktionsmatris .
Exempel
Som ett exempel hittar vi Smith-normalformen av följande matris över heltalen.
Följande matriser är de mellanliggande stegen när algoritmen tillämpas på matrisen ovan.
Så är Smiths normala form
och de invarianta faktorerna är 2, 2 och 156.
Likhet
Smith normalform kan användas för att avgöra om matriser med poster över ett gemensamt fält är lika eller inte . Specifikt två matriser A och B är lika om och endast om de karakteristiska matriserna och har samma Smith-normalform.
Till exempel med
A och B är lika eftersom Smiths normala form av deras karakteristiska matriser matchar, men liknar inte C eftersom Smiths normala form av de karakteristiska matriserna inte matchar.
Se även
- Kanonisk form
- Diofantisk ekvation
- Elementära divisorer
- Frobenius normalform (även kallad Rational canonical form)
- Hermit normal form
- Invariant faktor
- Struktursats för ändligt genererade moduler över en principiell idealdomän
- Singulärvärdesfaktorisering
Anteckningar
- Smith, Henry J. Stephen (1861). "På system av linjära obestämda ekvationer och kongruenser". Phil. Trans. R. Soc. Lond. 151 (1): 293–326. doi : 10.1098/rstl.1861.0016 . JSTOR 108738 . S2CID 110730515 . Omtryckt (s. 367–409 ) i The Collected Mathematical Papers of Henry John Stephen Smith, Vol. I , redigerad av JWL Glaisher . Oxford: Clarendon Press (1894), xcv +603 s.
- Smith normal form på PlanetMath .
- Exempel på Smith normal form på PlanetMath .
- KR Matthews, Smith normal form . MP274: Linjär algebra, föreläsningsanteckningar, University of Queensland, 1991.