Vanligt eliminering av underuttryck

I kompilatorteorin är eliminering av vanliga underuttryck ( CSE ) en kompilatoroptimering som söker efter instanser av identiska uttryck (dvs alla värderas till samma värde), och analyserar om det är värt att ersätta dem med en enda variabel som håller det beräknade värdet .

Exempel

I följande kod:

a = b * c + g; d = b * c * e;

det kan vara värt att omvandla koden till:

tmp = b * c; a = tmp + g; d = tmp * e;

om kostnaden för att lagra och hämta tmp är mindre än kostnaden för att beräkna b * c en extra gång.

Princip

Möjligheten att utföra CSE baseras på tillgänglig uttrycksanalys (en dataflödesanalys) . Ett uttryck b*c är tillgängligt vid en punkt p i ett program om:

varje väg från den initiala noden till p utvärderar b*c innan den når p ,
och det finns inga uppgifter till b eller c efter utvärderingen utan före p .

Kostnads/nyttoanalysen som utförs av en optimerare kommer att beräkna om kostnaden för butiken till tmp är mindre än kostnaden för multiplikationen; i praktiken är andra faktorer som vilka värden som hålls i vilka register också signifikanta.

Kompilatorförfattare särskiljer två typer av CSE:

eliminering av lokalt gemensamt underuttryck fungerar inom ett enda grundläggande block
eliminering av globala gemensamma underuttryck fungerar på en hel procedur,

Båda typerna förlitar sig på dataflödesanalys av vilka uttryck som finns tillgängliga vid vilka punkter i ett program.

Fördelar

Fördelarna med att utföra CSE är tillräckligt stora för att det är en vanlig optimering.

I enkla fall som i exemplet ovan kan programmerare manuellt eliminera dubblettuttrycken medan de skriver koden. Den största källan till CSE:er är mellanliggande kodsekvenser som genereras av kompilatorn, till exempel för arrayindexeringsberäkningar , där det inte är möjligt för utvecklaren att manuellt ingripa. I vissa fall kan språkfunktioner skapa många dubbletter av uttryck. Till exempel C- makron , där makroexpansion kan resultera i vanliga underuttryck som inte syns i den ursprungliga källkoden.

Kompilatorer måste vara kloka om antalet tillfälliga som skapas för att hålla värden. Ett för stort antal temporära värden skapar registertryck , vilket möjligen resulterar i att register spills till minnet, vilket kan ta längre tid än att bara beräkna om ett aritmetiskt resultat när det behövs.

Se även

Steven S. Muchnick , Advanced Compiler Design and Implementation ( Morgan Kaufmann , 1997) s. 378–396
John Cocke . "Global Common Subexpression Elimination." Proceedings of a Symposium on Compiler Construction , ACM SIGPLAN Notices 5(7), juli 1970, sidorna 850-856.
Briggs, Preston, Cooper, Keith D. och Simpson, L. Taylor. " Värdenumrering ." Software-Practice and Experience , 27(6), juni 1997, sid 701-724.

Kompilatoroptimeringar
Grundblock	Titthålsoptimering
Slingoptimering	Automatisk parallellisering Induktionsvariabel Loopfusion Loop-invariant kodrörelse Loop inversion Slingbyte Optimering av loopbo Slingdelning Slingavrullning Slinga frånkopplas Programvarupipelining Styrka reduktion
Dataflödesanalys	Tillgängligt uttryck Vanligt eliminering av underuttryck Konstant vikning Eliminering av döda butiker Induktionsvariabel igenkänning och eliminering Live-variabel analys Använd-definierad kedja
SSA -baserad	Global värdenumrering Gles betingad konstant förökning
Kodgenerering	Instruktionsschemaläggning Instruktionsval Registrera tilldelning Återmaterialisering
Funktionell	Avskogning Tail-call eliminering
Global	Interprocedurell optimering
Övrig	Eliminering av gränskontroll Utförande av kompileringsfunktion Död kod eliminering Uttrycksmallar Inline expansion Hoppa trådning Profilstyrd optimering
Statisk analys	Alias analys Analys av matrisåtkomst Kontroll-flödesanalys Dataflödesanalys Beroendeanalys Escape analys Pekaranalys Formanalys