Bytekod

Bytecode (även kallad portabel kod eller p-kod ^{[ citat behövs ]} ) är en form av instruktionsuppsättning designad för effektiv exekvering av en mjukvarutolk . Till skillnad från mänskligt läsbar källkod är bytekoder kompakta numeriska koder, konstanter och referenser (normalt numeriska adresser) som kodar resultatet av kompilatorn som analyserar och utför semantisk analys av saker som typ, omfattning och kapslingsdjup för programobjekt.

Namnet bytecode härrör från instruktionsuppsättningar som har en- byte opkoder följt av valfria parametrar. Mellanrepresentationer som bytekod kan matas ut av programmeringsspråksimplementeringar för att underlätta tolkningen , eller så kan den användas för att minska beroendet av hårdvara och operativsystem genom att tillåta samma kod att köra plattformsoberoende på olika enheter. Bytekod kan ofta antingen exekveras direkt på en virtuell maskin (en p-kodmaskin , dvs tolk), eller så kan den kompileras ytterligare till maskinkod för bättre prestanda.

Eftersom bytekodinstruktioner bearbetas av mjukvara kan de vara godtyckligt komplexa, men är ändå ofta besläktade med traditionella hårdvaruinstruktioner: virtuella stackmaskiner är de vanligaste, men virtuella registermaskiner har också byggts. Olika delar kan ofta lagras i separata filer, liknande objektmoduler , men laddas dynamiskt under körning.

Avrättning

Ett bytekodprogram kan exekveras genom att tolka och direkt exekvera instruktionerna, en i taget. Den här typen av bytekodtolkare är mycket portabel. Vissa system, kallade dynamiska översättare, eller just-in-time (JIT) kompilatorer, översätter bytekod till maskinkod vid behov under körning . Detta gör den virtuella maskinen hårdvaruspecifik men förlorar inte bytekodens portabilitet. Till exempel Java- och Smalltalk -kod vanligtvis i bytekodformat, som vanligtvis sedan JIT kompileras för att översätta bytekoden till maskinkod innan exekvering. Detta introducerar en fördröjning innan ett program körs, när bytekoden kompileras till inbyggd maskinkod, men förbättrar exekveringshastigheten avsevärt jämfört med att tolka källkoden direkt, normalt med omkring en storleksordning (10x).

På grund av dess prestandafördelar kör många språkimplementationer idag ett program i två faser, först kompilerar källkoden till bytekod och skickar sedan bytekoden till den virtuella maskinen. Det finns bytekodbaserade virtuella maskiner av det här slaget för Java , Raku , Python , PHP , Tcl , mawk och Forth (men Forth kompileras sällan via bytekoder på detta sätt, och dess virtuella maskin är istället mer generisk). Implementeringen av Perl och Ruby 1.8 fungerar istället genom att gå en abstrakt syntaxträdrepresentation härledd från källkoden.

På senare tid har författarna till V8 och Dart ifrågasatt uppfattningen att mellanbytekod behövs för snabb och effektiv VM-implementering. Båda dessa språkimplementeringar gör för närvarande direkt JIT-kompilering från källkod till maskinkod utan någon bytekodförmedlare.

Exempel

ActionScript körs i ActionScript Virtual Machine (AVM), som är en del av Flash Player och AIR . ActionScript-kod omvandlas vanligtvis till bytekodformat av en kompilator . Exempel på kompilatorer inkluderar en inbyggd i Adobe Flash Professional och en inbyggd i Adobe Flash Builder och tillgänglig i Adobe Flex SDK .
Adobe Flash- objekt
BANCStar , ursprungligen bytekod för ett gränssnittsbyggande verktyg men används också som språk
Berkeley paketfilter
Berkeley Pascal
Byte Code Engineering Library
C till Java virtuell maskin kompilatorer
CLISP- implementering av Common Lisp brukade kompilera endast till bytekod under många år; men nu stöder den också kompilering till inbyggd kod med hjälp av GNU lightning
CMUCL och Scieneer Common Lisp-implementeringar av Common Lisp kan kompilera antingen till inbyggd kod eller till bytekod, vilket är mycket mer kompakt
Common Intermediate Language körs av Common Language Runtime , som används av .NET- språk som C#
Dalvik bytecode, designad för Android -plattformen, exekveras av Dalviks virtuella maskin
Dis bytecode, designad för Inferno (operativsystem) , exekveras av den virtuella Dis-maskinen
EiffelStudio för programmeringsspråket Eiffel
EM, Amsterdam Compiler Kit virtuell maskin som används som ett mellankompileringsspråk och som ett modernt bytekodspråk
Emacs är en textredigerare med de flesta av dess funktioner implementerade av Emacs Lisp , dess inbyggda dialekt av Lisp . Dessa funktioner kompileras till bytekod. Denna arkitektur tillåter användare att anpassa editorn med ett språk på hög nivå, som efter kompilering till bytekod ger rimlig prestanda.
Inbäddningsbar Common Lisp- implementering av Common Lisp kan kompileras till bytekod eller C-kod
Common Lisp tillhandahåller en demonteringsfunktion som skriver ut den underliggande koden för en specificerad funktion till standardutdata. Resultatet är implementeringsberoende och kan eller kanske inte lösas till bytekod. Dess inspektion kan användas för felsöknings- och optimeringsändamål. Steel Bank Common Lisp , till exempel, producerar:

    










 (  demontera  '  (  lambda  (  x  )  (  print  x  )))  ; demontering för (LAMBDA (X))   ; 2436F6DF: 850500000F22 TEST EAX, [#x220F0000] ;  no-arg-parsing ingångspunkt   ; E5: 8BD6 MOV EDX, ESI   ; E7: 8B05A8F63624 MOV EAX, [#x2436F6A8] ;  #<FDEFINITION-objekt för PRINT>   ; ED: B904000000 MOV ECX, 4   ; F2: FF7504 PUSH DWORD PTR [EBP+4]   ; F5: FF6005 JMP DWORD PTR [EAX+5]   ; F8: CC0A BREAK 10 ;  felfälla   ; FA: 02 BYTE #X02   ; FB: 18 BYTE #X18 ;  INVALID-ARG-COUNT-ERROR   ; FC: 4F BYTE #X4F ;  ECX

Ericssons implementering av Erlang använder BEAM-bytekoder
Ethereums virtuella maskin (EVM) är runtime-miljön, som använder sin egen bytekod, för transaktionsexekvering i Ethereum (smarta kontrakt).
Icon och Unicon programmeringsspråk
Infocom använde Z-maskinen för att göra sina mjukvaruapplikationer mer portabla
Java bytecode , som exekveras av den virtuella Java-maskinen
- ASM
- BCEL
- Javassist
Keiko-bytekod som används av programmeringsspråket Oberon-2 för att göra det och operativsystemet Oberon mer bärbara.
KEYB , MS -DOS / PC DOS- tangentbordsdrivrutinen med dess resursfil KEYBOARD.SYS som innehåller layoutinformation och korta p-kodsekvenser som exekveras av en tolk i den inbyggda drivrutinen.
LLVM IR
LSL, ett skriptspråk som används i virtuella världar kompileras till bytekod som körs på en virtuell maskin. Second Life har den ursprungliga Mono-versionen, Inworldz utvecklade Phlox-versionen.
Lua -språket använder en registerbaserad virtuell bytekodmaskin
m-koden för MATLAB -språket
Malbolge är ett esoteriskt maskinspråk för en ternär virtuell maskin.
Microsoft P-kod som används i Visual C++ och Visual Basic
Multiplan
O-kod för BCPL- programmeringsspråket
Ocaml -språket kompileras valfritt till en kompakt bytekodform
p-kod för UCSD Pascal implementering av Pascal- språket
Papegoja virtuell maskin
Välj BASIC även kallat Data BASIC eller MultiValue BASIC
R -miljön för statistisk beräkning erbjuder en bytecode-kompilator genom kompilatorpaketet, nu standard med R version 2.13.0. Det är möjligt att kompilera den här versionen av R så att baspaketen och rekommenderade paket utnyttjar detta.
Pyramid 2000 äventyrsspel
Python- skript kompileras vid körning till Pythons bytekodspråk, och de kompilerade filerna (.pyc) cachelagras inuti skriptets mapp

Kompilerad kod kan analyseras och undersökas med hjälp av ett inbyggt verktyg för att felsöka bytekoden på låg nivå. Verktyget kan initieras från skalet, till exempel:

  




 >>>  importera  dis  # "dis" - Demonterare av Python-byte-kod till mnemonics.  >>>  dis  .  dis  (  'print("Hello, World!")'  )  1 0 LOAD_NAME 0 (print)  2 LOAD_CONST 0 ('Hej världen!')  4 CALL_FUNCTION 1  6 RETURN_VALUE

Schema 48 -implementering av schema med hjälp av bytekodtolkare
Bytekoder för många implementeringar av Smalltalk -språket
Spin -tolken inbyggd i Parallax Propeller- mikrokontrollern
SQLite - databasmotorn översätter SQL-satser till ett skräddarsytt byte-kodformat.
Äppel SÖT16
Tcl
TIMI används av kompilatorer på IBM i -plattformen.
Liten BASIC
Visual FoxPro kompilerar till bytecode
WebAssembly
YARV och Rubinius för Ruby
ZCODE

Se även

Anteckningar