Power Processing Element

Power Processing Element
Allmän information
Lanserades 2005
Avvecklad Närvarande
Marknadsförs av IBM , Sony , Microsoft
Designad av IBM
Vanliga tillverkare
Prestanda
Max. CPU klockfrekvens 2,8 GHz till 3,2 GHz
Cache
L1 cache 32 KB instruktion + 32 KB data
Arkitektur och klassificering
Ansökan Spelkonsol , HPC
Tekniknod 90 nm till 45 nm
Mikroarkitektur PPU
Instruktionsuppsättning PowerPC 2.02
Fysiska specifikationer
Kärnor
  • 1
GPU(s) Xenos , i XCGPU- varianten.
Produkter, modeller, varianter
Variant(er)
Historia
Efterträdare IBM A2

Power Processing Element ( PPE ) består av en Power Processing Unit ( PPU ) och en 512 KB L2-cache. I de flesta fall används PPU:n i en PPE. PPU:n är en 64-bitars dubbeltrådad i ordning PowerPC 2.02 mikroprocessorkärna designad av IBM för användning främst i spelkonsolerna PlayStation 3 och Xbox 360 , men har även hittat tillämpningar inom högpresterande datorer i superdatorer som rekordsättningen IBM Roadrunner .

PPU:n används som en central CPU-kärna i tre olika processordesigner:

  • Cell Broadband Engine (Cell BE) som används främst i Sonys PlayStation 3- spelkonsol . Den använder PPE och finns i tre versioner, en 90 nm, en 65 nm och en 45 nm del.
  • PowerXCell 8i som är en version av Cell BE med förbättrat FPU och minnesundersystem. Den tillverkades endast som en enda 65 nm version.
  • XCPU :n som används i en konfiguration med tre kärnor och en enhetlig 1 MB L2-cache inuti Microsofts Xbox 360 . Den kommer i tre versioner, versionerna 90 nm och 65 nm, och 45 nm XCGPU med en integrerad grafikprocessor från ATI .

Huvuddrag

Utförandeenheter

I ordning

PPU:n är en processor i ordning, men den har några unika egenskaper som gör att den kan uppnå vissa fördelar med utförande utan dyrbar ombeställning av hårdvara. När den når en L1-cachemiss - den kan köras förbi cachemissen och stoppar endast när en instruktion faktiskt är beroende av en belastning. Den kan skicka upp till 8 laddningsinstruktioner till L2-cachen i urdrift. Den har en instruktionsfördröjningspipa - en sidoväg som gör att den kan utföra instruktioner som normalt skulle orsaka pipelinestopp utan att hålla upp resten av pipelinen . Instruktionsfördröjningspipelinen används för Out-Of-Order Load/Store: cachemissar placeras där medan den går vidare.

PPE:s pipeline

PPE har en 23-stegs generell pipeline med ytterligare 11 steg möjliga för mikrokod och ytterligare 4 möjliga steg för grenprediktion.

Multithreading

PPU:n kör två hårdvarutrådar samtidigt. Huvudregistren för kodexekvering är duplicerade, liksom undantags- och avbrottshanteringsregistren, och flera viktiga arrayer och köer . De kan generera undantag samtidigt och utföra grenprediktion på sina individuella grenhistorik. Utförandemotorn och cacharna är dock inte duplicerade - så det är fortfarande bara en enkärnig design.

Flyttalskapacitet

Dess 64-bitars flyttalsenhet med dubbla precision och 128-bitars VMX-enhet (med AltiVec -instruktionsuppsättningen), kan utföra teoretiska 12 flyttalsoperationer per cykel, eftersom dess flyttalsenhet kan utföra flyttalsmultiplicering- lägger till, och kommer inte mindre än 64-bitars. Det ger 3,2 miljarder klockcykler × 12 = 38,4 miljarder flyttalsoperationer/sekund.

PPU:n är förbättrad i PowerXCell 8i- processorn för att kunna göra enkelcykels dubbla precisionsflyttalsoperationer, skräddarsydda för högpresterande beräkningar i superdatorer.

VMX-enheten i XCPU :n i Xbox 360 är utökad med 128 register och är inte helt kompatibel med vanliga AltiVec.