Power Processing Element
POWER- , PowerPC- och Power ISA- arkitekturerna |
---|
NXP (tidigare Freescale och Motorola) |
IBM |
|
IBM/Nintendo |
Övrig |
Relaterade länkar |
Avbruten i grått , historisk i kursiv stil |
Allmän information | |
---|---|
Lanserades | 2005 |
Avvecklad | Närvarande |
Marknadsförs av | IBM , Sony , Microsoft |
Designad av | IBM |
Vanliga tillverkare | |
Prestanda | |
Max. CPU klockfrekvens | 2,8 GHz till 3,2 GHz |
Cache | |
L1 cache | 32 KB instruktion + 32 KB data |
Arkitektur och klassificering | |
Ansökan | Spelkonsol , HPC |
Tekniknod | 90 nm till 45 nm |
Mikroarkitektur | PPU |
Instruktionsuppsättning | PowerPC 2.02 |
Fysiska specifikationer | |
Kärnor |
|
GPU(s) | Xenos , i XCGPU- varianten. |
Produkter, modeller, varianter | |
Variant(er) |
|
Historia | |
Efterträdare | IBM A2 |
Power Processing Element ( PPE ) består av en Power Processing Unit ( PPU ) och en 512 KB L2-cache. I de flesta fall används PPU:n i en PPE. PPU:n är en 64-bitars dubbeltrådad i ordning PowerPC 2.02 mikroprocessorkärna designad av IBM för användning främst i spelkonsolerna PlayStation 3 och Xbox 360 , men har även hittat tillämpningar inom högpresterande datorer i superdatorer som rekordsättningen IBM Roadrunner .
PPU:n används som en central CPU-kärna i tre olika processordesigner:
- Cell Broadband Engine (Cell BE) som används främst i Sonys PlayStation 3- spelkonsol . Den använder PPE och finns i tre versioner, en 90 nm, en 65 nm och en 45 nm del.
- PowerXCell 8i som är en version av Cell BE med förbättrat FPU och minnesundersystem. Den tillverkades endast som en enda 65 nm version.
- XCPU :n som används i en konfiguration med tre kärnor och en enhetlig 1 MB L2-cache inuti Microsofts Xbox 360 . Den kommer i tre versioner, versionerna 90 nm och 65 nm, och 45 nm XCGPU med en integrerad grafikprocessor från ATI .
Huvuddrag
- 64-bitars, dubbeltrådig kärna
- 3,2 GHz typisk klockfrekvens
- 32 KB L1-instruktionscache
- 32 KB L1-datacache
- 512 KB unified L2 cache, 8-vägs set associativ i PPE-varianten.
- Kompatibel med 64-bitars PowerPC ISA v.2.02 ( POWER4 och PowerPC 970 )
- AltiVec SIMD- funktionalitet
Utförandeenheter
- Branch Unit (BRU)
- Fixed Point Integer Unit (FXU)
- Ladda och lagra enhet (LSU)
- Flytpunktsenhet (FPU)
- Vector Media Extension Unit (VMX)
I ordning
PPU:n är en processor i ordning, men den har några unika egenskaper som gör att den kan uppnå vissa fördelar med utförande utan dyrbar ombeställning av hårdvara. När den når en L1-cachemiss - den kan köras förbi cachemissen och stoppar endast när en instruktion faktiskt är beroende av en belastning. Den kan skicka upp till 8 laddningsinstruktioner till L2-cachen i urdrift. Den har en instruktionsfördröjningspipa - en sidoväg som gör att den kan utföra instruktioner som normalt skulle orsaka pipelinestopp utan att hålla upp resten av pipelinen . Instruktionsfördröjningspipelinen används för Out-Of-Order Load/Store: cachemissar placeras där medan den går vidare.
PPE:s pipeline
PPE har en 23-stegs generell pipeline med ytterligare 11 steg möjliga för mikrokod och ytterligare 4 möjliga steg för grenprediktion.
Multithreading
PPU:n kör två hårdvarutrådar samtidigt. Huvudregistren för kodexekvering är duplicerade, liksom undantags- och avbrottshanteringsregistren, och flera viktiga arrayer och köer . De kan generera undantag samtidigt och utföra grenprediktion på sina individuella grenhistorik. Utförandemotorn och cacharna är dock inte duplicerade - så det är fortfarande bara en enkärnig design.
Flyttalskapacitet
Dess 64-bitars flyttalsenhet med dubbla precision och 128-bitars VMX-enhet (med AltiVec -instruktionsuppsättningen), kan utföra teoretiska 12 flyttalsoperationer per cykel, eftersom dess flyttalsenhet kan utföra flyttalsmultiplicering- lägger till, och kommer inte mindre än 64-bitars. Det ger 3,2 miljarder klockcykler × 12 = 38,4 miljarder flyttalsoperationer/sekund.
PPU:n är förbättrad i PowerXCell 8i- processorn för att kunna göra enkelcykels dubbla precisionsflyttalsoperationer, skräddarsydda för högpresterande beräkningar i superdatorer.
VMX-enheten i XCPU :n i Xbox 360 är utökad med 128 register och är inte helt kompatibel med vanliga AltiVec.