Grävmaskin (mikroarkitektur)

Grävmaskin – Familj 15h (4:e generationen)
Allmän information
Lanserades 2 juni 2015 ; 7 år sedan ( 2 juni 2015 )
Vanliga tillverkare
Arkitektur och klassificering
Tekniknod 28 nm bulkkisel (GF28A)
Instruktionsuppsättning AMD64 ( x86-64 )
Fysiska specifikationer
Uttag
Produkter, modeller, varianter
Kärnnamn
  • Carrizo
  • Bristol Ridge
  • Stoney Ridge
Historia
Företrädare Steamroller – Family 15h (3:e generationen)
Efterträdare Zen
Supportstatus
iGPU stöds inte

AMD Excavator Family 15h är en mikroarkitektur utvecklad av AMD för att efterträda Steamroller Family 15h för användning i AMD APU- processorer och vanliga processorer. Den 12 oktober 2011 avslöjade AMD att Excavator är kodnamnet för fjärde generationens Bulldozer- härledda kärna.

Den grävmaskinsbaserade APU:n för vanliga applikationer heter Carrizo och släpptes 2015. Carrizo APU är designad för att vara HSA 1.0- kompatibel. En grävmaskinsbaserad APU- och CPU-variant vid namn Toronto för server- och företagsmarknader producerades också.

Excavator var den sista revideringen av "Bulldozer" -familjen, med två nya mikroarkitekturer som ersatte Excavator ett år senare. Excavator efterträddes av x86-64 Zen -arkitekturen i början av 2017.

Arkitektur

Grävmaskin lade till hårdvarustöd för nya instruktioner som AVX2 , BMI2 och RDRAND . Grävmaskinen är designad med hjälp av högdensitetsbibliotek (alias "tunna") som normalt används för GPU:er för att minska elektrisk energiförbrukning och formstorlek, vilket ger en 30-procentig ökning av effektiv energianvändning . Grävmaskin kan bearbeta upp till 15 % fler instruktioner per klocka jämfört med AMDs tidigare kärna Steamroller.

Funktioner och ASIC

Följande tabell visar funktioner hos AMD :s processorer med 3D-grafik, inklusive APU:er (se även: Lista över AMD-processorer med 3D-grafik ).

Plattform Hög, standard och låg effekt Låg och ultralåg effekt
Kodnamn Server Grundläggande Toronto
Micro Kyoto
Skrivbord Prestanda Raphael
Vanliga Llano Treenighet Richland Kaveri Kaveri Refresh (Godavari) Carrizo Bristol Ridge Raven Ridge Picasso Renoir Cezanne
Inträde
Grundläggande Kabini Dalí
Mobil Prestanda Renoir Cezanne Rembrandt Dragon Range
Vanliga Llano Treenighet Richland Kaveri Carrizo Bristol Ridge Raven Ridge Picasso
Renoir Lucienne

Cezanne Barceló
Fågel Fenix
Inträde Dalí Mendocino
Grundläggande Desna, Ontario, Zacate Kabini, Temash Beema, Mullins Carrizo-L Stoney Ridge Pollock
Inbäddad Treenighet Vithövdad havsörn
Merlin Falcon , Brown Falcon
Stor hornuggla Grå hök Ontario, Zacate Kabini
Stäppörn , Crowned Eagle , LX-Familjen
Prairie Falcon Bandad tornfalk River Hawk
Släppte augusti 2011 oktober 2012 juni 2013 jan 2014 2015 juni 2015 juni 2016 oktober 2017 jan 2019 mars 2020 jan 2021 jan 2022 september 2022 jan 2023 jan 2011 Maj 2013 apr 2014 maj 2015 februari 2016 april 2019 juli 2020 juni 2022 nov 2022
CPU mikroarkitektur K10 Piledriver Ångvält Grävmaskin " Grävmaskin+ " Zen Zen+ Zen 2 Zen 3 Zen 3+ Zen 4 Bobcat Jaguar Puma Puma+ " Grävmaskin+ " Zen Zen+ " Zen 2+ "
ÄR EN x86-64 v1 x86-64 v2 x86-64 v3 x86-64 v4 x86-64 v1 x86-64 v2 x86-64 v3
Uttag Skrivbord Prestanda AM5
Vanliga AM4
Inträde FM1 FM2 FM2+ FM2+ , AM4 AM4
Grundläggande AM1 FP5
Övrig FS1 FS1+ , FP2 FP3 FP4 FP5 FP6 FP7 ? ? FT1 FT3 FT3b FP4 FP5 FT5 FP5 FT6
PCI Express- version 2.0 3.0 4.0 5.0 4.0 2.0 3.0
CXL
Fab. ( nm )
GF 32SHP ( HKMG SOI )

GF 28SHP (HKMG bulk)

GF 14LPP ( FinFET bulk)

GF 12LP (FinFET bulk)

TSMC N7 (FinFET bulk)

TSMC N6 (FinFET bulk)


CCD: TSMC N5 (FinFET bulk)

cIOD: TSMC N6 (FinFET bulk)

TSMC 4nm (FinFET bulk)

TSMC N40 (bulk)

TSMC N28 (HKMG bulk)

GF 28SHP (HKMG bulk)

GF 14LPP ( FinFET bulk)

GF 12LP (FinFET bulk)

TSMC N6 (FinFET bulk)
Formarea (mm 2 ) 228 246 245 245 250 210 156 180 210
CCD: (2x) 70 cIOD: 122
178 75 (+ 28 FCH ) 107 ? 125 149 ~100
Min TDP (W) 35 17 12 10 15 105 35 4.5 4 3,95 10 6 12 8
Max APU TDP (W) 100 95 65 45 170 54 18 25 6 54 15
Max lager APU basklocka (GHz) 3 3.8 4.1 4.1 3.7 3.8 3.6 3.7 3.8 4.0 3.3 4.7 4.3 1,75 2.2 2 2.2 3.2 2.6 1.2 3,35 2.8
Max APU per nod 1 1
Max kärndör per CPU 1 2 1 1
Max CCX per kärnform 1 2 1 1
Max kärnor per CCX 4 8 2 4 2 4
Max CPU -kärnor per APU 4 8 16 8 2 4 2 4
Max trådar per CPU-kärna 1 2 1 2
Heltals pipelinestruktur 3+3 2+2 4+2 4+2+1 1+3+3+1+2 1+1+1+1 2+2 4+2 4+2+1
i386, i486, i586, CMOV, NOPL, i686, PAE , NX bit , CMPXCHG16B, AMD-V , RVI , ABM och 64-bitars LAHF/SAHF Yes Yes
IOMMU v2 v1 v2
BMI1 , AES-NI , CLMUL och F16C Yes Yes
MOVBE Yes
AVIC , BMI2 , RDRAND och MWAITX/MONITORX Yes
SME , TSME , ADX , SHA , RDSEED , SMAP , SMEP , XSAVEC, XSAVES, XRSTORS, CLFLUSHOPT, CLZERO och PTE Coalescing Yes Yes
GMET , WBNOINVD, CLWB, QOS, PQE-BW, RDPID, RDPRU och MCOMMIT Yes Yes
MPK , VAES Yes
SGX
FPU per kärna 1 0,5 1 1 0,5 1
Rör per FPU 2 2
FPU rörbredd 128-bitars 256-bitars 80-bitars 128-bitars 256-bitars
CPU- instruktionsuppsättning SIMD- nivå SSE4a AVX AVX2 AVX-512 SSSE3 AVX AVX2
3DNu! 3DNow!+
PREFETCH/PREFETCHW Yes Yes
GFNI Yes
AMX
FMA4 , LWP, TBM och XOP Yes Yes
FMA3 Yes Yes
AMD XDNA Yes
L1- datacache per kärna (KiB) 64 16 32 32
L1 datacacheassociativitet (sätt ) 2 4 8 8
L1-instruktionscacher per kärna 1 0,5 1 1 0,5 1
Max APU totalt L1-instruktionscache (KiB) 256 128 192 256 512 256 64 128 96 128
L1-instruktionscacheassociativitet (sätt ) 2 3 4 8 2 3 4 8
L2 cacher per kärna 1 0,5 1 1 0,5 1
Max APU totalt L2-cache (MiB) 4 2 4 16 1 2 1 2
L2-cacheassociativitet ( sätt) 16 8 16 8
Max on--die L3 cache per CCX (MiB) 4 16 32 4
Max 3D V-cache per CCD (MiB) 64
Max total cache i-CCD L3 per APU (MiB) 4 8 16 64 4
Max. totalt 3D V-cache per APU (MiB) 64
Max. kort L3-cache per APU (MiB)
Max totalt L3-cache per APU (MiB) 4 8 16 128 4
APU L3-cacheassociativitet ( sätt) 16 16
L3 cache-schema Offer Offer
Max. L4 cache
Max lager DRAM- stöd DDR3 -1866 DDR3-2133 DDR3-2133, DDR4 -2400 DDR4-2400 DDR4-2933 DDR4-3200, LPDDR4 -4266 DDR5 -4800, LPDDR5 -6400 DDR5 -5200 DDR5 -5600, LPDDR5x -7500 DDR3L -1333 DDR3L-1600 DDR3L-1866 DDR3-1866, DDR4 -2400 DDR4-2400 DDR4-1600 DDR4-3200 LPDDR5-5500
Max DRAM- kanaler per APU 2 1 2 1 2
Max lager DRAM- bandbredd (GB/s) per APU 29,866 34,132 38.400 46,932 68,256 102.400 83.200 120 000 10,666 12.800 14,933 19.200 38.400 12.800 51.200 88 000
GPU mikroarkitektur TeraScale 2 (VLIW5) TeraScale 3 (VLIW4) GCN 2:a gen GCN 3:e gen GCN 5:e gen RDNA 2:a gen RDNA 3:e gen TeraScale 2 (VLIW5) GCN 2:a gen GCN 3:e gen GCN 5:e gen RDNA 2:a gen
GPU- instruktionsuppsättning TeraScale instruktionsuppsättning GCN-instruktionsuppsättning RDNA-instruktionsuppsättning TeraScale instruktionsuppsättning GCN-instruktionsuppsättning RDNA-instruktionsuppsättning
Max lager GPU basklocka (MHz) 600 800 844 866 1108 1250 1400 2100 2400 400 538 600 ? 847 900 1200 600 1300 1900
Max lager GPU bas GFLOPS 480 614,4 648,1 886,7 1134,5 1760 1971.2 2150,4 3686,4 102,4 86 ? ? ? 345,6 460,8 230,4 1331,2 486,4
3D-motor Upp till 400:20:8 Upp till 384:24:6 Upp till 512:32:8 Upp till 704:44:16 Upp till 512:32:8 768:48:8 128:?:? 80:8:4 128:8:4 Upp till 192:12:8 Upp till 192:12:4 192:12:4 Upp till 512:?:? 128:?:?
IOMMUv1 IOMMUv2 IOMMUv1 ? IOMMUv2
Videoavkodare UVD 3.0 UVD 4.2 UVD 6.0 VCN 1.0 VCN 2.1 VCN 2.2 VCN 3.1 ? UVD 3.0 UVD 4.0 UVD 4.2 UVD 6.0 UVD 6.3 VCN 1.0 VCN 3.1
Videokodare VCE 1.0 VCE 2.0 VCE 3.1 VCE 2.0 VCE 3.1
AMD Fluid Motion No Yes No No Yes No
GPU energibesparing Maktspel PowerTune Maktspel PowerTune
TrueAudio Yes ? Yes
FreeSync
1 2

1 2
HDCP ? 1.4 2.2 2.3 ? 1.4 2.2 2.3
Spelklar 3.0 inte än 3.0 inte än
Skärmar som stöds 2–3 2–4 3
3 (dator) 4 (mobil, inbäddad)
4 2 3 4 4
/drm/radeon Yes Yes
/drm/amdgpu Yes Yes

Processorer

APU linjer

Det finns tre APU- linjer tillkännagivna eller släppta:

  1. Budget- och vanliga marknader (dator och mobil): Carrizo APU
    • Carrizos mobila APU:er lanserades 2015 baserade på Excavator x86-kärnor och med heterogen systemarkitektur för integrerad uppgiftsdelning mellan CPU:er och GPU:er , vilket gör att en GPU kan utföra beräkningsfunktioner, vilket påstås ge större prestandaökningar än att enbart krympa funktionsstorleken.
    • Carrizo stationära APU:er lanserades 2018. Den vanliga produkten (A8-7680) har 4 grävmaskinskärnor och en GPU baserad på GCN1.2-arkitektur. Dessutom lanseras en APU på ingångsnivå (A6-7480) med 2 grävmaskinskärnor.
  2. Budget- och vanliga marknader (dator och mobil): Bristol Ridge och Stoney Ridge (för bärbara datorer på ingångsnivå), APU:er
    • Bristol Ridge APU:er använder socket AM4 och DDR4 RAM
    • Bristol Ridge APU:er har upp till 4 grävmaskins CPU-kärnor och upp till 8 3:e generationens GCN GPU-kärnor
    • Upp till 20 % högre CPU-prestanda jämfört med Carrizo
    • TDP på ​​15W till 65W, 15–35W för mobil
  3. Företags- och servermarknader: Toronto APU
    • Toronto APU för server- och företagsmarknader innehöll fyra x86 Excavator CPU - kärnmoduler och Volcanic Islands integrerade GPU-kärna.
    • Grävmaskinens kärnor har en större fördel med IPC än Steamroller . Förbättringen är 4–15 %.
    • Stöd för HSA / hUMA , DDR3 / DDR4 , PCIe 3.0 , GCN 1.2
    • Toronto APU fanns i BGA- och SoC -varianter . SoC-varianten hade sydbryggan på samma dyna som APU:n för att spara utrymme och ström och för att optimera arbetsbelastningen.
    • Ett komplett system med en Toronto APU skulle ha en maximal effektförbrukning på 70 W.

CPU Desktop-linjer

Det finns inga processorer Steamroller (3:e gen Bulldozer ) eller Excavator (4:e gen Bulldozer) arkitekturer på avancerade skrivbordsplattformar.

Excavator CPU for Desktop tillkännagavs den 2 februari 2016, med namnet Athlon X4 845. Under 2017 lanserades ytterligare tre stationära CPU:er (Athlon X4 9x0). De kommer i Socket AM4, med en TDP på ​​65W. Faktum är att de är APU:er med sina grafikkärnor inaktiverade.

Lista över stationära grävmaskiner CPU:er
varumärke

namn

Modell

siffra

Koda

namn

Frekv. (GHz) Kärnor TDP

(W)

Uttag Cache PCI Express 3.0 Relativ IPC Låst
Bas Turbo L1D L2
Athlon X4 845 Carrizo 3.5 3.8 4 65 FM2+ 4x

32KB

2x

1 MB

x8 1.0 Ja
940 Bristol Ridge 3.2 3.6 AM4 x16 1.1 Nej
950 3.5 3.8
970 3.8 4.0

Serverlinjer

AMD Opteron färdplaner för 2015 visar grävmaskinsbaserade Toronto APU och Toronto CPU avsedda för 1-processor (1P) klusterapplikationer:

  • För 1P webb- och företagstjänsterkluster:
    • Toronto CPU – fyrkärnig x86-grävmaskinarkitektur
    • planer för Cambridge CPU – 64-bitars AArch64 kärna
  • För 1P Compute och Media Clusters:
    • Toronto APU – fyrkärnig x86 grävmaskinsarkitektur
  • För 2P/4P-servrar: