Chipkill
Chipkill är IBM :s varumärke för en form av avancerad felkontroll och korrigering (ECC) datorminnesteknik som skyddar datorminnessystem från eventuella enstaka minneschipfel såväl som multi-bitarsfel från vilken del av ett enda minneschip som helst. Ett enkelt schema för att utföra denna funktion sprider bitarna i ett Hamming-kod- ECC-ord över flera minneschips, så att ett fel på ett enskilt minneschip endast kommer att påverka en ECC-bit per ord. Detta gör att minnesinnehållet kan rekonstrueras trots ett fullständigt fel på ett chip. Typiska implementeringar använder mer avancerade koder, såsom en BCH-kod , som kan korrigera flera bitar med mindre overhead.
Chipkill kombineras ofta med dynamisk bitstyrning, så att om ett chip misslyckas (eller har överskridit en tröskel för bitfel), används ett annat reservminne för att ersätta det misslyckade chipet. Konceptet liknar det för RAID , som skyddar mot diskfel, förutom att konceptet nu tillämpas på enskilda minneschips. Tekniken utvecklades av IBM Corporation i början och mitten av 1990-talet. En viktig RAS- funktion är Chipkill-tekniken som används främst på SSD-enheter , stordatorer och mellanregisterservrar.
Ett likvärdigt system från Sun Microsystems heter Extended ECC , medan motsvarande system från HP heter Advanced ECC och Chipspare . Ett liknande system från Intel, kallat Lockstep-minne , tillhandahåller DDDC-funktioner ( double-device data correction) . Liknande system från Micron , kallad redundant array of independent NAND (RAIN), och från SandForce , kallad RAISE level 2 , skyddar data som lagras på SSD-enheter från att varje enskilt NAND-flashchip blir dåligt.
Ett dokument från 2009 med data från Googles datacenter gav bevis som visade att i observerade Google-system var DRAM-fel återkommande på samma plats och att 8 % av DIMM:erna påverkades varje år. Specifikt, "I mer än 85 % av fallen följs ett korrigerbart fel av minst ett korrigerbart fel till under samma månad". DIMM:er med chipkill-felkorrigering visade en lägre andel av DIMM:er som rapporterade okorrigerbara fel jämfört med DIMM:er med felkorrigeringskoder som bara kan korrigera enbitsfel. En artikel från 2010 från University of Rochester visade också att Chipkill-minne gav avsevärt lägre minnesfel, med användning av både verkliga minnesspår och simuleringar.
Se även
- ECC-minne
- Lockstep (dator)
- Minnesskydd
- Redundant array av oberoende minne
- Enfelskorrigering och dubbelfelsdetektering ( SECDED)
externa länkar
- Intel E7500 Chipset MCH Intelx4 Single Device Data Correction (x4 SDDC) Implementering och validering, Intel Application note AP-726, augusti 2002.
- DRAM-studie vänder upp och ner på antaganden om fel, Ars Technica , 7 oktober 2009
- Aktivera minnestillförlitlighet, tillgänglighet och serviceegenskaper på Dell PowerEdge-servrar, 2005
- Chipkill korrekt minnesarkitektur , augusti 2000, av David Locklear
- The Mathematics of Chipkill ECC , oktober 2015, av Bob Day