dbo:abstract
|
- Chipkill is IBM's trademark for a form of advanced error checking and correcting (ECC) computer memory technology that protects computer memory systems from any single memory chip failure as well as multi-bit errors from any portion of a single memory chip. One simple scheme to perform this function scatters the bits of a Hamming code ECC word across multiple memory chips, such that the failure of any single memory chip will affect only one ECC bit per word. This allows memory contents to be reconstructed despite the complete failure of one chip. Typical implementations use more advanced codes, such as a BCH code, that can correct multiple bits with less overhead. Chipkill is frequently combined with , so that if a chip fails (or has exceeded a threshold of bit errors), another, spare, memory chip is used to replace the failed chip. The concept is similar to that of RAID, which protects against disk failure, except that now the concept is applied to individual memory chips. The technology was developed by the IBM Corporation in the early and middle 1990s. An important RAS feature, Chipkill technology is deployed primarily on SSDs, mainframes and midrange servers. An equivalent system from Sun Microsystems is called Extended ECC, while equivalent systems from HP are called Advanced ECC and Chipspare. A similar system from Intel, called Lockstep memory, provides double-device data correction (DDDC) functionality. Similar systems from Micron, called redundant array of independent NAND (RAIN), and from SandForce, called RAISE level 2, protect data stored on SSDs from any single NAND flash chip going bad. A 2009 paper using data from Google's datacentres provided evidence demonstrating that in observed Google systems, DRAM errors were recurrent at the same location, and that 8% of DIMMs were affected each year. Specifically, "In more than 85% of the cases a correctable error is followed by at least one more correctable error in the same month". DIMMs with chipkill error correction showed a lower fraction of DIMMs reporting uncorrectable errors compared to DIMMs with error correcting codes that can only correct single-bit errors. A 2010 paper from University of Rochester also showed that Chipkill memory gave substantially lower memory errors, using both real world memory traces and simulations. (en)
- Chipkill est une marque commerciale de IBM. Il s'agit d'une technique de correction d'erreur pour la mémoire vive qui protège un système de mémoire informatique de tout fonctionnement incorrect d'une seule puce de mémoire. De plus, il est possible pour la technique Chipkill de corriger des erreurs de plus d'un bit de toute portion sur une seule puce de mémoire. Le Chipkill s'effectue en diffusant les bits d'un mot de correction d'erreur sur plusieurs puces de mémoire, pour qu'ainsi, une défectuosité d'une puce de mémoire affecte seulement un bit de correction d'erreur. Ce qui permet au contenu de la mémoire d'être reconstruit en dépit de la défectuosité d'une puce de mémoire. Chipkill est fréquemment combinée à une direction dynamique des bits (dynamic bit-steering en anglais), de sorte que si une puce devient défectueuse (ou dépasse un certain taux d'erreurs par bit), une autre puce, en relève, est utilisée pour remplacer la puce défectueuse. Ce concept est similaire à celui des techniques de type RAID qui protègent contre les défaillances de disques, à ceci près que maintenant ce concept est appliqué à une puce de mémoire. Cette technique a été développée par IBM au début des années 1990. Il s'agit d'une fonctionnalité importante de fiabilité qui est principalement déployée sur les ordinateurs centraux et les serveurs de milieu de gamme.
* Portail de l’informatique (fr)
- Chipkill(チップキル)はIBMの商標であり、ECCより進んだメモリ技術である。単一のメモリチップの破損および単一のメモリチップのあらゆる部分におけるマルチビットのエラーからコンピューターシステムを保護できる。ハミング符号化されたECCワードを複数のメモリチップに渡り分散するこの機能を達成するためのシンプルな仕組みであり、これによりあらゆる単一のメモリチップの破損による影響はひとつのワード中のECCビットにとどまるだろう。これによりメモリ上の内容は1つのチップの完全な損失にもかかわらず再構築することができる。典型的な実装にはより進んだ符号が用いられる。例を上げればBCH符号で、複数のビットをより少ないオーバーヘッドで訂正できる。サン・マイクロシステムズによる同等のシステムはExtended ECCと呼ばれる。ヒューレット・パッカードによる同等のシステムはSDDCと呼ばれる。 Chipkillはしばしば動的ビット退避(dynamic bit-steering)と組み合わされる。あるチップが損失あるいはビットエラーを引き起こしたとき、別の、スペアのメモリチップが使われ、損失したチップに置き換えられる。この概念はRAIDと類似している。これはディスクの損失から保護するものであり、単一のメモリチップに適用されるという点を除いて同じである。この技術はIBMにより1990年代初頭、あるいは半ばに開発された。重要なRASの機能として、ChipkillテクノロジーはSSDやメインフレームや中規模Unix、Linuxサーバーで用いられる。 (ja)
|
rdfs:comment
|
- Chipkill is IBM's trademark for a form of advanced error checking and correcting (ECC) computer memory technology that protects computer memory systems from any single memory chip failure as well as multi-bit errors from any portion of a single memory chip. One simple scheme to perform this function scatters the bits of a Hamming code ECC word across multiple memory chips, such that the failure of any single memory chip will affect only one ECC bit per word. This allows memory contents to be reconstructed despite the complete failure of one chip. Typical implementations use more advanced codes, such as a BCH code, that can correct multiple bits with less overhead. (en)
- Chipkill est une marque commerciale de IBM. Il s'agit d'une technique de correction d'erreur pour la mémoire vive qui protège un système de mémoire informatique de tout fonctionnement incorrect d'une seule puce de mémoire. De plus, il est possible pour la technique Chipkill de corriger des erreurs de plus d'un bit de toute portion sur une seule puce de mémoire. Le Chipkill s'effectue en diffusant les bits d'un mot de correction d'erreur sur plusieurs puces de mémoire, pour qu'ainsi, une défectuosité d'une puce de mémoire affecte seulement un bit de correction d'erreur. Ce qui permet au contenu de la mémoire d'être reconstruit en dépit de la défectuosité d'une puce de mémoire. (fr)
- Chipkill(チップキル)はIBMの商標であり、ECCより進んだメモリ技術である。単一のメモリチップの破損および単一のメモリチップのあらゆる部分におけるマルチビットのエラーからコンピューターシステムを保護できる。ハミング符号化されたECCワードを複数のメモリチップに渡り分散するこの機能を達成するためのシンプルな仕組みであり、これによりあらゆる単一のメモリチップの破損による影響はひとつのワード中のECCビットにとどまるだろう。これによりメモリ上の内容は1つのチップの完全な損失にもかかわらず再構築することができる。典型的な実装にはより進んだ符号が用いられる。例を上げればBCH符号で、複数のビットをより少ないオーバーヘッドで訂正できる。サン・マイクロシステムズによる同等のシステムはExtended ECCと呼ばれる。ヒューレット・パッカードによる同等のシステムはSDDCと呼ばれる。 (ja)
|