Ce site utilise des cookies afin d'améliorer les fonctions proposées. En utilisant ce site, vous acceptez cette utilisation des cookies. La sécurité de vos données et leur confidentialité est pour nous une priorité. Veuillez lire notre Politique des cookies et notre Politique de confidentialité qui ont été mises à jour récemment.

Dossier technique

Qu'est-ce que R.A.I.S.E.?

Figure 1. Schéma des blocs du processeur Flash SF-2500 [1]

La technologie R.A.I.S.E.™ (Redundant Array of Independent Silicon Elements) vient compléter les capacités du code de correction des erreurs (Error Correcting Code – ECC) du processeur du stockage Flash (FSP) assurées par les composants LSI® SandForce® DuraClass™.

Pendant l'utilisation des composants Flash NAND, des erreurs binaires interviennent naturellement. Pendant le début de vie (BOL) et la fin de vie (EOL) des composants Flash NAND, ces erreurs binaires sont détectées et corrigées par le CCE (code de correction des erreurs).

Figure 2. Exemple de croissance exponentielle du taux d'erreur binaire NAND

Le taux d'erreur binaire (Bit Error Rate – BER) est spécifié par le fabricant des composants Flash NAND pendant leur fabrication. Ce taux dépend principalement du processus de fabrication et du type de NAND.

Le BER est inversement proportionnel au nombre de cycles d’écriture et d'effacement restant sur chaque composant NAND. Par conséquent, plus les cycles d’écriture et d'effacement sont fréquents, plus le BER augmente en fin de vie des NAND.

Comme l'indique la Figure 2, la fréquence du taux d'erreur binaire brut non-corrigée (Raw Bit Error Rate – RBER) suit une courbe exponentielle au fil des écritures et des effacements pendant la durée de vie des NAND. Cette progression aboutit à un état inutilisable prédéterminé par le fabricant.

Le code de correction des erreurs est la première ligne de défense.

La complexité du CCE varie avec le nombre de bits ciblés par la récupération (ex. : 1 bit, 2 bits...55 bits par 512 octets) et le code utilisé (ex. : BCH, Reed Solomon). Le CCE résout les erreurs Flash et permet de renvoyer des données valides à l'ordinateur hôte.

Pour qualifier la puissance du CCE, le terme « Taux d'erreur binaire incorrigible » (Uncorrectable Bit Error Rate – UBER) sert à évaluer la fréquence d'une seule erreur de ce type après application du CCE.

Figure 3. Processeur de stockage Flash SandForce LSI et UBER du contrôleur standard SSD [2]

L'exemple typique de la Figure 3 donne un taux UBER d'un bit erroné par quadrillion de bits traités (~0,11 péta-octets) détecté par un contrôleur FSP SSD standard. Il expose les données de l'utilisateur à un risque croissant d'erreurs binaires non-corrigées et d'erreurs silencieuses dès le début de vie par rapport à un processeur FSP SandForce SSD. [2] [3]

Lorsque le taux BER épuise la capacité du CCE sur le processeur de stockage Flash, en particulier aux approches de la fin de la vie, la probabilité d'une erreur incorrigible augmente et une corruption de données devient imminente.

Dans ce cas, la deuxième ligne de défense est assurée par une petite réserve de composants Flash NAND qui supporte la protection R.A.I.S.E. sur le disque SSD.

Figure 4. À partir d'informations redondantes, une page erronée est reconstruite dans un bloc vérifié [2] [4]

La protection R.A.I.S.E. utilise des informations redondantes stockées dans plusieurs pages de composants Flash NAND SSD pour reconstruire de manière transparente les données au niveau des blocs/ pages dans des blocs Flash NAND vérifiés (Figure 4).

Cette technologie offre la protection et la fiabilité RAID 5 (Redundant Array Of Independent Disks) sur un seul disque SSD, sans la double charge d'écriture exigée par la parité et avec un taux d'erreur binaire incorrigible (UBER) de près d'un quadrillion de fois inférieur à celui d'un processeur PSF standard SSD sans R.A.I.S.E.™ soit une erreur binaire par 100 octillions de bits (10^-29) ou ~111022302462515,66 péta-octets de données traitées.

Au niveau des pages et des blocs, la récupération (un bit par bande) peut intervenir avec une latence de 50–100ms qui n'a aucun impact perceptible par l'utilisateur. Elle autorise un processus de correction d'erreur transparent et une intégrité de données garantie.

La complexité de la gestion des unités Flash NAND de plus en plus petites augmente et l'endurance en écriture/ effacement diminue avec la réduction géométrique qu'apporte chaque nouvelle génération de matrices. Par conséquent, la protection R.A.I.S.E. est devenue la solution recommandée par les fabricants pour gérer et améliorer la fiabilité des composants Flash NAND.

Figure 5. Couches de protection des données NAND avec CCE, R.A.I.S.E. et CRC-32

Lorsque la non-détection d'erreurs binaires non-corrigées par le CCE génère des erreurs silencieuses, des données invalides peuvent être renvoyées à l'ordinateur hôte et risquent de compromettre l'intégrité des données.

Si le CCE du FSP ne détecte aucune erreur, R.A.I.S.E. ne peut pas intervenir et le contrôle 32 bits bout en bout servira à intercepter des données à la volée avant que l'intégrité des données soit compromise par le renvoi de données faussement reconnues comme valides à l'ordinateur hôte.

Dans des applications critiques, comme les transactions boursières, un seul bit erroné identifié comme valide sur l'ordinateur hôte peut avoir des conséquences économiques catastrophiques si l'erreur n'est pas immédiatement détectée.

Conclusion

La complexité de la gestion des composants Flash NAND augmente exponentiellement depuis le début jusqu'à la fin de vie du disque SSD.

La gestion des taux d'erreur binaire croissants exige des solutions innovantes, telles que la technologie R.A.I.S.E. SandForce LSI, pour assurer la protection des données après le code de correction des erreurs et bénéficier d'une endurance d'écriture et d'effacement déterminée.

Toute solution moins exigeante que R.A.I.S.E. pour compléter un système de correction d'erreur (CCE) déjà complexe et la technologie de gestion Flash DuraClass SandForce LSI présente un risque important pour l'intégrité, non seulement des données utilisateurs, mais aussi de la totalité du disque SSD dans des applications clients, d'entreprises et industrielles.

Références :
  1. SandForce SF-2600 and SF-2500 Enterprise Flash Storage Processors, LSI Corporation (http://www.lsi.com/downloads/Public/Flash-Storage-Processors/LSI_PB_SF-2500_EnterpriseFSP.pdf)

  2. RAISE™ - Redundant Array of Independent Silicon Elements, LSI Corporation (http://www.lsi.com/technology/duraclass/Pages/RAISE.aspx)

  3. LSI DuraClass™ Technology, LSI Corporation (http://www.lsi.com/technology/duraclass/Pages/default.aspx)

  4. SF-2000 Family SSD Processors New Enterprise and Industrial Products, LSI Corporation October 2010 (http://www.lsi.com/)

        Back To Top