Mémoire
Disques SSD
Clés USB
Cartes Flash
Assistance technique
Recherche de mémoires

Meilleures pratiques

SDD Entreprise contre SSD Client

Un nombre croissant de centres de données ayant besoin de débits élevés et de latences faibles pour leurs transferts et transactions, et qui jusqu'ici utilisaient des serveurs avec disques durs rotatifs conventionnels, commencent à rencontrer des problèmes de performance liés à des goulets d'étranglement. Ils se tournent vers des solutions SSD (Solid State Disks) pour améliorer la performance, l'efficacité et la fiabilité de leurs opérations, et réduire leurs coûts d'exploitation.

Pour comprendre les différences entre les classes de disques SSD, il est nécessaire de distinguer deux de leurs principaux composants : le processeur de stockage Flash et la mémoire Flash NAND rémanente nécessaire pour stocker les données.

Actuellement, sur le marché, les produits de mémoire SSD et Flash NAND se répartissent en trois groupes principaux : les dispositifs pour consommateurs (tablettes, appareils photo, téléphones mobiles), les équipements clients (ordinateurs portables, netbook, notebook, ultrabook, ordinateurs de bureau, tout-en-un), les solutions intégrées/industrielles (kiosques de jeu) et l'informatique d'entreprise (informatique à haute performance, serveurs de centre de données).

La sélection de la solution de stockage SSD la mieux adaptée aux besoins d'un centre de données peut être un processus d'apprentissage long et difficile, avec un processus de qualification couvrant une multitude de fournisseurs et de types de produit, puisque toutes les solutions SSD et Flash NAND ne sont pas égales.

Les disques SSD sont fabriqués pour offrir des déploiements faciles, afin de remplacer ou de compléter des disques durs rotatifs. Ils sont disponibles dans différents formats, comme le 2,5”, avec des interfaces et des protocoles de communication variés, incluant Serial ATA (SATA) et Serial Attached SCSI (SAS), pour transférer des données de et vers l'unité centrale (CPU) d'un serveur.

La facilité de déploiement ne garantit pas que tous les disques SSD répondront toujours à long terme aux besoins de l'application qu'ils supportent. Les conséquences de la sélection d'un type de SSD inadapté peuvent annuler toutes les réductions de coûts et les avantages offerts en terme de performance. Si les spécifications SSD ne sont pas adaptées à l'application, un disque SSD exposé à des volumes d'écriture excessifs peut s'user prématurément, et offrir des niveaux de performance en écriture continue largement inférieurs pendant son cycle de vie. Il peut aussi induire une augmentation des latences du système de stockage, et nécessiter un remplacement prématuré.

Ce document examine les trois qualités principales qui différencient les disques SSD de la classe Client et de la classe Entreprise pour vous aider à prendre des décisions d'achat informées lorsque vous aurez besoin de remplacer ou d'élargir le stockage d'un centre de données.

Performance

Grâce à leur architecture multicanal et leur accès parallèle entre le processeur de stockage Flash (FSP) et les matrices Flash NAND, les disques SSD peuvent fournir des taux de lecture et d'écriture extrêmement élevés, pour toutes les requêtes de données séquentielles et aléatoires de l'unité centrale.

Dans un scénario typique de centres de données traitant des millions d'octets de données aléatoires, incluant les collaborations sur des dessins CAO, des données d'analyses sismiques (type "Big Data"), ou l'accès à des données clients mondiales pour transactions bancaires (OLTP), les unités de stockage doivent être accessibles avec le plus bas niveau possible de latence. Elles doivent permettre à un très grand nombre de clients d'accéder simultanément aux mêmes données sans dégradation du temps de réponse.

Une application client nécessite seulement un accès par application ou par utilisateur avec une valeur delta tolérable élevée entre les temps de réponse minimal et maximal, pour toute action du système ou d'un utilisateur.

En outre, les systèmes de stockage complexes intégrant des disques SSD (ex. Network Attached Storage, Direct Attached Storage ou Storage Area Network) sont sensibles aux incohérences de la performance. Par conséquent, ils peuvent avoir un impact désastreux sur les latences des stockages, la continuité de la performance et au final sur la qualité de service.

Contrairement aux disques SSD Client, les SSD Entreprise, tels que le disque Kingston E100, sont non seulement optimisés pour maintenir une performance de pointe pendant les premières secondes de chaque accès, mais offrent aussi un plus haut niveau de performance continue pendant des périodes plus longues, grâce à un espace d'"over-provisioning" (OP) plus important. [1]

Cet avantage garantit que la performance des systèmes de stockage reste alignée sur la qualité de service attendue pendant les périodes de trafic intensif.

Fiabilité

Les mémoires Flash NAND présentent diverses limitations inhérentes à leur conception technologique. Les deux plus importantes sont une durée de vie limitée et un taux d'erreur récurrent.

Pendant la fabrication des composants Flash NAND, chaque matrice Flash NAND est testée et classée en fonction de son taux d'erreur binaire (TEB ou Bit Error Rate, BER/ RBER).

Le TEB exprime le nombre d'erreurs apparues dans des conditions normales dans un élément Flash NAND, sans code de correction des erreurs (Error Correction Code, ECC). Ces erreurs sont normalement corrigées à la volée par le processeur FSP grâce à un code ECC avancé et de manière transparente pour les accès système ou utilisateur.

La capacité des processeurs de stockage Flash (FSP) à corriger ces erreurs binaires peut être évaluée par le taux d'erreur binaire non corrigé (TEBN ou Uncorrectable Bit Error Ratio – UBER). « Ce taux de corruption des données est égal au nombre d'erreurs par bit détectées après application d'une méthode de correction d'erreur spécifiée ». [2]

Conformément aux définitions et à la normalisation proposée par le Comité JEDEC en 2010 dans ses documents « JESD218A: Solid State Drive (SSD) Requirements and Endurance Test Method » et « JESD219: Solid State Drive (SSD) Endurance Workloads », la classe Entreprise se différencie de plusieurs façons des disques SSD Client. Ces différences incluent en particulier, mais entre autres, sa capacité à supporter des charges d'écriture plus lourdes, des conditions environnementales plus extrêmes et une meilleure récupération en cas de TEB plus élevé, que les disques SSD Client. [3] [4]

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

Tableau 1 – Méthodes de test de l'endurance et des exigences pour disques SSD (JESD218A) Copyright JEDEC. Reproduction autorisée par le JEDEC.

En fonction du taux TEBN proposé par le JEDEC pour différencier les disques SSD Entreprise et les SSD Client, un SSD Entreprise ne doit pas générer plus d'une erreur binaire non-corrigée pour 10 quadrillions de bits (~1,11 Péta-octet), alors qu'un SSD Client serait limité à une EBN par quadrillion de bits (~0,11 Péta-octet) traités.

Des méthodes de protection supplémentaires, telles que la technologie R.A.I.S.E.

(Redundant Array of Independent Silicon Elements) de LSI® SandForce®, peuvent être mises en œuvre sur des disques SSD Entreprise, en utilisant l'entrelacement des bandes sur les matrices Flash NAND pour compenser les erreurs binaires non corrigées par le code ECC du processeur FSP.

La technologie R.A.I.S.E. ™ permet de réduire efficacement le taux TEBI à une erreur binaire pour 100 octillions de bits (10-29) ou ~111022302462515,66 Péta-octets traités. Elle offre ainsi un TEBI qui est presque 1 quadrillion de fois inférieur à celui d'un disque SSD standard. [5]

Pour compléter la technologie R.A.I.S.E. ™ sur un disque SSD Kingston E100, la création de points de contrôle périodique et un programme de protection interne et intégral CRC (Cyclic Redundancy Check) garantissent l'intégrité des données reçues et envoyées au système hôte.

Outre la protection ECC contre les erreurs binaires sur disques SSD Entreprise, des contrôles électroniques intégrant une logique de détection de baisse de tension (comparable au support en cas de coupure de courant disponible sur les disques SSD Kingston E100) doivent surveiller l'alimentation électrique et utiliser des condensateurs Tantalum pour fournir une alimentation temporaire afin de terminer toutes les écritures internes et externes en cours.

Endurance

Toutes les mémoires Flash NAND intégrées aux unités de stockage Flash se caractérisent par une diminution progressive de leur capacité à stocker des bits sans erreur à chaque cycle d’écriture ou d'effacement (E/E) dans une cellule Flash NAND, jusqu'à ce que l'élément Flash NAND ne soit plus capable de conserver des données sans erreur. Dans ce cas, le disque SSD doit être retiré du pool de stockage adressable par les utilisateurs, et son adresse logique sera attribuée à une nouvelle adresse physique dans le système des unités de stockage Flash NAND.

Comme la cellule est constamment programmée ou effacée, le TEB subit une augmentation linéaire. Par conséquent, un ensemble complexe de techniques de gestion doivent être exécutées par le processeur FSP du disque SSD pour gérer la capacité de la cellule à stocker des données sans erreur pendant la durée de vie de l'unité. [6]

L'endurance assurée par le cycle E/E d'une mémoire Flash NAND peut largement varier en fonction du processus de fabrication lithographique utilisé et du type de Flash NAND.

Type de mémoire Flash NAND TLC MLC e-MLC SLC
Architecture 3 bits par cellule 2 bits par cellule 2 bits par cellule 1 bit par cellule
Capacité La plus haute capacité Haute capacité Haute capacité La plus basse capacité
Endurance (cycle E/E) La plus basse endurance Endurance moyenne Endurance élevée La plus haute endurance
Coût €€ €€€ €€€€
Taux d'erreur binaire NAND approx. (TEB) 10^4 10^7 10^8 10^9

Tableau 2 – Types de mémoire Flash NAND [6] [7] [8] [9]

La mémoire Flash NAND Multi-Level Cell (e-MLC) de qualité Entreprise utilisée dans les disques E100 Kingston de classe Entreprise offre un fonctionnement similaire à la mémoire Flash NAND MLC, mais ses caractéristiques supplémentaires de contrôle et de qualification lui permettent d'atteindre un niveau d'endurance E/E plus élevé et un TEB plus faible que ceux des mémoires MLC standard intégrées aux disques SSD de la classe Client.

Alors qu'un disque SSD de classe Client est normalement utilisé huit heures par jour pendant les jours ouvrables, un disque SSD de classe Entreprise doit supporter des activités d'écriture intensives dans des scénarios de serveur de centre de données, avec des accès aux données 24 heures sur 24, sept jours sur sept. Par conséquent, le type e-MLC est la solution parfaite pour les disques SSD qui doivent offrir une performance, une capacité et une endurance maximales.

Comprendre l'endurance d'écriture d'un disque SSD ou d'une application peut être complexe. C'est pourquoi le Comité JEDEC propose une unité de mesure de l'endurance basée sur la valeur des téra-octects écrits (TOE ou TBW –TeraBytes Written). Elle permet d'exprimer la quantité de données brutes qui peuvent être écrites sur le SSD, avant que la fiabilité de l'élément Flash NAND qu'il contient commence à se dégrader, signalant ainsi la nécessité de le remplacer.

Grâce aux méthodes de test JESD218A proposées par le JEDEC et aux charges de travail d'entreprise JESD219, les calculs d'endurance des fabricants de SSD basées sur les TBW sont plus facile à interpréter et permettent d'extrapoler une mesure de l'endurance plus facile à comprendre et à appliquer dans différents centres de données.

Comme indiqué dans les documents JESD218 et JESD219, différentes charges de travail applicatives peuvent aussi subir les effets d'un facteur d'amplification des écritures (FAE ou Write Amplification Factor – WAF). Dans de telles situations, les quantités finales écrites peuvent être supérieures aux écritures réelles émises par le système hôte. Le niveau d'usure Flash NAND peut alors devenir ingérable, avec un TEB sur Flash NAND gonflé par des écritures excessives et cumulées, ainsi qu'une baisse des performances provoquée par des pages invalides largement distribuées sur le disque SSD. Le mécanisme de compression à la volée mis en œuvre sur le disque Kingston E100 avec la technologie LSI® SandForce® DuraWrite™ réduit le FAE global et améliore l'endurance nominale Flash NAND des applications de la classe Entreprise.

Si le TEB est un critère de différenciation important entre les SSD de classes Entreprise et Client, ce taux est seulement un des modèles de prédiction de l'endurance Flash NAND. L'intervalle moyen avant panne (MTBF) doit aussi être utilisé comme modèle de prédiction de la fiabilité et de l'endurance d'une unité, et basé sur la fiabilité des composants qu'elle contient. Les attentes vis-à-vis des composants SSD de la classe Entreprise incluent une endurance et une intensité d'activité supérieures pour gérer les tensions de travail sur tous les éléments Flash NAND pendant toute la durée de vie prévue des disques SSD.

Les fonctions de surveillance et de reporting S.M.A.R.T. des disques SSD de classe Entreprise autorisent des contrôles avant panne et de durée de vie basés sur le niveau d'usure et le facteur d'amplification des écritures. Les disques offrent souvent des alertes avant panne associées à différents événements, tels que coupure de courant, erreurs binaires sur interface physique ou distribution irrégulière de l'usure.

Des disques SSD Client peuvent seulement offrir des résultats minimum S.M.A.R.T. pour surveiller les activités pendant l'utilisation standard ou après une panne.

Selon la classe d'application et la capacité du SSD, une capacité de réserve accrue dans la mémoire Flash NAND peut aussi être désignée comme capacité supplémentaire libre ou Over-provisioning (OP). La capacité OP est invisible pour l'utilisateur et le système d'exploitation. Elle peut être utilisée comme tampon d'écriture pour améliorer la performance continue et pour remplacer des cellules Flash défectueuses pendant la durée de vie du disque, afin d'optimiser sa fiabilité et son endurance.

Conclusion

Des différences spécifiques séparent les disques SSD des classes Entreprise et Client, depuis leur niveau d'endurance basé sur le cycle d’écriture ou d'effacement de leur mémoire Flash NAND à leurs techniques de gestion complexes et leurs charges de travail par classe d'application.

La compréhension de ces différences dans chaque classe d'application au regard des niveaux de performance, de fiabilité et d'endurance permet de gérer et de minimiser efficacement les risques d'indisponibilité perturbatrice dans des environnements d'entreprise qui sont généralement exigeants et souvent critiques.