SSD Entreprise et Client

Un professionnel face à un mur avec 2 flèches blanches, l’une vers la gauche, l’autre vers la droite

Les datacenters qui nécessitent un débit de données élevé et une faible latence des transactions, et qui utilisaient auparavant des disques durs (HDD) dans leurs serveurs, se heurtent désormais à des goulots d’étranglement en matière de performances. Ils se tournent vers les SSD comme solution pour augmenter les performances, l’efficacité et la fiabilité de leur datacenter, tout en réduisant les dépenses d’exploitation globales (OpEx).

Pour commencer à comprendre les différences entre les types de SSD, il est nécessaire de distinguer deux de leurs principaux composants : le contrôleur de stockage Flash (ou contrôleur SSD) et la mémoire Flash NAND non-volatile qui stocke les données.

Sur le marché actuel, les SSD et Flash NAND se répartissent en trois groupes principaux :
  • Appareils grand public (tablettes, appareils-photos, téléphones mobiles),
  • Systèmes client (Netbook, notebook, Ultrabook, AIO, ordinateurs de bureau), solutions intégrées/industrielles (kiosques de jeu, systèmes spécialisées, signalisation numérique)
  • Plateformes d’informatique d’entreprise (informatique à hautes performances (IHP), serveurs de datacenter).

La sélection de la solution de stockage SSD la mieux adaptée aux besoins d'un datacenter peut être un processus d'apprentissage long et difficile, avec un processus de qualification couvrant une multitude de fournisseurs et de types de produit, puisque toutes les solutions SSD et Flash NAND ne sont pas égales.

Les SSD sont fabriqués pour être faciles à déployer, comme remplacements ou compléments des disques durs. Ils sont disponibles dans différents formats, comme le 2,5”, avec des interfaces et des protocoles de communication variés, incluant Serial ATA (SATA) et Serial Attached SCSI (SAS) et plus récemment NVMe PCIe, pour transférer des données de et vers l’unité centrale (CPU) d’un serveur.

La facilité de déploiement ne garantit pas que tous les SSD répondront toujours à long terme aux besoins de l'application pour laquelle ils ont été sélectionnés. Les conséquences de la sélection d'un type de SSD inadapté peuvent annuler toutes les réductions de coûts et les avantages offerts en termes de performance. Si les spécifications SSD ne sont pas adaptées à l'application, un SSD exposé à des volumes d'écriture excessifs peut s'user prématurément, et offrir des niveaux de performance en écriture continue largement inférieurs pendant son cycle de vie. Il peut aussi induire une augmentation des latences du système de stockage, et nécessiter un remplacement prématuré.

Nous examinons les trois qualités principales qui différencient les SSD destinés aux clients et aux entreprises pour vous aider à prendre des décisions d’achat lorsque vous aurez besoin de remplacer ou d’élargir le stockage d’un serveur.

Performance

Grâce à leur architecture multicanal et leur accès parallèles entre le contrôleur SSD et les puces NAND Flash, les SSD peuvent fournir des taux de lecture et d’écriture extrêmement élevés, pour toutes les requêtes de données séquentielles et aléatoires du CPU.

Dans un scénario typique de datacenter traitant des millions d’octets de données aléatoires, incluant les collaborations sur des dessins CAO, des données d’analyses sismiques (type "Big Data"), ou l’accès à des données clients mondiales pour transactions bancaires (OLTP), les unités de stockage doivent être accessibles avec le plus bas niveau possible de latence. Elles doivent permettre à de nombreux clients d’accéder simultanément aux mêmes données sans dégradation du temps de réponse. L’expérience utilisateur dépend du niveau des latences. Plus elles sont basses plus elles améliorent la productivité de l’utilisateur. Multipliez ces chiffres par l’ensemble du personnel et vous comprendrez que les avantages d’une faible latence peut s’avérer essentielle.

Une application client nécessite seulement un accès par application ou par utilisateur avec une valeur delta tolérable élevée entre les temps de réponse minimal et maximal (ou les latences), pour toute action du système ou d'un utilisateur.

En outre, les systèmes de stockage complexes intégrant des SSD (ex. Network Attached Storage, Direct Attached Storage ou Storage Area Network) sont sensibles aux incohérences de la performance. Par conséquent, ils peuvent avoir un impact désastreux sur les latences des stockages, la continuité de la performance et au final sur la qualité de service, telle que perçue par les utilisateurs.

Contrairement aux SSD destinés aux clients, les SSD pour entreprises de Kingston sont non seulement optimisés pour maintenir une performance de pointe pendant les premières secondes de chaque accès, mais offrent aussi un plus haut niveau de performance continue pendant des périodes plus longues, grâce à un espace d’ « over-provisioning » (OP) plus important. Vous trouverez de plus amples informations sur les divers SSD sur le site web de Kingston, sous Enterprise SSDs{{Footnote.N48213}}.

Ceci garantit que la performance des systèmes de stockage reste alignée sur les exigences de la Qualité de service (QoS) attendue dans l'organisation pendant les périodes de trafic intensif.

A rackmount LED console in a server room.

Fiabilité

La mémoire Flash NAND présente plusieurs problèmes inhérents. Les deux plus importants sont la durée de vie limitée des cellules NAND Flash, qui s’usent lors d’écritures répétées, et le taux d’erreur naturel.

Pendant la fabrication des composants Flash NAND, chaque matrice Flash NAND découpée dans les tranches de silicium est testée et classée en fonction de son taux d'erreur binaire (TEB ou Bit Error Rate, BER/ RBER).

Le TEB exprime le nombre d'erreurs apparues dans des conditions normales dans un élément Flash NAND, sans code de correction des erreurs (Error Correction Code, ECC). De manière transparente pour les accès système ou utilisateur, ces erreurs sont normalement corrigées à la volée par le contrôleur SSD grâce à un code ECC avancé (appelé BCH ECC, Strong ECC ou Code de correction LDPC par les différents fabricants de contrôleurs SSD).

La capacité du contrôleur SSD à corriger ces erreurs binaires peut être évaluée par le taux d'erreur binaire non corrigé (TEBN ou Uncorrectable Bit Error Ratio – UBER). « Ce taux de corruption des données est égal au nombre d'erreurs par bit détectées après application d'une méthode de correction d'erreur spécifiée ». {{Footnote.N48213}}

Conformément aux définitions et à la normalisation proposée par l'association des normes industrielles JEDEC en 2010 dans les documents « JESD218A: Solid State Drive (SSD) Requirements and Endurance Test Method » et « JESD219: Solid State Drive (SSD) Endurance Workloads », la classe Entreprise se différencie de plusieurs façons des SSDClient. Ces différences incluent en particulier, parmi d'autres, sa capacité à supporter des charges d'écriture plus lourdes, des conditions environnementales plus extrêmes et une meilleure récupération en cas de TEB plus élevé, que les SSDClient. {{Footnote.N52081}}{{Footnote.N52082}}

Classe d'applicationCharge de travail (voir JESD219)Utilisation active (sous tension)Utilisation de conservation (hors tension)Critères du taux d'erreur binaire non corrigé (TEBN)
Client Client 40° C
8 heures/ jour
30° C
1 an
≤10 -15
Enterprise Enterprise 55° C
24 heures/ jour
40° C
3 mois
≤10 -16

Tableau 1 - JESD218A : Méthodes de test de l'endurance et des exigences pour SSD
Copyright JEDEC. Reproduction autorisée par le JEDEC.

En fonction du taux TEBN proposé par le JEDEC pour différencier les SSDEntreprise et les SSD Client, un SSD Entreprise ne doit pas générer plus d'une erreur binaire non-corrigée pour 10 quadrillions de bits (~1,11 Péta-octet), alors qu'un SSD Client serait limité à une EBN par quadrillion de bits (~0,11 Péta-octet) traités.

Les SSD Entreprise de Kingston apportent aussi des technologies supplémentaires qui permettent de récupérer les blocs corrompus à l’aide des données de parité stockées dans d’autres composants NAND (comme les volumes RAID qui autorisent la récupération de blocs spécifiques en les reconstruisant avec les données de parité d’autres blocs).

Pour compléter les technologies de récupération des blocs de données intégrées aux SSD Kingston, la création périodique de points de contrôle, un programme de contrôle de redondance cyclique CRC (Cyclic Redundancy Check) et la correction d’erreur ECC font partie de la structure de protection interne bout en bout qui garantit l’intégrité des données reçues et envoyées au système hôte. La protection bout en bout des données signifie que l’intégrité des données provenant du système hôte est vérifiée pendant leur stockage dans le cadre interne du SSD et lorsqu’elles sont écrites ou relues dans les composants Flash NAND.

À l’instar des SSD Entreprise qui améliorent la protection ECC avancée contre les erreurs de bit, les SSD peuvent aussi contenir des circuits physiques de détection de perte de courant qui gèrent les condensateurs d’alimentation du stockage. La détection de perte de courant du matériel analyse l’alimentation du SSD et en cas de coupure imprévue, les circuits du SSD sont temporairement alimentés par des condensateurs au tantale afin d’assurer la bonne exécution des écritures inachevées d’origine interne ou externe avant d’autoriser la mise hors tension du SSD. Le circuit de protection contre les coupures d’alimentation (PLP) est généralement requis pour les applications où la perte de données est irréversible.

La protection contre les coupures d’alimentation peut aussi être mise en œuvre au niveau du firmware du SSD en transférant fréquemment les données contenues dans les zones de cache du contrôleur SSD (ex. sa table de la couche de traduction Flash) vers la zone de stockage NAND. Cette procédure ne garantit pas qu’aucune donnée ne sera perdue pendant une coupure de courant, mais elle minimise l’impact des arrêts non planifiés de l’appareil. La protection du firmware contre les coupures de courant garantit que le SSD restera opérationnel même en cas d’arrêt non planifié.

Dans de nombreux cas, l’utilisation d’un stockage défini par logiciel, ou de grappes de serveurs, peut réduire la nécessité d’une protection contre les coupures d’alimentation, puisque toutes les données sont répliquées sur des appareils de stockage séparés et indépendants, avec un ou plusieurs serveurs. Les datacenters du web se dispensent souvent d’une protection contre les coupures d’alimentation parce qu’ils utilisent des systèmes de stockage défini par logiciel sur des serveurs RAID, lesquels contiennent plusieurs copies de secours des mêmes données.

Endurance

Un professionnel montre un graphique superposé d’hexagones, chacun avec un symbole indiquant des concepts technologiques tels que le Cloud Computing.

Toutes les mémoires Flash NAND intégrées à des dispositifs de stockage Flash se caractérisent par une diminution progressive de leur capacité à stocker des bits sans erreur à chaque cycle d’écriture ou d'effacement (E/E) dans une cellule Flash NAND, jusqu'à ce que les blocs Flash NAND ne soient plus capables de conserver des données sans erreur. Dans ce cas, les blocs erronés doivent être retirés du pool de stockage adressable par les utilisateurs, et les adresses logiques correspondantes seront attribuées à de nouvelles adresses physiques dans le système des unités de stockage Flash NAND. Chaque bloc erroné est remplacé par un nouveau bloc de stockage disponible dans le pool de blocs de rechange qui fait partie du stockage OverProvisioned (OP) du SSD.

Comme la cellule est constamment programmée ou effacée, le TEB subit une augmentation linéaire. Par conséquent, un ensemble complexe de techniques de gestion doivent être exécutées par le contrôleur du SSD Entreprise pour gérer la capacité de la cellule à stocker en toute fiabilité des données sans erreur pendant la durée de vie de l’unité.{{Footnote.N52083}}

L'endurance assurée par le cycle E/E d'une mémoire Flash NAND peut largement varier en fonction du processus de fabrication lithographique utilisé et du type de Flash NAND.

Type de mémoire Flash NANDQLCTLCMLCSLC
Architecture 4 bits par cellule 3 bits par cellule 2 bits par cellule 1 bit par cellule
Capacité La plus haute capacité Capacité plus élevée Haute capacité La plus basse capacité
Endurance (cycle E/E) La plus basse endurance Endurance plus faible Endurance moyenne La plus haute endurance
Coût $$ $$$ $$$$
Taux d'erreur binaire NAND approx. (TEB) 10^4 10^4 10^7 10^9

Tableau 2 – Types de mémoire Flash NAND{{Footnote.N52084}}{{Footnote.N52085}}

Les SSD Entreprise se distinguent également des SSD Client par leur cycle d’utilisation. Un SSD Entreprise doit être capable de supporter une activité de lecture ou d’écriture intense dans des scénarios typiques d’un serveur de datacenter nécessitant un accès aux données 24 h/24, 7 j/7. Comparez cela avec un SSD Client qui n’est généralement utilisé que 8 heures par jour au cours d’une semaine.

Les SSD Entreprise ont donc un cycle d’utilisation de 24x7 contre 20/80 pour les SSD Client (20 % d’activité et 80 % en mode veille pendant l’utilisation de l’ordinateur).

Comprendre l’endurance d’écriture d’un SSD ou d’une application peut être complexe. C’est pourquoi le Comité JEDEC propose une unité de mesure de l’endurance basée sur la valeur des téraoctets écrits (TOE ou TBW –TeraBytes Written). Elle permet d’exprimer la quantité de données hôtes brutes qui peuvent être écrites sur le SSD, avant que la fiabilité de l’élément Flash NAND qu’il contient commence à se dégrader, signalant ainsi la nécessité de le remplacer.

Grâce aux méthodes de test JESD218A proposées par le JEDEC et aux charges de travail d’entreprise JESD219, les calculs d’endurance d’un fabricant de SSD basés sur les TBW sont plus faciles à interpréter et permettent d’extrapoler une mesure de l’endurance plus facile à comprendre et à appliquer dans différents datacenters.

Comme indiqué dans les documents JESD218 et JESD219, différentes charges de travail de classe application peuvent également souffrir d’un facteur d’amplification d’écriture (WAF) d’un ordre de grandeur supérieur aux écritures réelles soumises par l’hôte. Cela peut facilement conduire à une usure ingérable de la Flash NAND, à un TEB plus élevé de la Flash NAND en raison d’écritures excessives au fil du temps, et à des performances plus lentes en raison de pages invalides largement réparties sur le SSD.

Bien que le TBW soit un sujet important pour la discussion entre les SSD Client et Entreprise, il n’est qu’un modèle de prédiction de l’endurance au niveau de la Flash NAND. Le temps moyen entre deux défaillances (MTBF) doit être considéré comme un modèle de prédiction de l’endurance et de la fiabilité au niveau des composants, basé sur la fiabilité des composants utilisés sur l’appareil. Les composants des SSD de la classe Entreprise assurent une endurance et une intensité d’activité supérieures pour gérer les tensions de travail sur tous les éléments Flash NAND pendant toute la durée de vie prévue des SSD. Tous les SSD Entreprise devraient annoncer une valeur MTBF d’au moins deux millions d’heures, ce qui représente plus de 230 années ! Les spécifications conceptuelles des SSD Kingston sont très conservatrices. Il n’est pas rare de voir des valeurs MTBF plus hautes sur ses SSD. Il est important de noter que 2 millions d’heures est une base largement suffisante pour des SSD Entreprise.

Les fonctions de surveillance et de reporting S.M.A.R.T. des SSD de classe Entreprise autorisent des contrôles avant panne et de durée de vie basés sur le niveau d’usure et le facteur d’amplification (Write amplification, WAF) des écritures. Les SSD offrent souvent des alertes avant panne associées à différents événements, tels que coupure de l’alimentation, erreurs binaires sur interface physique ou distribution irrégulière de l’usure. L’utilitaire Kingston SSD Manager peut être téléchargé sur le site web de Kingston et utilisé pour afficher le statut des SSD.

Des SSD Client peuvent seulement offrir des résultats minimum S.M.A.R.T. pour surveiller les activités pendant l’utilisation standard ou après une panne.

Selon la classe d’application et la capacité du SSD, une capacité de réserve accrue dans la mémoire Flash NAND peut aussi être désignée comme capacité supplémentaire libre ou Over-provisioning (OP). La capacité OP est invisible pour l’utilisateur et le système d’exploitation. Elle peut être utilisée comme buffer d’écriture pour améliorer la performance continue et pour remplacer des cellules Flash défectueuses pendant la durée de vie du SSD, afin d’optimiser sa fiabilité et son endurance (avec un plus grand nombre de blocs de rechange).

Conclusion

Des différences spécifiques séparent les SSD des classes Entreprise et Client, depuis leur niveau d’endurance basé sur le cycle d’écriture ou d’effacement de leur mémoire Flash NAND à leurs techniques de gestion complexes et leurs charges de travail par classe d’application.

La compréhension de ces différences dans chaque classe d’application permet de gérer et de minimiser efficacement les risques des arrêts qui perturbent les environnements d’entreprise, exigeants et souvent critiques.

Si vous avez d’autres questions ou souhaitez en savoir plus sur les SSD Entreprise Kingston, n’hésitez pas à contacter votre représentant Kingston, notre équipe Demandez à un expert ou à utiliser notre Chat d’assistance technique.

Vidéos associées

Articles