Sprachen Businessbereich Bezugsquellen
Speicher
SSD-Laufwerke
USB-Sticks
Flashspeicher
Wireless
Support
SPEICHERSUCHE

Best Practices

Enterprise- und Client-SSDs im Vergleich

Eine wachsende Zahl von Unternehmensdatenzentren, die mit hohem Datendurchsatz und niedrigen Latenzzeiten bei Transaktionen arbeiten, hat sich bislang auf Hard Disk Drives (HDD) in ihren Servern verlassen und steht nun Leistungsengpässen gegenüber. Sie fassen heute Solid-State-Disks (SSD) als gangbare Speicherlösung ins Auge, mit denen sie die Leistung, Effizienz und Zuverlässigkeit ihrer Datenzentren steigern und gleichzeitig die Betriebskosten (OpEx) senken können.

Zur Verdeutlichung der Unterschiede zwischen den einzelnen SSD-Klassen, müssen wir zunächst zwischen den beiden Schlüsselkomponenten einer SSD, dem Prozessor für die Flashspeicherung und dem zum Speichern der Daten verwendeten nichtvolatilen NAND-Flashspeicher, unterscheiden.

Der heutige Verbrauchermarkt für SSDs und NAND-Flashspeicher kann in drei Hauptgruppen eingeteilt werden: Verbrauchergeräte (Tablets, Kameras, Mobiltelefone), Client (Netbook, Notebook, Ultrabook, AIO, Desktop-PCs), integriertes, industrielles (Gaming, Kiosk) und Enterprise-Computing (HPC, Rechenzentren-Server).

Die Auswahl des richtigen SSD-Speicherlaufwerks für das Rechenzentrum eines Unternehmens kann ein langwieriger und mühsamer Lernprozess sein, in dem eine Vielzahl unterschiedlicher SSD-Anbieter und Produktarten qualifiziert werden müssen, da SSDs und NAND-Flashspeicher oft nicht in derselben Art erstellt wurden.

SSDs werden für den einfach zu installierenden Ersatz oder zur Ergänzung von Festplatten (HDD) auf Basis von Drehmagnetplatten hergestellt und sind in vielen verschiedenen Größen, einschl. 2,5“, und mit Kommunikationsprotokollen / Schnittstellen, einschl. Serial ATA (SATA) und Serial Attached SCSI (SAS) erhältlich, um Daten auf die Zentraleinheit (CPU) eines Servers, oder von dieser, zu übertragen.

SSDs können zwar leicht installiert werden, was aber nicht automatisch bedeutet, dass sie langfristig auch den Anwendungen gerecht werden, für die das Unternehmen sie installiert hat. Wenn SSDs vorzeitig verschleißen weil sie exzessiv beschrieben wurden, die anhaltende Schreibleistung während ihrer zu erwartenden Lebensdauer wesentlich niedriger ist, oder sie im Speicher-Array zusätzliche Latenz verursachen und deshalb frühzeitig ersetzt werden müssen, können die Kosten für eine falsch ausgewählte SSD oft alle ursprünglichen Kosteneinsparungen und Leistungsvorteile zunichtemachen.

Als Entscheidungshilfe für Ihren nächsten Kauf von Ersatz oder zusätzlichem Speicher für ein Unternehmensrechenzentrum befassen wir uns in dieser Studie mit den drei Hauptmerkmalen, die eine SSD der Enterprise-Klasse von einer SSD der Client-Klasse unterscheiden.

Leistung

Durch den Einsatz von Multi-Channel-Architektur und Parallelzugriff vom FSP auf die NAND-Flash-Dies können SSDs unglaublich hohe Lese- und Schreibgeschwindigkeiten sowohl bei sequentiellen als auch bei zufälligen Datenabfragen der CPU erreichen.

Das typische Szenario eines Rechenzentrums besteht aus der Verarbeitung von Millionen Bytes zufälliger Firmendaten und bezieht technische CAD-Zeichnungen und seismische Analysedaten (z.B. Big Data) mit ein, oder muss für den weltweiten Zugang von Kunden für Banking-Transaktionen (z.B. OLTP) zur Verfügung stehen. Der Zugang zu den Speichergeräten muss mit niedrigsten Latenzzeiten erfolgen und kann auch erfordern, dass viele Kunden gleichzeitig Zugang zu denselben Daten haben müssen, ohne dass die Reaktionszeiten dadurch abfallen.

Dem hingegen bezieht eine Client-Anwendung nur einen Benutzer oder eine Anwendung ein, und die Toleranzgrenze zwischen dem Minimum und dem Maximum der Reaktionszeit auf Benutzer- oder Systemaktivitäten liegt höher.

Falsch angepasste Leistung kann komplexe SSD-Speicher-Arrays (z. B. Network Attached Storage [NAS], Direct Attached Storage [DAS] oder Storage Area Network [SAN]) nachteilig beeinflussen und sich verheerend auf die Latenzzeiten des Speicher-Arrays, auf die dauerhafte Leistung und letztendlich auf die Servicequalität auswirken.

Im Gegensatz zu Client-SSDs bringen SSDs der Enterprise-Klasse, wie das Kingston E100 Solid-State-Laufwerk, nicht nur optimale Spitzenleistung in den ersten Sekunden nach dem Zugriff, sondern können größere, überdimensionierte Bereiche (OP) nutzen und können dadurch eine höhere, stabile Leistung über längere Zeiträume bieten. [1]

Dies garantiert, dass die Leistung des Speicher-Arrays in der von der Organisation erwarteten Servicequalität auch bei Spitzenbelastung gleichbleibend zuverlässig ist.

Zuverlässigkeit

Mit NAND-Flashspeichern sind verschiedene Probleme verbunden, wobei vor allem die begrenzte Lebensdauer und eine naturbedingte Fehlerhäufigkeit zu erwähnen sind.

Jedes NAND-Flash-Die wird während des Herstellungsprozesses eines NAND-Flashspeichers getestet und mit einer Bit-Rohfehlerrate (BER oder RBER) gekennzeichnet.

Die BER definiert die Häufigkeit, in der naturgemäß auftretende Bit-Fehler bei NAND-Flash auftreten, die nicht mit einem Fehlercode (ECC) gekennzeichnet sind, und die das FSP unmittelbar mit Advanced-ECC behebt, ohne den Benutzer- oder Systemzugriff zu unterbrechen.

Die Fähigkeit des Flashspeicherprozessors, diese Bit-Fehler zu beheben, kann mittels der Uncorrectable Bit Error Rate (nicht korrigierbare Bitfehlerrate - UBER), einer „Metrik zur Datenkorruptionsrate, die der Anzahl der Datenfehler je Bit nach Anwendung einer spezifischen Fehlerkorrekturmethode entspricht“, interpretiert werden. [2]

Wie in den Dokumenten „JESD218A:Solid State Drive (SSD) Requirements and Endurance Test Method" und „JESD219:Solid State Drive (SSD) Endurance Workloads” vom JEDEC-Komitee festgelegt und vereinheitlicht, unterscheidet sich die Enterprise-Klasse in mehrfacher Hinsicht von SSDs der Client-Klasse. Dazu gehört unter anderem ihre Fähigkeit, größere Schreib-Workloads und extremere Umweltbedingungen zu unterstützen, und eine höhere BER zu überstehen als eine Client-SSD. [3] [4]

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

Tabelle 1 - JESD218A:Solid-State-Drive (SSD) Requirements and Endurance Test Method Copyright JEDEC.

Unter Ansatz der von JEDEC vorgeschlagenen UBER-Vorgaben für SSDs der Enterprise-Klasse wird bei einem Vergleich zwischen Enterprise-SSDs und Client-SSDs erwartet, dass bei einem Verhältnis von 1 Bitfehler je 10 Billiarden Bits (~1.11 Petabytes) nur 1 nicht behebbarer Bitfehler auftritt, im Gegensatz von Client-SSDs, bei denen 1 Bitfehler je 1 Billiarde Bits abgewickelt wird.

Zusätzlich können in SSDs der Enterprise-Klasse Schutzmechanismen eingebaut werden, einschl. „Redundant Array of Independent Silicon Elements (R.A.I.S.E. ) Technologien von LSI® SandForce® die durch Datastripping der Parität bei allen NAND-Flash-Dies Umständen entgegenwirken, bei denen sich der FSP-ECC nicht mehr von einem Bitfehler erholen kann.

Durch Einsatz der R.A.I.S.E. ™ Technologie kann der UBER auf 1 Bitfehler je 100 Quadrilliarden Bits (10-29), oder ~111022302462515.66 verarbeitete Petabytes, reduziert werden, wodurch ein UBER geboten wird, der um nahezu 1 Billiarde niedriger liegt als bei einer Standard-SSD. [5]

Als Ergänzung zur R.A.I.S.E. ™ Technologie werden auf Kingston E100 SSDs periodische Kontrollpunkte erstellt und als nahtlose interne Schutzeinrichtung wird ein Cyclic Redundancy Check (CRC) implementiert, mit dem die Datenintegrität vom Host über den Flash und zurück zum Host garantiert werden kann.

Ähnlich wie beim erhöhten ECC-Schutz gegen Bitfehler sollten SSDs der Enterprise-Klasse auch Steuerelektronik mit Spannungsverlust-Erkennungslogik enthalten. Sie sollten, wie bei der Kingston E100, Schutz vor Datenverlust bei Stromausfall enthalten, den Eingangsstrom überwachen und die SSD bei Stromausfall über Tantal-Kondensatoren temporär mit Strom versorgen, damit offene interne und externe Schreibvorgänge abgeschlossen werden können.

Ausdauer

Die Fähigkeit aller in Flashspeichern enthaltenen NAND-Flashspeicher, Datenbits zuverlässig zu speichern, lässt mit jedem Programm- oder Löschzyklus (P/E) einer NAND-Flashspeicherzelle nach, bis der NAND-Flash Daten nicht mehr zuverlässig speichern kann. Zu diesem Zeitpunkt sollte er aus dem vom Benutzer aufrufbaren Speicherpool entfernt werden, wobei die logische Adresse in eine neue physische Adresse des NAND-Flashspeicher-Arrays verschoben werden muss.

Mit jedem Programmier- oder Löschvorgang in einer Zelle erhöht sich der BER linear. Aus diesem Grund muss auf der Enterprise-SSD-FSP eine ganze Reihe von Verwaltungstechniken implementiert sein, um die Leistungsfähigkeit der Zelle in Bezug auf die zuverlässige Speicherung von Daten während der zu erwartenden Nutzungsdauer der SSD zu gewährleisten. [6]

Die P/E-Lebensdauer von NAND-Flashspeichern kann wesentlich voneinander abweichen, je nach den lithografischen Herstellungsprozessen und dem Typ des produzierten NAND-Flashes.

NAND-Flashspeichertyp TLC MLC e-MLC SLC
Architektur 3 Bits je Zelle 2 Bits je Zelle 2 Bits je Zelle 1 Bit je Zelle
Speicherkapazität Höchste Kapazität Hohe Kapazität Hohe Kapazität Niedrigste Kapazität
Lebensdauer (P/E) Niedrigste Lebensdauer Mittlere Lebensdauer Hohe Lebensdauer Höchste Lebensdauer
Preis €€ €€€ €€€€
Ungefähre NAND-Bit-Fehlerrate (BER) 10^4 10^7 10^8 10^9

Tabelle 2 – NAND-Flashspeicher-Typen [6] [7] [8] [9]

Die für Kingston SSD der Enterprise-Klasse verwendeten Multi-Level Cell (e-MLC) NAND Flashspeicher in Enterprise-Klasse sind in ihrer Arbeitsweise ähnlich wie standardmäßige MLC NAND Flashspeicher, verfügen jedoch über zusätzliche Screening- und Qualifizierungsanforderungen, um eine höhere P/E-Lebensdauer und einen niedrigeren BER zu erreichen als Standard-MLC, die für SSDs der Client-Klasse verwendet werden.

SSDs der Enterprise-Klasse müssen in der Lage sein, intensive Schreibaktivitäten zu überstehen, die für Szenarien typisch sind, bei denen Rechenzentren jeden Tag rund um die Uhr Zugang zu den Daten benötigen. Im Gegensatz dazu werden Client-SSDs normalerweise täglich nur 8 Stunden verwendet. Darum ist e-MLC die perfekte Lösung für hochleistungsfähige SSDs mit großer Speicherkapazität und hoher Lebensdauer.

Die Schreibbeständigkeit einer Anwendung oder SSD zu verstehen, kann sehr komplex sein. Darum hat das JEDEC Komitee eine Metric zu Lebensdauermessung vorgeschlagen, die den Wert TeraBytes Written (TBW) zum Anzeigen der Rohdatenmenge verwendet, die auf eine SSD geschrieben werden kann, bevor der in der SSD befindliche NAND-Flash unzuverlässig zu speichern beginnt und entfernt werden sollte.

Die von der JEDEC vorgeschlagenen Testmethoden JESD218A und Enterprise-Klasse Workloads JESD219 vereinfachen die Aufgabe, die Berechnungen der Lebensdauer von SSD-Herstellern über TBW zu interpretieren und besser verständliche Lebensdauer-Maßzahlen hochzurechnen, die auf ein Rechenzentrum angewendet werden können.

Wie in den Abhandlungen JESD218 und JESD219 vermerkt, können unterschiedliche Workloads in der Anwendungsklasse auch unter einem WAF (write amplfication factor) leiden, dessen Größenordnung höher ist, als die tatsächlich vom Host gelieferten Schreibvorgänge. Dies kann leicht zu einer unkontrollierbaren NAND-Flashabnutzung , mit der Zeit zu einem höheren NAND-Flash-BER aufgrund exzessiver Beschreibung, und zu langsamerer Leistung aufgrund von über die gesamte SSD verstreuten ungütigen Seiten, führen. Der in Kingston E100 mit LSI® SandForce® DuraWrite™ Technologie verwendete, extrem schnelle Kompressionsmechanismus reduziert WAF insgesamt und erweitert die auf den NAND-Flash bezogene Lebensdauer für Applikationen in der Enterprise-Klasse.

Obwohl TBW ein wichtiges Diskussionsthema ist, wenn es um SSDs der Enterprise- oder Client-Klasse geht, ist TBW nur ein Modell zur Darstellung der voraussichtlichen Lebensdauer auf NAND-Flashebene. Für eine Aussage über ihre voraussichtliche Lebensdauer und Zuverlässigkeit auf Basis der Zuverlässigkeit der im Gerät verwendeten Komponenten muss jedoch auch der Mean Time Between Failure (MTBF) einbezogen werden. Von SSD-Komponenten für die Enterprise-Klasse wird auch erwartet, dass sie während der gesamten Lebensdauer der SSD ausdauernd arbeiten und Spannungen besser über alle NAND-Flashspeicher verteilen.

Die S.M.A.R.T.-Überwachungs- und Berichtsfunktionen auf Basis des aktuellen WAFs und Abnutzungsniveaus bilden einfache Abfragemöglichkeiten in Bezug auf die Lebenserwartung von SSDs der Enterprise-Klasse vor einem Ausfall.

Oft werden auch Frühwarnungen vor fehlerhaften Ereignissen wie Energieausfall, von der physischen Schnittstelle ausgehende Bitfehler, oder bei einer ungleichmäßigen Verteilung der Abnutzung, unterstützt.

SSDs der Client-Klasse stehen nur die S.M.A.R.T.-Mindestleistungen zur Überwachung der SSD während der standardmäßigen Nutzung oder nach einem Ausfall zur Verfügung.

Je nach Anwendungsklasse und Speicherkapazität einer SSD kann auch eine erhöhte Reservekapazität des NAND-Flashspeichers als überdimensionierte (OP) freie Kapazität zugewiesen werden. Die OP-Kapazität ist gegen Zugriff durch den Benutzer oder das Betriebssystem gesperrt. Sie kann während der Nutzungsdauer der SSD zur Steigerung der Zuverlässigkeit und Lebensdauer der SSD als temporärer Schreibpuffer für höhere Dauerleistungen und als Ersatz für defekte Flashspeicherzellen verwendet werden.

Zusammenfassung

Die Unterschiede zwischen SSDs der Enterprise-Klasse und der Client-Klasse sind beträchtlich und reichen von der Lebensdauer der Programmier- und Löschzyklen ihrer NAND-Flashspeicher bis zu ihren komplexen Verwaltungstechniken, die für ihre Eignung für die Workloads der unterschiedlichen Anwendungsklassen wichtig sind.

Das Verstehen dieser Unterschiede zwischen den Anwendungsklassen, die sich auf die Leistung, Zuverlässigkeit und Lebensdauer beziehen, kann ein effizientes Werkzeug sein, mit dem das Risiko von störenden Ausfallzeiten im anspruchsvollen und oft erfolgsabhängigen Unternehmensumfeld minimiert und gehandhabt werden kann.