Best Practices

Enterprise- und Client-SSDs im Vergleich

Eine wachsende Zahl von Unternehmensrechenzentren, die mit hohem Datendurchsatz und niedrigen Latenzzeiten bei Transaktionen arbeiten, hat sich bislang auf Hard Disk Laufwerke (HDD) in ihren Servern verlassen und steht nun Leistungsengpässen gegenüber. Sie fassen heute Solid-State Laufwerke (SSD) als gangbare Speicherlösung ins Auge, mit denen sie die Leistung, Effizienz und Zuverlässigkeit ihrer Rechenzentren steigern und gleichzeitig die Betriebskosten (OpEx) senken können.


Zur Verdeutlichung der Unterschiede zwischen den einzelnen SSD-Klassen müssen wir zunächst zwischen den beiden Schlüsselkomponenten eines SSD, dem Flash Storage Controller und dem zum Speichern von Daten verwendeten nicht-volatilen NAND-Flashspeicher, unterscheiden.


Auf dem heutigen Markt wird der SSD- und NAND-Flashspeicherkonsum in drei Hauptgruppen unterteilt:


- Endkundengeräte (Tablets, Kameras, Mobiltelefone) 


- Client-Systeme (Netbook, Notebook, Ultrabook, AIO, Desktop-PCs), eingebettet/gewerblich (Gaming Kiosk, speziell gebaute Systeme, Digital Signage)


- Enterprise-Computing-Plattformen (HPC, Rechenzentrum-Server)


Die Auswahl des richtigen SSD-Speichergeräts für das Rechenzentrum eines Unternehmens kann ein langwieriger und mühsamer Lernprozess sein, in dem eine Vielzahl unterschiedlicher SSD-Anbieter und Produktarten hinsichtlich der Eignung überprüft werden müssen, da nicht alle SSDs und NAND-Flashspeicher in derselben Art hergestellt wurden.


SSDs werden für den einfach zu installierenden Ersatz oder zur Ergänzung von auf magnetischen Platten basierenden Festplatten (HDD) hergestellt und sind in vielen verschiedenen Formfaktoren, einschl. 2,5 Zoll, und mit Kommunikationsprotokollen/Schnittstellen, einschließlich Serial ATA (SATA), Serial Attached SCSI (SAS) und in jüngerer Zeit PCIe erhältlich, um Daten auf die Zentraleinheit (CPU) eines Servers oder von dieser zu übertragen.


SSDs können zwar leicht installiert werden, was aber nicht garantiert, dass sich alle langfristig für die Anwendungen eignen, für die sie das Unternehmen ausgewählt hat. Wenn SSDs vorzeitig verschleißen, weil sie übermäßig beschrieben wurden, die anhaltende Schreibleistung während ihrer zu erwartenden Lebensdauer wesentlich niedriger ist, oder sie im Speicher-Array zusätzliche Latenzzeit verursachen und deshalb frühzeitig ersetzt werden müssen, können die Kosten für eine falsch ausgewählte SSD oft alle ursprünglichen Kosteneinsparungen und Leistungsvorteile zunichte machen.


Als Entscheidungshilfe für Ihren nächsten Kauf von Ersatzspeicher oder zusätzlichem Speicher für ein Unternehmensrechenzentrum befassen wir uns in dieser Studie mit den drei Hauptmerkmalen, die eine SSD der Enterprise-Klasse von einer SSD der Client-Klasse unterscheiden.


Leistung

Durch den Einsatz von Multi-Channel-Architektur und Parallelzugriff vom SSD Controller auf die NAND-Flash-Chips können SSDs unglaublich hohe Lese- und Schreibgeschwindigkeiten, sowohl bei sequenziellen als auch bei zufälligen Datenabfragen der CPU, erreichen.


Das typische Szenario eines Rechenzentrums besteht aus der Verarbeitung von Millionen Bytes zufälliger Firmendaten, einschließlich technischer CAD-Zeichnungen und seismischer Analysedaten (z.B. Big Data), oder dem weltweiten Zugang von Kunden für Banking-Transaktionen (z.B. OLTP). Der Zugang zu den Speichergeräten muss mit niedrigsten Latenzzeiten erfolgen, und es kann auch erforderlich sein, dass viele Kunden gleichzeitig Zugang zu den selben Daten haben, ohne dass die Reaktionszeiten dadurch abfallen. Anwendererfahrung basiert auf niedrigen Latenzzeiten, was die Produktivität der Anwender steigern.


Eine Client-Anwendung betrifft nur einen Benutzer oder eine Anwendung, und die Toleranzgrenze zwischen dem Minimum und dem Maximum der Reaktionszeit (oder Latenzzeit) bei Anwender- oder Systemaktivitäten liegt höher.


Falsch angepasste Leistung kann komplexe SSD-Speicher-Arrays (z. B. Network Attached Storage, Direct Attached Storage oder Storage Area Network) nachteilig beeinflussen und sich verheerend auf die Latenzzeiten des Speicher-Arrays, auf die dauerhafte Leistung und letztendlich auf die Servicequalität, die von Anwendern wahrgenommen wird, auswirken.


Im Gegensatz zu Client-SSDs sind SSDs der Enterprise-Klasse nicht nur für Spitzenleistung in den ersten Sekunden nach dem Zugriff optimiert, sondern bieten durch Nutzung eines größeren, überdimensionierten Bereichs (OP) eine höhere stabile Leistung über längere Zeiträume. Weitere Informationen zu den einzelnen Laufwerken finden Sie auf der Kingston Website unter Enterprise SSDs.[1]

Dies garantiert, dass die Leistung des Speicher-Arrays auch bei Spitzenbelastungen ständig der von der Organisation erwarteten Servicequalität (QoS) entspricht.

Zuverlässigkeit

 Mit NAND-Flashspeichern sind verschiedene Probleme verbunden, wobei zu den beiden wichtigsten die begrenzte Lebenserwartung gehört, da NAND-Flashzellen während des wiederholten Schreibens verschleißen, sowie eine normal anfallende Fehlerhäufigkeit.


Jeder NAND-Flash-Die wird während des Herstellungsprozesses eines NAND-Flashspeichers von Silizium-Wafers getestet und mit einer Bit-Rohfehlerrate (BER oder RBER) gekennzeichnet.


Die BER definiert die Rate, mit der normal auftretende Bitfehler im NAND-Flash ohne Ausgleich durch den Error Correction Code (ECC) vorkommen, und die der SSD Controller mit spontanem Advanced ECC (in der Regel BCH ECC-, Strong ECC- or LDPC-Fehlerkorrektur durch unterschiedliche SSD-Controller-Hersteller genannt) korrigiert, ohne den Anwender- oder Systemzugriff zu unterbrechen.


Die Fähigkeit des SSD Controllers, diese Bitfehler zu korrigieren, kann durch die Uncorrectable Bit Error Ratio (UBER), "eine Metrik für die Datenkorruptionsrate, die der Anzahl der Datenfehler pro Bit entspricht, die nach der Anwendung bestimmter Fehlerkorrekturverfahren gelesen wird", interpretiert werden. [1]

Wie durch die Industry Standards Association JEDEC im Jahre 2010 mit Dokumenten JESD218A: Solid State Drive (SSD) Requirements and Endurance Test Method und JESD219: Solid State Drive (SSD) Endurance Workloads definiert und vereinheitlicht, unterscheidet sich die Enterprise-Klasse in einer Reihe von Möglichkeiten von SSDs der Client-Klasse, einschließlich, aber nicht beschränkt auf ihre Fähigkeit zur Unterstützung höherer Schreibauslastungen, extremerer Umgebungsbedingungen und Wiederherstellung einer höheren BER als ein Client-SSD. [2] [3]

Anwendungs klasse Workload (siehe JESD219) Aktive Nutzung (eingeschaltet) Datenerhaltung (ausgeschaltet) UBER-Anforderungen
Client Client 40° C
8 Stunden/Tag
30° C
1 Jahr
≤10 bis 15
Enterprise Enterprise 55° C
24 Stunden/Tag
40° C
3 Monate
≤10 bis 16

Tabelle 1 - JESD218A: Solid-State-Drive (SSD) Requirements and Endurance Test Method
Urheberrecht JEDEC. Nachdruck mit freundlicher Genehmigung von JEDEC.


Mit den von JEDEC vorgeschlagenen UBER-Vorgaben für SSDs der Enterprise-Klasse geht man bei einem Vergleich zwischen Enterprise-SSDs und Client-SSDs davon aus, dass bei einem Verhältnis von 1 Bitfehler je 10 Billiarden Bits (~ 1,11 Petabytes) nur 1 nicht behebbarer Bitfehler auftritt, im Gegensatz zu Client-SSDs, bei denen 1 Bitfehler je 1 Billiarde Bits (~ 0,11 Petabytes) verarbeitet wird.


Kingston Enterprise-SSDs haben auch zusätzliche Technologien, mit denen die Wiederherstellung von beschädigten Datenblöcken mit Paritätsdaten, die in anderen NAND-Dies, gespeichert sind, möglich ist (ähnlich RAIDing-Laufwerken, was die Wiederherstellung von bestimmten Blöcken ermöglicht, die mit den Paritätsdaten, die in anderen Blöcken gespeichert sind, wieder aufgebaut werden können). 


Um die redundanten Datenblock-Wiederherstellungstechnologien in Kingston Enterprise-SSDs zu ergänzen, werden auch periodische Checkpoint-Erstellung, Cyclic Redundancy Check (CRC) und ECC-Fehlerkorrektur in einem End-to-End-internen Sicherungssystem implementiert, um die Integrität der Daten vom Host über den Flash und zurück zum Host zu gewährleisten. End-to-End-Datenschutz bedeutet, dass Daten, die vom Host empfangen werden, während ihrer Speicherung im internen Cache des SSD und wenn sie von den NAND-Speicherbereichen geschrieben oder wiedergegeben werden auf deren Integrität überprüft werden. 


Ähnlich wie ein verbesserter ECC-Schutz gegen Bitfehler bei SSDs der Enterprise-Klasse, enthalten SSDs auch technische Schaltungen zum Erkennen von Stromverlust, welche die Stromspeicherkondensatoren auf den SSDs verwalten. Powerfail-Support in Hardware überwacht den an die SSD eingehenden Strom und gewährt während eines überraschenden Stromverlustes vorübergehend die Stromversorgung der SSD-Schaltungen mit Tantal-Kondensatoren, um intern oder extern ausgegebene, ausstehende Schreibvorgänge abzuschließen, bevor die SSDs ausgeschaltet werden. Powerfail-Schutzschaltungen sind in der Regel für Anwendungen erforderlich, wenn Datenverlust nicht mehr rückgängig gemacht werden kann.


Powerfail-Schutz kann auch in der SSD-Firmware durch häufiges Entleeren von Daten in den SSD Controller-Cache-Bereichen (z. B. ihre FTranslation-Layer-Tabelle) an den NAND-Speicher implementiert werden. Dies gewährleistet zwar nicht, dass während eines Stromausfalls keine Daten verloren gehen, versucht aber, die Auswirkungen von unsicheren Stromabschaltungen zu minimieren. Firmware-Powerfail-Schutz gewährleistet auch, dass es unwahrscheinlich ist, dass die SSD nach einer unsicheren Abschaltung nicht mehr betriebsfähig ist.

In vielen Situationen kann die Verwendung von Software Defined Storage oder Server-Clustering die Notwendigkeit für auf Hardware basierten Powerfail-Support reduzieren, da alle Daten auf ein separates und unabhängiges Speichergerät auf einem anderen Server oder auf mehreren anderen Servern repliziert werden. Web-Scale-Rechenzentren verzichten oft auf Powerfail-Support und verwenden Software Defined Storage an RAID-Servern, um faktisch redundante Kopien der gleichen Daten zu speichern. 


Ausdauer

Bei allen NAND-Flashspeichern in Flash-Speichergeräten nimmt die Zuverlässigkeit, Datenbits zu speichern, mit jedem Programm- oder Löschzyklus (P/E) einer NAND-Flashspeicherzelle ab, bis die NAND-Flashblöcke Daten nicht mehr zuverlässig speichern können. An dieser Stelle wird ein verschlechterter oder schwacher Block vom von Anwendern adressierbaren Speicherpool und der logischen Blockadresse (oder LBA) auf eine neue physische Adresse im NAND-Flashspeicher-Array verschoben. Ein neuer Speicherblock ersetzt den schlechten, wobei der Ersatzblock-Pool verwendet wird, der Teil des Over Provisioned (OP) Speichers auf der SSD ist.


Da die Zelle ständig programmiert oder gelöscht wird, nimmt auch die BER linear zu, und aus diesem Grund muss ein komplexer Satz von Managementtechniken auf dem Enterprise-SSD Controller implementiert werden, um die Zellkapazität zu verwalten, damit zuverlässig Daten über die erwartete Lebensdauer des SSD gespeichert werden können. [4]

Die P/E-Lebensdauer eines bestimmten NAND-Flashspeichers kann wesentlich unterschiedlich sein, je nach derzeitigem lithografischem Herstellungsverfahren und nach Typ des hergestellten NAND-Flashes.


NAND- Flashspeichertyp TLC MLC SLC
Architektur 3 Bits je Zelle 2 Bits je Zelle
 1 Bit je Zelle

Kapazität Höchste Kapazität Hohe Kapazität Niedrigste Kapazität
Lebensdauer (P/E)
 Niedrigste Lebensdauer Mittlere Lebensdauer Höchste Lebensdauer
Preis $ $$ $$$$
Ungefähre NAND- Bitfehlerrate (BER)
 10^4 10^7 10^9

Tabelle 2 - NAND-Flashspeichertypen [5] [6]

Enterprise-SSDs unterscheiden sich auch von Client-SSDs hinsichtlich ihres Arbeitszyklus. Ein SSD der Enterprise-Klasse muss hohe Lese- oder Schreibaktivitäten bewältigen können, die in Szenarien bei einem Rechenzentrum-Server typisch sind, in denen Zugriff auf Daten während der gesamten 24 Stunden an jedem Tag in der Woche erforderlich ist, im Unterschied zu einem SSD der Client-Klasse, der üblicherweise nur 8 Stunden pro Tag in der Woche voll ausgelastet ist. Enterprise-SSDs haben einen 24 x 7-Arbeitszyklus im Unterschied zu Client-SSDs, die einen 20/80-Arbeitszyklus (20 % der Zeit aktiv, 80 % im Standby- oder Sleep-Modus während der Computer-Nutzung) haben.


Die Schreibbeständigkeit von Anwendungen oder SSDs zu verstehen, kann sehr komplex sein. Darum hat das JEDEC Committee eine Metrik zur Messung der Lebensdauer vorgeschlagen, die den Wert TeraBytes Written (TBW) zum Anzeigen der Rohdatenmenge verwendet, die auf eine SSD geschrieben werden kann, bevor der in der SSD befindliche NAND-Flash beginnt, unzuverlässig zu speichern und entfernt werden sollte.


Die von der JEDEC vorgeschlagenen JESD218A Testmethoden und JESD219 Enterprise-Klasse Workloads vereinfachen die Aufgabe, die Berechnungen der Lebensdauer von SSD-Herstellern mittels TBW zu interpretieren und eine besser verständliche Messung der Lebensdauer hochzurechnen, die bei Rechenzentren angewendet werden können.


Wie in den Dokumenten JESD218 und JESD219 vermerkt, können unterschiedliche Workloads in der Anwendungsklasse auch unter einem WAF (write amplfication factor) leiden, dessen Größenordnung höher ist, als die tatsächlich vom Host gelieferten Schreibvorgänge. Dies kann leicht zu einem unkontrollierbaren NAND-Flashverschleiß, mit der Zeit aufgrund übermäßiger Beschreibung zu einer höheren NAND-Flash-BER und zu langsamerer Leistung aufgrund von über die gesamte SSD verstreuten ungültigen Seiten führen. 


Während TBW ein wichtiges Thema für die Diskussion zwischen SSDs der Enterprise-und der Client-Klasse ist, ist TBW nur ein Vorhersagemodell für die NAND-Flash-Lebensdauer und die Mean Time Between Failure (MTBF) ist als Komponente des Vorhersagemodells der Lebensdauer und der Zuverlässigkeit auf Basis der Zuverlässigkeit der Komponenten, die im Gerät verwendet werden, zu beachten. Die Erwartung an SSD-Komponenten der Enterprise-Klasse umfasst überdauernde und härtere Arbeit, um die Spannungen in allen NAND-Flashspeichern über die Lebenserwartung der SSD zu verwalten. Alle Enterprise-SSDs sollten mindestens auf eine Million Stunden MTBF bewertet werden, was mehr als 114 Jahre ausmacht! Kingston gibt die technischen Daten seiner SSDs sehr konservativ an, und es ist nicht ungewöhnlich, höhere MTBF-Spezifikationen auf SSDs zu sehen. Es ist wichtig, festzuhalten, dass 1 Million Stunden ein mehr als ausreichender Ausgangspunkt für Enterprise-SSDs sind.


Durch S.M.A.R.T.-Überwachung und Reporting der SSDs der Enterprise-Klasse kann das Gerät basierend auf dem aktuellen Write Amplification Factor (WAF) und Verschleißstatus einfach vor dem Ausfall auf seine Lebenserwartung abgefragt werden. Prädiktive Warnungen vor einem Ausfall hinsichtlich Fehlerereignisse wie zum Beispiel ein Stromausfall, Bitfehler, die an der physischen Schnittstelle auftreten oder ungleichmäßiger Verschleiß, werden ebenfalls häufig unterstützt. Das Kingston SSD Manager-Dienstprogramm kann von der Kingston-Website heruntergeladen und benutzt werden, um den Status eines Laufwerks anzuzeigen.


Bei SSDs der Client-Klasse stehen unter Umständen nur die S.M.A.R.T.-Mindestleistungen zur Überwachung der SSD während der standardmäßigen Nutzung oder nach einem Ausfall zur Verfügung.


Je nach Anwendungsklasse und Kapazität der SSD kann auch eine erhöhte Reservekapazität des NAND-Flashspeichers als überdimensionierte (OP) Reservekapazität zugeordnet werden. Die OP-Kapazität ist beim Anwender- und Betriebssystemzugriff verborgen und kann vorübergehend als Schreibpuffer für höhere, anhaltende Leistung und als Ersatz für defekte Flashspeicherzellen während der gesamten Lebenserwartung der SSD genutzt werden, um die Zuverlässigkeit und Lebensdauer der SSD (mit einer größeren Anzahl von Ersatzblöcken) zu verbessern. 


Zusammenfassung

Die Unterschiede zwischen SSDs der Enterprise-Klasse und der Client-Klasse sind beträchtlich und reichen von der Lebensdauer der Programm- und Löschzyklen ihrer NAND-Flashspeicher bis zu ihren komplexen Managementtechniken, um Workloads bei unterschiedlichen Anwendungsklassen gerecht zu werden.


Diese Unterschiede in Anwendungsklassen zu verstehen, kann, da es um Leistung, Zuverlässigkeit und Lebensdauer geht, ein wirksames Instrument bei der Minimierung und dem Risikomanagement von störenden Ausfallzeiten im anspruchsvollen und oft erfolgskritischen Unternehmensumfeld sein. Für weitere Fragen wenden Sie sich bitte an Ihren Kingston Vertreter oder nutzen Sie die Funktion Ask An Expert oder Tech Support Chat auf Kingston.com.


        Back To Top