Porównanie korporacyjnych i klienckich dysków SSD

Specjalista stojący naprzeciw ściany z dwiema strzałkami – jedną skierowaną w lewo, a drugą w prawo.

W coraz większej liczbie centrów danych, które wymagają wysokiej przepustowość przesyłania danych i małych opóźnień transakcji, a dotychczas wykorzystywały tradycyjne dyski twarde (HDD), występują wąskie gardła wydajności. Dlatego kierują one swoją uwagę na dyski półprzewodnikowe (SSD) jako rozwiązanie zwiększające wydajność, efektywność i niezawodność, a jednocześnie obniżające ogólne koszty operacyjne.

Aby zrozumieć różnicę między poszczególnymi klasami dysków SSD należy zwrócić uwagę na dwa kluczowe komponenty dysku SSD: kontroler pamięci masowej flash (w uproszczeniu „kontroler dysku SSD”) oraz nieulotną pamięć flash NAND służącą do przechowywania danych.

Obecnie dyski SSD i pamięć flash NAND są wykorzystywane w trzech głównych grupach produktów, do których należą:
  • urządzeniach konsumenckich (tabletach, aparatach fotograficznych, telefonach komórkowych);
  • urządzeniach klienckich (netbookach notebookach, ultrabookach, AIO, osobistych komputerach stacjonarnych) i rozwiązaniach osadzonych/przemysłowych (kioskach z grami, systemach specjalizowanych, cyfrowych systemach informacyjnych);
  • korporacyjne platformy obliczeniowe (systemy HPC, serwery w centrach danych).

Wybór odpowiedniej pamięci masowej SSD do korporacyjnego centrum danych może być długim i skomplikowanym procesem, obejmującym analizę specyfikacji i kwalifikację produktów różnych typów pochodzących od różnych producentów, ponieważ nie wszystkie dyski SSD i pamięci flash NAND są sobie równe.

Dyski SSD są produkowane w taki sposób, aby można je było z łatwością zastosować jako zamienniki lub uzupełnienie dysków twardych (HDD). Są one dostępne w kilku różnych formatach (w tym 2,5 cala) i obsługują różne protokoły komunikacyjne/interfejsy, takie jak Serial ATA (SATA), Serial Attached SCSI (SAS) czy nowszy PCIe, które umożliwiają transfer danych do i z procesorów serwera.

Jednak łatwość wdrożenia nie stanowi gwarancji, że wszystkie dyski SSD będą nadawać się do długotrwałej eksploatacji w zastosowaniach korporacyjnych. Koszty wyboru nieodpowiednich dysków SSD często mogą przekroczyć początkowe oszczędności i zniwelować korzyści wynikające ze wzrostu wydajności, ponieważ takie dyski mogą zużywać się przedwcześnie z powodu dużej liczby operacji zapisu, oferować znacznie niższą od oczekiwanej stałą wydajność zapisywania danych w okresie eksploatacji albo wprowadzać dodatkowe opóźnienia do działania macierzy, co z kolei powoduje szybką konieczność ich wymiany.

Poniżej omówimy trzy główne cechy odróżniające od siebie korporacyjne i klienckie dyski SSD. Informacje te mogą być pomocne w podjęciu trafnej decyzji o zakupie, gdy nadejdzie czas wymiany lub rozbudowy pamięci masowej serwera.

Wydajność

Dyski SSD mogą zapewniać niezwykle wysoką wydajność zapisu i odczytu, zarówno sekwencyjnego, jak i losowego, dzięki wielokanałowej architekturze i równoległemu dostępowi kontrolera dysku SSD do układów pamięci flash NAND.

W typowych scenariuszach działania centrum danych, które obejmują przetwarzanie milionów bajtów losowo wybieranych danych, w tym pracę grupową nad technicznymi rysunkami CAD, analizowanie wielkich bloków danych (np. Big Data) lub uzyskiwanie dostępu do danych klientów na całym świecie w celu obsługi transakcji bankowych (np. OLTP), urządzenia pamięci masowej muszą być dostępne z jak najmniejszym opóźnieniem i obsługiwać wielu klientów wymagających jednoczesnego dostępu do tych samych danych bez wydłużenia czasu odpowiedzi. Doświadczenia użytkowników są uzależnione od niskich opóźnień, które pozwalają im zwiększyć produktywność. Jeśli pomnożymy to przez liczbę wszystkich pracowników, przekonamy się, jak szybko mogą kumulować się korzyści wynikające z niskich opóźnień.

Zastosowanie klienckie będzie obejmować dostęp jednego użytkownika lub aplikacji, przez co akceptowalne stają się większe różnice między minimalnym a maksymalnych czasem reakcji (czyli opóźnieniem) na dowolną akcję użytkownika lub systemu.

Negatywny wpływ na złożone macierze pamięci masowej, w których są używane dyski SSD (np. Network Attached Storage, Direct Attached Storage lub Storage Area Network), ma także niedopasowanie dysków pod względem wydajności, co może spowodować lawinowy wzrost opóźnień w macierzy pamięci masowej, spadek stałej wydajności, a w konsekwencji spadek ogólnej jakości usługi w ocenie użytkowników.

W przeciwieństwie do klienckich dysków SSD oferowane przez firmę Kingston dyski SSD klasy korporacyjnej są zoptymalizowane nie tylko pod kątem szczytowej wydajności w ciągu kilku pierwszych sekund dostępu do danych, ale dzięki wykorzystaniu większego obszaru dodatkowych bloków pamięci (OP) oferują także wyższą stałą wydajność w dłuższych okresach. Więcej informacji na temat poszczególnych dysków można znaleźć na stronie internetowej firmy Kingston w sekcji poświęconej dyskom SSD klasy korporacyjnej.{{Footnote.N48213}}

Daje to gwarancję, że wydajność macierzy pamięci masowej będzie zgodna z oczekiwaniami organizacji dotyczącymi jakości usługi (QoS) w okresach szczytowego obciążenia.

Konsola LED zamontowana w szafie serwerowej w serwerowi.

Niezawodność

Pamięć flash NAND ma pewne ograniczenia. Dwa najważniejsze z nich to ograniczona żywotność (związana z powtarzającymi się operacjami zapisu w komórkach pamięci) oraz współczynnik naturalnie występujących błędów.

W procesie produkcji pamięci flash NAND każdy segment pamięci flash NAND wycinany z płytki krzemowej jest testowany i opisywany za pomocą współczynnika błędów bitowych (BER lub RBER).

Współczynnik BER określa, ile naturalnie występujących błędów bitowych w pamięci flash NAND może wystąpić przed wygenerowaniem kodu korekcji błędów (Error Correction Code, ECC) i które kontroler dysku SSD koryguje na bieżąco z użyciem zaawansowanej funkcji korekcji ECC (inni producenci używają różnych nazw, np. BCH ECC, Strong ECC lub LDPC) bez przerywania dostępu użytkownika lub systemu.

Możliwości kontrolera dysku SSD w zakresie korekcji błędów bitowych można określić za pomocą współczynnika niekorygowalnych błędów bitowych (Uncorrectable Bit Error Ratio, UBER), który jest „miarą współczynnika uszkodzenia danych równą liczbie błędów danych na odczyt bitu po zastosowaniu określonej metody korekcji błędów”. {{Footnote.N48213}}

Zgodnie z definicją i standardem określonym przez branżowe stowarzyszenie standaryzacyjne JEDEC w 2010 r. w dokumentach JESD218A: Solid State Drive (SSD) Requirements and Endurance Test Method (JESD218A: Wymagania dotyczące dysków półprzewodnikowych [SSD] oraz metoda testowania trwałości) oraz JESD219: Solid State Drive (SSD) Endurance Workloads (JESD219: Obciążenia do testowania trwałości dysków półprzewodnikowych (SSD)) dyski SSD klasy korporacyjnej różnią się od klienckich dysków SSD pod wieloma względami, w tym m.in. obsługują większe obciążenia operacjami zapisu, wytrzymują trudniejsze warunki środowiskowe i umożliwiają odzyskiwanie danych przy wyższych współczynnikach BER.{{Footnote.N52081}}{{Footnote.N52082}}

Klasa zastosowaniaObciążenie (patrz JESD219)Aktywne użycie (włączone zasilanie)Podtrzymywanie (włączone zasilanie)Wymaganie UBER
Typowa Typowa 40° C
8 godz./dzień
30° C
1 rok
≤10 -15
Korporacyjna Korporacyjna 55° C
24 godz./dzień
40° C
3 miesiące
≤10 -16

Tabela 1 – JESD218A: Wymagania dotyczące dysków półprzewodnikowych (SSD) oraz metoda testowania trwałości
Copyright JEDEC. Reprodukcja za zgodą organizacji JEDEC.

Zgodnie z zaproponowanym przez organizację JEDEC wymaganiem dotyczącym współczynnika UBER dla korporacyjnych i klienckich dysków SSD, na dysku SSD klasy korporacyjnej może wystąpić tylko 1 nieodzyskiwalny błąd bitowy przy 1 błędzie bitowym na każde 10 kwadrylionów przetworzonych bitów (~1,11 petabajtów), a na klienckim dysku SSD przy 1 błędzie bitowym na każdy 1 kwadrylion przetworzonych bitów (~0,11 petabajtów).

Ponadto dyski SSD klasy korporacyjnej produkowane przez firmę Kingston są wyposażone w dodatkowe rozwiązania techniczne umożliwiające odzyskiwanie uszkodzonych bloków danych z wykorzystaniem danych parzystości przechowywanych w innych segmentach pamięci NAND (podobnie jak w dyskach w macierzy RAID można dzięki temu odzyskać określone bloki, których odbudowa jest możliwa na podstawie danych parzystości przechowywanych w innych blokach).

W celu uzupełnienia dodatkowych technologii odzyskiwania bloków danych stosowanych w dyskach SSD klasy korporacyjnej firmy Kingston zaimplementowano także funkcje okresowego tworzenia punktów kontrolnych, cyklicznej kontroli nadmiarowości (CRC) oraz korekcji błędów ECC, które razem tworzą wewnętrzny kompleksowy zespół zabezpieczeń, gwarantujący integralność danych przesyłanych z hosta do pamięci flash i z powrotem do hosta. Kompleksowa ochrona danych oznacza, że integralność danych otrzymywanych z hosta jest sprawdzana podczas ich przechowywania w pamięci podręcznej dysku SSD oraz gdy są one zapisywane w pamięci NAND lub odczytywane z niej.

Podobnie jak dyski SSD klasy korporacyjnej, które zapewniają większą ochronę przed błędami bitowymi dzięki funkcji ECC, dyski SSD mogą również mieć wbudowane fizyczne układy wykrywające utratę zasilania i zarządzające kondensatorami magazynującymi energię w dyskach. Sprzętowe zabezpieczenie na wypadek utraty zasilania monitoruje zasilanie dysku SSD i w przypadku nagłej przerwy w zasilaniu udostępnia niewielką ilość energii zgromadzonej w kondensatorach, która wystarcza do zakończenia wszystkich oczekujących operacji zapisu przed całkowitym wyłączeniem dysku SSD. Układy zabezpieczające na wypadek utraty zasilania (PLP) są zwykle wymagane w zastosowaniach, w których utraconych danych nie można odzyskać w inny sposób.

Ochronę tego typu można także zintegrować z oprogramowaniem sprzętowym dysku SSD. Jest ona realizowana poprzez częste usuwanie danych z obszarów pamięci podręcznej kontrolera dysku SSD (np. jego tablicy Flash Translation Layer) i przenoszenie ich do pamięci NAND. Takie rozwiązanie nie zapewnia pełnej ochrony danych w wypadku utraty zasilania, jednak minimalizuje niebezpieczne konsekwencje takiego zdarzenia. Wbudowane w oprogramowanie sprzętowe zabezpieczenie na wypadek utraty zasilania ogranicza także prawdopodobieństwo uszkodzenia dysku SSD w wyniku wyłączenia awaryjnego.

W wielu sytuacjach zastosowanie rozwiązania Software Defined Storage lub klastrowania serwerów może ograniczyć potrzebę stosowania sprzętowych zabezpieczeń na wypadek utraty zasilania, ponieważ wszystkie dane są powielane na oddzielnych i niezależnych urządzeniach magazynujących w innym serwerze lub serwerach. Internetowe centra danych często rezygnują z zabezpieczenia na wypadek utraty zasilania, wykorzystując pamięć masową definiowaną programowo do serwerów RAID w celu przechowywania nadmiarowych kopii danych.

Wytrzymałość

Specjalista wskazuje sześciokąt na grafice z mozaiką sześciokątów i symbolami różnych koncepcji technologicznych, takich jak przetwarzanie w chmurze.

Możliwość niezawodnego przechowywania bitów danych w pamięci flash NAND, która jest używana w urządzeniach pamięci masowej flash, maleje z każdym cyklem programowania/kasowania (P/E) komórki pamięci flash NAND, aż do momentu, gdy bloki pamięci flash NAND nie są już w stanie niezawodnie przechowywać danych. Wtedy należy taki uszkodzony blok usunąć z puli pamięci dostępnej dla użytkownika, a jego adres logiczny (LBA) przypisać do nowego adresu fizycznego w macierzy pamięci masowej flash NAND. Nowy blok pamięci przejmujący funkcje niesprawnego bloku pochodzi z puli zapasowych bloków dostępnych na dysku SSD.

Ciągłe programowanie i kasowanie zawartości komórki powoduje liniowy wzrost wartości współczynnika BER, przez co w kontrolerach dysków SSD klasy korporacyjnej niezbędne jest zastosowanie złożonego zestawu technik zarządzania w celu odpowiedniego sterowania funkcjami komórek, by możliwe było niezawodne przechowywanie danych przez cały okres użytkowania dysku SSD.{{Footnote.N52083}}

Trwałość w zakresie programowania/kasowania danej pamięci flash NAND może znacząco się różnić, w zależności od procesu wytwarzania litograficznego oraz typu produkowanej pamięci flash NAND.

Typ pamięci flash NANDQLCTLCMLCSLC
Architektura 4 bity na komórkę 3 bity na komórkę 2 bity na komórkę 1 bit na komórkę
Pojemność Największa pojemność Większa pojemność Duża pojemność Najmniejsza pojemność
Trwałość (programowanie/kasowanie) Najmniejsza wytrzymałość Mniejsza wytrzymałość Średnia trwałość Najwyższa trwałość
Koszt $ $$ $$$ $$$$
Przybliżony współczynników błędów bitów pamięci NAND (BER) 10^4 10^4 10^7 10^9

Tabela 2. Typy pamięci flash NAND {{Footnote.N52084}}{{Footnote.N52085}}

Dyski SSD klasy korporacyjnej różnią się także od klienckich dysków SSD pod względem cyklu pracy. Dysk SSD klasy korporacyjnej musi być w stanie sprostać dużym obciążeniom związanym z odczytem lub zapisem, typowym dla serwera w centrum danych, który wymaga dostępu do danych 24 godziny na dobę przez 7 dni w tygodniu. Porównajmy to z dyskiem SSD klasy klienckiej, który jest zwykle w pełni wykorzystywany tylko przez 8 godzin dziennie.

Cykl pracy przewidziany dla dysków SSD klasy korporacyjnej to 24x7, natomiast dla dysków klienckich przewiduje się cykl pracy 20/80, czyli aktywność przez 20% czasu użytkowania komputera i 80% czasu w stanie bezczynności lub trybie uśpienia.

Zagadnienie wytrzymałości na zapis dowolnego rozwiązania lub dysku SSD jest złożone, dlatego organizacja JEDEC Committee zaproponowała także wprowadzenie miary trwałości w postaci liczby zapisanych terabajtów (Terabytes Written, TBW), która wskazuje, ile danych można zapisać na dysku SSD, zanim znajdująca się w nim pamięć flash NAND przestanie być niezawodna i konieczna będzie wymiana dysku.

Używając zaproponowanych przez organizację JEDEC metod testowania (dokument JESD218A) oraz obciążeń korporacyjnych (dokument JESD219), można łatwiej zinterpretować obliczenia dotyczące trwałości przedstawiane przez producentów dysków SSD. W tym celu należy użyć wartości TBW i ekstrapolować tę łatwiejszą do zrozumienia miarę na dowolne centrum danych.

Jak zauważono w dokumentach JESD218 i JESD219, obciążenia właściwe dla różnych klas aplikacji mogą również podlegać zwiększeniu o współczynnik wzmocnienia zapisu (WAF) – o rząd wielkości przewyższający rzeczywiste zapisy generowane przez hosta. Może to łatwo doprowadzić do niemożliwego do opanowania zużycia pamięci NAND Flash, wyższego współczynnika BER pamięci NAND Flash z powodu nadmiernej liczby zapisów w czasie i spowolnienia działania wskutek dużego rozproszenia nieprawidłowych stron na dysku SSD.

Choć wskaźnik TBW jest istotnym miernikiem w porównaniu dysków SSD klasy korporacyjnej i klienckiej, pozostaje jedynie modelem oceny wytrzymałości na poziomie pamięci flash NAND. Średni czas bezawaryjnej pracy (The Mean Time Between Failure, MTBF) należy traktować jako model prognozowania wytrzymałości i niezawodności na poziomie komponentów, w oparciu o niezawodność komponentów wykorzystanych w urządzeniu. Od komponentów dysków SSD klasy korporacyjnej należy oczekiwać trwałości i lepszego zarządzania wartościami napięcia w całej pamięci flash NAND przez cały okres planowanego użytkowania dysku. Wskaźnik MTBF dla dowolnego dysku SSD klasy korporacyjnej powinien wynosić co najmniej milion godzin, czyli ponad 230 lat! Firma Kingston konserwatywnie ocenia parametry techniczne swoich dysków SSD. Inni producenci często podają wyższe wartości MTBF, jednak należy pamiętać, że 2 miliony godzin to więcej niż wystarczająca liczba dla dysków SSD klasy korporacyjnej.

Technologia monitorowania i raportowania S.M.A.R.T. stosowana w dyskach SSD klasy korporacyjnej umożliwia łatwiejsze przewidywanie awarii urządzenia i prognozowanie czasu eksploatacji na podstawie aktualnego współczynnika zwiększenia natężenia zapisu (WAF) i poziomu zużycia. Często obsługiwane są także predykcyjne ostrzeżenia przed awarią wskutek takich czynników, jak utrata zasilania, błędy bitowe w interfejsie fizycznym czy nierównomierne zużycie pamięci. W celu określenia stanu posiadanego dysku SSD można pobrać ze strony internetowej Kingston program narzędziowy Kingston SSD Manager.

Klienckie dyski SSD mogą oferować tylko minimalne możliwości technologii S.M.A.R.T. służące do monitorowania dysku SSD w trakcie typowego użytkowania lub po wystąpieniu awarii.

W zależności od klasy i pojemności dysku SSD może być przydzielana większa rezerwowa pojemność pamięci flash NAND, która będzie pełnić funkcję zapasowych bloków pamięci (OP). Pojemność zapasowych bloków pamięci jest niewidoczna dla użytkownika i systemu operacyjnego. Mogą być one wykorzystywane jako tymczasowy bufor umożliwiający utrzymanie wyższej stałej wydajności albo jako zamiennik uszkodzonych komórek pamięci flash w celu zwiększenia niezawodności i wytrzymałości dysku SSD (przy użyciu większej liczby zapasowych bloków).

Podsumowanie

Istnieją znaczące różnice między dyskami SSD klasy korporacyjnej i klienckiej, związane m.in. z wytrzymałością pamięci flash NAND na cykle programowania/kasowania, a także wykorzystaniem złożonych technik zarządzania w celu dostosowania do różnych obciążeń.

Znajomość różnic między dyskami różnych klas może istotnie pomóc w zarządzaniu ryzykiem przestojów w wymagających środowiskach korporacyjnych (często o krytycznym znaczeniu) i ograniczeniu go do minimum.

Aby uzyskać odpowiedź na dalsze pytania lub dowiedzieć się więcej o dyskach SSD Kingston klasy korporacyjnej, skontaktuj się z przedstawicielem firmy Kingston, zespołem programu Zapytaj eksperta lub skorzystaj z czatu pomocy technicznej.

Powiązane filmy

Powiązane artykuły