Pamięć
Dyski półprzewodnikowe
Pamięci USB
Karty flash
Pomoc techniczna
Wyszukiwanie pamięci

Najlepsze rozwiązania

Porównanie korporacyjnych i klienckich dysków SSD

W coraz większej liczbie korporacyjnych centrów danych, w których wymagana jest wysoka przepustowość przesyłania danych oraz małe opóźnienia wykonywania transakcji, opartych na tradycyjnych dyskach twardych (HDD) występują wąskie gardła wydajności. W związku z tym ich operatorzy rozważają użycie dysków półprzewodnikowych (SSD) jako pamięci masowej w celu zwiększenia wydajności, efektywności i niezawodności centrów danych oraz zmniejszenia ogólnych kosztów utrzymania (OpEx).

Na początku rozważań na temat różnic między klasami dysków SSD należy rozróżnić dwa kluczowe komponenty dysku SSD, czyli procesor pamięci masowej flash oraz nieulotną pamięć flash NAND służącą do przechowywania danych.

W dniu obecnym dyski SSD i pamięci flash NAND są używane w trzech głównych grupach produktów; urządzenia konsumenckie (tablety, aparaty fotograficzne, telefony komórkowe), urządzenia klienckie (netbooki, notebooki, ultrabooki, AIO, osobiste komputery stacjonarne), rozwiązania osadzone/przemysłowe (kioski z grami) oraz korporacyjne (środowiska HPC, serwery w centrach danych). • Jednak wybieranie urządzenia pamięci masowej SSD, które będzie odpowiednie dla korporacyjnego centrum danych, może być długim i skomplikowanym procesem obejmującym poznanie specyfikacji i dokonanie kwalifikacji produktów różnych typów pochodzących od różnych producentów. Jest to spowodowane tym, że w rzeczywistości nie wszystkie dyski SSD i pamięci flash NAND są sobie równe.

Dyski SSD są produkowane w taki sposób, aby można je było z łatwością wdrażać jako zamienniki lub uzupełnienie dysków twardych (HDD) wyposażonych w obrotowe talerze magnetyczne. Są one dostępne w obudowach o różnych rozmiarach, w tym 2,5 cala, i obsługują różne protokoły komunikacyjne/interfejsy, w tym Serial ATA (SATA) i Serial Attached SCSI (SAS), umożliwiające przesyłanie danych do i z procesorów serwera.

Jednak łatwość wdrażania nie stanowi gwarancji, że wszystkie dyski SSD będą nadawać się do długotrwałej eksploatacji w zastosowaniach korporacyjnych. Koszty wyboru nieodpowiednich dysków SSD często mogą przekroczyć początkowe oszczędności i zminimalizować korzyści wynikające ze wzrostu wydajności, ponieważ takie dyski mogą zużywać się przedwcześnie z powodu dużej liczby operacji zapisu, oferować znacznie niższą od oczekiwanej ciągłą wydajność zapisywania danych w okresie eksploatacji albo wprowadzać dodatkowe opóźnienia do działania macierzy, co z kolei spowoduje szybką konieczność ich wymiany.

W tym artykule zostaną omówione trzy główne cechy odróżniające od siebie korporacyjne i klienckie dyski SSD. Te informacje pomogą podjąć odpowiednie decyzje dotyczące zakupu, gdy nadejdzie czas wymiany lub rozbudowy pamięci masowej korporacyjnego centrum danych.

Wydajność

Dyski SSD mogą oferować niesamowicie wysoką wydajność zapisu i odczytu, zarówno sekwencyjnego, jak i losowego, dzięki wykorzystaniu wielokanałowej architektury i równoległego dostępu do segmentów pamięci flash NAND przez procesor FSP.

W typowych scenariuszach działania centrum danych, które obejmują przetwarzanie milionów bajtów losowo wybieranych danych, w tym pracę grupową nad technicznymi rysunkami CAD, analizowanie wielkich bloków danych (np. Big Data) lub uzyskiwanie dostępu do danych klientów na całym świecie w celu obsługi transakcji bankowych (np. OLTP), urządzenia pamięci masowej muszą być dostępne z jak najmniejszym opóźnieniem i muszą obsługiwać dużą liczbę klientów, którzy potrzebują jednoczesnego dostępu do tych samych danych, bez wydłużenia czasów odpowiedzi.

Zastosowanie klienckie będzie obejmować dostęp jednego użytkownika lub aplikacji, przez co akceptowalne stają się większe różnice między minimalnym a maksymalnych czasem reakcji na dowolną akcję użytkownika lub systemu.

Negatywny wpływ na złożone macierze pamięci masowej, w których są używane dyski SSD (np. Network Attached Storage, Direct Attached Storage lub Storage Area Network), ma także niedopasowanie dysków pod względem wydajności, co może spowodować lawinowy wzrost opóźnień w macierzy pamięci masowej, spadek stałej wydajności, a w konsekwencji spadek ogólnej jakości usługi.

W przeciwieństwie do klienckich dysków SSD, oferowane przez firmę Kingston dyski SSD klasy korporacyjnej, takie jak dysk półprzewodnikowy E100, są zoptymalizowane nie tylko pod kątem szczytowej wydajności w ciągu kilku pierwszych sekund dostępu do danych, ale dzięki wykorzystaniu większego obszaru dodatkowych bloków pamięci (OP) oferują także wyższą stałą wydajność w dłuższych okresach czasu. [1]

Stanowi to gwarancję, że wydajność macierzy pamięci masowej będzie zgodna z oczekiwaniami organizacji w zakresie jakości usługi w okresach szczytowego obciążenia.

Niezawodność

Z pamięcią flash NAND wiąże się kilka problemów, z których dwa najważniejsze to skończony oczekiwany czas eksploatacji oraz współczynnik naturalnie występujących błędów.

W trakcie procesu produkcji pamięci flash NAND każdy segment pamięci flash NAND jest testowany i opisywany za pomocą współczynnika błędów bitów (BER lub RBER).

Współczynnik BER określa, ile naturalnie występujących błędów bitów w pamięci flash NAND może wystąpić przed wygenerowaniem kodu korekcji błędu (Error Correction Code, ECC), które procesor FSP poprawia używając na bieżąco zaawansowanej korekcji ECC bez przerywania dostępu do danych użytkownika lub systemu.

Możliwości procesorów pamięci masowej flash (Flash Storage Processor, FSP) w zakresie korekcji tych błędów bitów można określić za pomocą współczynnika niekorygowalnych błędów bitów (Uncorrectable Bit Error Ratio, UBER), który jest „miarą współczynnika uszkodzenia danych równą liczbie błędów danych na odczyt bitu po zastosowaniu określonej metody korekcji błędów”. [2]

Zgodnie z definicją i standardem określonym przez organizację JEDEC Committee w 2010 roku w dokumentach JESD218A:Solid State Drive (SSD) Requirements and Endurance Test Method (JESD218A:Wymagania dotyczące dysków półprzewodnikowych [SSD] oraz metoda testowania trwałości) i JESD219:Solid State Drive (SSD) Endurance Workloads (JESD219:Obciążenia do testowania trwałości dysków półprzewodnikowych [SSD]), dyski SSD klasy korporacyjnej różnią się od klienckich dysków SSD pod wieloma względami, w tym m.in. obsługują większe obciążenia operacjami zapisu, wytrzymują trudniejsze warunki środowiskowe i umożliwiają odzyskiwanie danych przy wyższych współczynnikach BER. [3] [4]

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

Tabela 1. JESD218A:Wymagania dotyczące dysków półprzewodnikowych (SSD) oraz metoda testowania trwałości Copyright JEDEC. Reprodukcja za zgodą organizacji JEDEC.

Zgodnie z zaproponowanym przez organizację JEDEC wymaganiem dotyczącym współczynnika UBER dla korporacyjnych i klienckich dysków SSD, na dysku SSD klasy korporacyjnej może wystąpić tylko 1 nieodzyskiwalny błąd bitu przy 1 błędzie bitu na każde 10 kwadrylionów przetworzonych bitów (~1,11 petabajtów), a na klienckim dysku SSD przy 1 błędzie bitu na każdy 1 kwadrylion przetworzonych bitów (~0,11 petabajtów).

W dyskach SSD klasy korporacyjnej można stosować dodatkowe metody ochrony, w tym technologię nadmiarowej macierzy niezależnych elementów krzemowych (Redundant Array of Independent Silicon Elements [R.A.I.S.E. ]) dostępną w kontrolerach LSI® SandForce®, ponieważ jest w nich stosowana rozłożona parzystość w segmentach pamięci flash NAND, która umożliwia poprawne działanie w warunkach, gdy procesor FSP nie jest w stanie za pomocą metody ECC odzyskać danych po błędzie bitu. Technologia R.A.I.S.E. ™ może efektywnie obniżyć wartość współczynnika UBER do 1 błędu bitu na każde 100 oktylionów przetworzonych bitów (10-29 lub ~111022302462515,66 petabajtów), a więc wartość wskaźnika UBER będzie prawie 1 kwadrylion razy mniejsza niż w przypadku standardowego dysku SSD. [5]

W celu uzupełnienia technologii R.A.I.S.E. ™ w dyskach SSD E100 firmy Kingston zaimplementowano także funkcję okresowego tworzenia punktów kontrolnych oraz kompleksowy schemat ochrony wewnętrznej oparty na cyklicznej kontroli nadmiarowości (Cyclic Redundancy Check, CRC), co gwarantuje integralność danych przesyłanych z hosta do pamięci flash i z powrotem do hosta.

Dyski SSD klasy korporacyjnej powinny także zawierać, oprócz zaawansowanej ochrony przed błędami bitów za pomocą technologii ECC, elektronikę sterującą wyposażoną w logikę wykrywania utraty zasilania (odpowiednik funkcji obsługi utraty zasilania w dyskach E100 firmy Kingston) służącą do monitorowania dostarczanego zasilania i tymczasowego zasilania pamięci za pomocą kondensatorów tantalowych w przypadku utraty zasilania, co umożliwi ukończenie realizowanych na żądanie wewnętrzne lub zewnętrzne operacji zapisu.

Wytrzymałość

Możliwość niezawodnego przechowywania bitów danych w pamięci flash NAND, która jest używana w urządzeniach pamięci masowej flash, maleje z każdym cyklem programowania/kasowania (P/E) komórki pamięci flash NAND, aż do momentu, gdy komórka pamięci flash NAND nie jest w stanie niezawodnie przechowywać danych. Wtedy należy tę komórkę usunąć z puli pamięci masowej dostępnej dla użytkownika, a jej adres logiczny przenieść do nowego adresu fizycznego w macierzy pamięci masowej flash NAND.

Ciągłe programowanie lub kasowanie komórki powoduje liniowy wzrost wartości współczynnika BER, przez co w procesorach FSP dysków SSD klasy korporacyjnej wymagana jest implementacja złożonego zestawu technik zarządzania, które będą używane do sterowania możliwościami komórek pamięci w zakresie niezawodnego przechowywania danych przez cały oczekiwany okres eksploatacji dysku SSD. [6]

Trwałość w zakresie programowania/kasowania danej pamięci flash NAND może znacząco się różnić, w zależności od procesu wytwarzania litograficznego oraz typu produkowanej pamięci flash NAND.

Typ pamięci flash NAND TLC MLC e-MLC SLC
Architektura 3 bity na komórkę 2 bity na komórkę 2 bity na komórkę 1 bit na komórkę
Pojemność Największa pojemność Duża pojemność Duża pojemność Najmniejsza pojemność
Trwałość (programowanie/kasowanie) Najniższa trwałość Średnia trwałość Wysoka trwałość Najwyższa trwałość
Koszt $ $$ $$$ $$$$
Przybliżony współczynników błędów bitów pamięci NAND (BER) 10^4 10^7 10^8 10^9

Tabela 2. Typy pamięci flash NAND [6] [7] [8] [9]

Pamięci flash NAND z wielopoziomowymi komórkami (e-MLC) klasy korporacyjnej, które są używane w dyskach SSD klasy korporacyjnej E100 firmy Kingston, działają podobnie do popularnych pamięci flash NAND MLC, ale spełniają dodatkowe wymagania w zakresie doboru i kwalifikacji, dzięki czemu umożliwiają osiągnięcie wyższej trwałości przy programowaniu/kasowaniu (P/E) i niższych współczynników BER niż standardowe pamięci MLC używane w klienckich dyskach SSD.

Dyski SSD klasy korporacyjnej muszą być w stanie obsługiwać bardzo duże obciążenie operacjami zapisu w scenariuszach typowych dla serwerów w centrach danych, a więc obsługi żądań dostępu do danych przez 24 godziny na dobę i 7 dni w tygodniu. Z kolei klienckie dyski SSD zazwyczaj są w pełni wykorzystywane tylko przez 8 godzin w ciągu dnia. Dlatego też pamięci e-MLC idealnie nadają się do zastosowania w dyskach o wysokiej wydajności, pojemności i trwałości.

Zagadnienie trwałości w zakresie zapisu dla dowolnego rozwiązania lub dysku SSD jest złożone, więc organizacja JEDEC Committee zaproponowała także wprowadzenie miary trwałości w postaci wartości Liczba zapisanych Terabajtów (TeraBytes Written, TBW), która wskazuje, ile danych można zapisać na dysku SSD, zanim znajdująca się w nim pamięć flash NAND przestanie być niezawodna i trzeba będzie wymienić dysk.

Używając zaproponowanych przez organizację JEDEC metod testowania (dokument JESD218A) oraz obciążeń korporacyjnych (dokument JESD219), można łatwiej zinterpretować obliczenia dotyczące trwałości przedstawiane przez producentów dysków SSD. W tym celu należy użyć wartości TBW i ekstrapolować tę łatwiejszą do zrozumienia miarę na dowolne centrum danych.

Według informacji podanych w dokumentach JESD218 i JESD219 negatywny wpływ na aplikacje różnych klas może też mieć współczynnik zwiększenia natężenia zapisu (Write Amplification Factor, WAF), gdy faktyczna liczba operacji zapisu jest większa niż liczba operacji zapisu żądanych przez hosta, co prowadzi do coraz większego zużycia pamięci flash NAND, wyższego współczynnika BER pamięci flash NAND związanego z większą niż przewidywana liczbą operacji zapisu wykonywanych z biegiem czasu oraz niższej wydajności powodowanej przez rozłożenie na dysku SSD coraz większej liczby nieprawidłowych stron. Działający na bieżąco mechanizm kompresji używany w dyskach E100 firmy Kingston, w których jest stosowana technologia LSI® SandForce® DuraWrite™, zmniejsza ogólną wartość współczynnika WAF i zwiększa trwałość pamięci flash NAND w zastosowaniach klasy korporacyjnej.

Współczynnik TBW stanowi ważny element odróżniający korporacyjne dyski SSD od klienckich dysków SSD, współczynnik TBW stanowi wyłącznie model przewidywania poziomu trwałości pamięci flash NAND, a wartość średniego czasu międzyawaryjnego (Mean Time Between Failure, MTBF) należy traktować jako model przewidywania trwałości i niezawodności na poziomie komponentu dotyczący komponentów wchodzących w skład danego urządzenia. Od komponentów dysków SSD klasy korporacyjnej należy oczekiwać trwałości i lepszego zarządzania napięciami w całej pamięci flash NAND przez cały okres planowanej eksploatacji dysku.

Technologia monitorowania i raportowania S.M.A.R.T. stosowana w dyskach SSD klasy korporacyjnej umożliwia urządzeniu łatwiejsze przewidywanie awarii i prognozowanie czasu eksploatacji na podstawie aktualnego współczynnika zwiększenia natężenia zapisu i poziomu zużycia. Często są także obsługiwane ostrzeżenia zgłaszane przed wystąpieniem awarii, takiej jak utrata zasilania, błędy bitów występujące w interfejsie fizycznym lub nierównomierne zużycie pamięci.

Klienckie dyski SSD mogą oferować tylko minimalne możliwości technologii S.M.A.R.T. służące do monitorowania dysku SSD w trakcie typowego użytkowania lub po wystąpieniu awarii.

W zależności od klasy i pojemności dysku SSD może być przydzielana większa rezerwowa pojemność pamięci flash NAND, która będzie pełnić funkcję zapasowych bloków pamięci (OP). Pojemność zapasowych bloków pamięci jest niewidoczna dla użytkownika i systemu operacyjnego i może być używana jako tymczasowy bufor umożliwiający utrzymanie wyższej ciągłej wydajności albo jako zamiennik uszkodzonych komórek pamięci flash w celu zwiększenia niezawodności i trwałości dysku SSD.

Podsumowanie

Istnieją znaczące różnice między korporacyjnymi i klienckimi dyskami SSD dotyczące m.in. trwałości pamięci flash NAND w zakresie cykli programowania/kasowania oraz implementacji złożonych technik zarządzania dostosowanych do różnych obciążeń.

Znajomość różnic między dyskami z różnych klas w zakresie wydajności, niezawodności i trwałości może znacznie pomóc w minimalizowaniu ryzyka występowania przestojów w wymagających, a często też mających znaczenie krytyczne, środowiskach korporacyjnych oraz zarządzania tym ryzykiem.