Сравнение твердотельных накопителей (SSD) корпоративного и клиентского уровня

Все большее количество корпоративных центров обработки данных (ЦОД), требующих высокой пропускной способности и низкой задержки транзакций, которые ранее использовали жесткие диски (HDD), теперь сталкиваются с задержкой в производительности и переходят на использование твердотельных накопителей (SSD), представляющих собой современное решение для повышения производительности, эффективности и надежности ЦОД, а также для снижения эксплуатационных расходов.

Чтобы определить разницу между различными классами SSD, необходимо разобраться в двух основных компонентах SSD: контроллере флеш-накопителя (контроллере SSD) и энергонезависимой флеш-памяти NAND, используемой для хранения данных.

На современном рынке использование SSD и флеш-памяти NAND разделено на три основные группы:
  • Потребительские устройства (планшеты, камеры, мобильные телефоны),
  • Клиентские системы (нетбуки, ноутбуки, ультрабуки, моноблоки, настольные персональные компьютеры), встроенные/промышленные системы (игровые терминалы, специализированные системы, цифровые вывески)
  • Корпоративные вычислительные платформы (HPC, серверы ЦОД).

Однако выбор нужного устройства SSD для корпоративных ЦОД может быть долгим и сложным процессом, который будет включать в себя изучение и оценку множества различных поставщиков и типов SSD, поскольку не все накопители и типы флеш-памяти NAND одинаковы.

Накопители SSD призваны стать заменой или дополнением для жестких дисков (HDD) на основе вращающихся магнитных пластин и имеют различные форм-факторы (в том числе 2,5 дюйма) и коммуникационные протоколы/интерфейсы (например, Serial ATA (SATA) и Serial Attached SCSI (SAS)) для передачи данных из центрального процессора сервера.

Однако простота установки не гарантирует пригодность всех SSD для долгосрочного использования в корпоративных средах, для которых они выбираются; убытки от неправильного выбора SSD часто могут свести к нулю все начальную выгоду от экономии и роста производительности – накопители SSD могут преждевременно выйти из строя из-за избыточного количества операций записи, их постоянная скорость записи может значительно снизиться в течение ожидаемого срока службы или увеличить задержки в массиве накопителей, что приведет к их преждевременной замене.

Мы рассмотрим три основных параметра, отличающие SSD корпоративного и клиентского класса, чтобы помочь вам сделать правильный выбор при замене или добавлении дополнительных накопителей для корпоративного ЦОД.

Производительность

Благодаря использованию многоканальной архитектуры и параллельному доступу контроллера SSD к кристаллам NAND накопители SSD могут обеспечивать высочайшую скорость чтения и записи, как для последовательных, так и для случайных запросов данных из процессора.

В типичном сценарии использования ЦОД, включающем миллионы байт произвольных данных компании, в том числе совместные технические чертежи CAD, сейсмические данные для анализа (обработка больших объемов данных) или доступ к клиентским данным по всему миру для банковских транзакций, доступ к устройствам хранения должен осуществляться с минимальными задержками и может выполняться большим количеством клиентских устройств, которым нужен одновременный доступ к одинаковым данным без снижения скорости работы. Удобство пользователя обеспечивается низкой задержкой, повышающей продуктивность пользователя.

В случае клиентского использования доступ осуществляется одним пользователем или приложением; разность между минимальным и максимальным временем отклика (латентность) может быть больше для любых действий пользователя или системы.

На комплексные массивы накопителей, использующие SSD (например, сетевые хранилища, системы хранения с прямым подключением или сети хранения данных), негативное влияние оказывает несоответствие производительности, которое может привести к значительному повышению задержек массивов накопителей, снижению средней производительности и качества обслуживания, в восприятии пользователя.

В отличие от клиентских SSD, накопители SSD Kingston корпоративного уровня оптимизированы не только для пиковой производительности в течение первых нескольких секунд доступа; используя большую избыточную область, они также обеспечивают повышенную среднюю стабильную производительность в течение долгих периодов времени. Подробную информацию о конкретных накопителях можно найти на веб-сайте Kingston в разделе "Корпоративные SSD".{{Footnote.N48213}}

Это гарантирует постоянство производительности массива накопителей для организаций, ожидающих высокое качество обслуживания в течение периодов пиковой нагрузки.

Надежность

Флеш-памяти NAND свойственны некоторые ограничения: двумя самыми важными являются предельный расчетный срок службы (флеш-ячейка NAND изнашивается при повторной записи) и вероятность естественных ошибок.

В процессе производства флеш-памяти NAND каждый кристалл NAND вырезается из кремниевого листа и характеризуется исходной частотой ошибочных битов (BER или RBER).

BER определяет частоту возникновения естественных битовых ошибок флеш-памяти NAND без участия кода коррекции ошибок, которые контроллер SSD исправляет с помощью немедленной коррекции Advanced ECC (обычно называемой производителями контроллеров SSD коррекцией ошибок BCH ECC, Strong ECC или LDPC), не влияющей на доступ пользователя или системы.

Способность контроллеров SSD исправлять такие битовые ошибки может выражаться как коэффициент неисправляемых битовых ошибок (UBER) – “показатель искажения данных, равный количеству ошибок данных на чтение битов после применения определенного метода коррекции ошибок”. {{Footnote.N48213}}

В документах ассоциации отраслевых стандартов JEDEC от 2010 года JESD218A: "Требования к твердотельным накопителям (SSD) и способ тестирования надежности" и JESD219: "Нагрузки на твердотельные накопители (SSD), обеспечивающие надежность" указано и стандартизировано отличие накопителей корпоративного и клиентского уровня по множеству параметров, в том числе по способности выдерживать повышенные нагрузки записи, более экстремальные условия окружающей среды и восстановления с более высокой BER, по сравнению с клиентскими SSD.{{Footnote.N52081}}{{Footnote.N52082}}

Класс примененияНагрузка (см. JESD219)Активное использование (питание вкл.)Экономное использование (питание откл.)Требования по UBER
Клиентские Клиентские 40° C 8 ч/день 30° C 1 год ≤10 -15
Для организаций Для организаций 55° C 24 ч/день 40° C 24 ч/день ≤10 -16

Таблица 1 - JESD218A: Методика тестирования требований и надежности твердотельных накопителей (SSD)
© JEDEC. Воспроизведено по разрешению JEDEC.

В соответствии с предложенным JEDEC показателем UBER для SSD корпоративного уровня ожидается появление 1 невосстанавливаемой битовой ошибки с частотой 1 битовая ошибка на каждые обработанные 10 квадриллионов бит (~1,11 петабайт), при 1 битовой ошибке на каждый 1 квадриллион бит (~0,11 петабайт) для клиентских SSD.

SSD Kingston корпоративного уровня также имеют дополнительные технологии, обеспечивающие восстановление поврежденных блоков с помощью данных о чётности, хранящихся в других кристаллах NAND (как в массивах RAID, это позволяет восстанавливать определенные блоки, которые можно воссоздать с помощью данных о четности, хранящихся в других блоках).

Для дополнения технологий восстановления блоков данных, встроенных в корпоративные SSD Kingston, для обеспечения целостности данных при передаче от хоста к флеш-памяти и обратно также используется внутренняя схема сквозной защиты с периодическим созданием контрольных точек и циклической проверкой с избыточностью (CRC). Сквозная защита данных означает, что данные, получаемые из хоста, проверяются на целостность при хранении во внутреннем кэше SSD, а затем записываются или считываются из областей хранения NAND.

Наряду с расширенной защитой ECC от битовых ошибок в SSD корпоративного класса, SSD также могут содержать физическую электронику для распознавания отключения питания, управляющую конденсаторами хранения питания SSD. Поддержка защиты от сбоев питания в оборудовании контролирует входное питание SSD и в случаях внезапного отключения питания предоставляет электронике SSD временное питание с помощью танталовых конденсаторов, чтобы завершить все внутренние и внешние операции записи до отключения питания SSD. Электроника защиты от сбоев питания обычно требуется для приложений, в которых восстановление данных невозможно.

Защита от сбоев питания также может использоваться через встроенное ПО SSD с помощью частой записи данных в области кэша контроллера SSD (например, в таблицу FTranslation Layer) на накопитель NAND – это не гарантирует сохранность всех данных при сбое питания, но уменьшает эффект от небезопасного отключения питания. Защита от сбоев питания во встроенном ПО также гарантирует, что SSD сломается после небезопасного отключения. 

Во многих ситуациях использование программно определяемого хранилища (Software Defined Storage) или кластеринг сервера могут снизить потребность аппаратной поддержки защиты от сбоев питания, потому что все данные реплицируются в отдельное независимое устройство накопления на другом сервере или серверах. ЦОД Web-scale часто предпочитают поддержке защиты от сбоев питания с помощью Software Defined Storage использование RAID-серверов для хранения избыточных копий одинаковых данных.

Длительный срок службы

Все типы флеш-памяти NAND, содержащиеся во флеш-устройствах хранения, постепенно теряют способность надежного хранения данных с каждым циклом программирования-стирания ячейки флеш-памяти NAND и достигают состояния, при котором надежное хранение данных невозможно; после этого необходимо деградировавший или испорченный блок удаляется из пула хранения данных. Логический адрес блока (LBA) при этом перемещается на другой физический адрес в массиве флеш-накопителей NAND. Новый блок накопителя заменяет неисправный с помощью пула запасных блоков (Spares Block), являющегося частью резервной области (Over Provisioned, OP) SSD.

Поскольку программирование или стирание данных ячейки происходит постоянно, BER линейно возрастает; по этой причине необходимо использовать в контроллере корпоративного SSD набор комплексных методов управления для обеспечения возможности надежного хранения данных в ячейке на протяжении всего ожидаемого срока службы SSD.{{Footnote.N52083}}

Количество допустимых циклов программирования-стирания (P/E) конкретной флеш-памяти может значительно варьироваться в зависимости от литографического процесса производства и изготавливаемого типа флеш-памяти NAND.

Тип флеш-памяти NANDTLCMLCSLC
Архитектура 3 бита на ячейку 2 бита на ячейку 1 бит на ячейку
Емкость Самая большая емкость Большая емкость Малая емкость
Срок службы (P/E) Малый срок службы Средний срок службы Самый высокий срок службы
Стоимость $ $$ $$$$
Приблизит. частота ошибочных битов NAND (BER) 10^4 10^7 10^9

Таблица 2 – Типы флеш-памяти NAND {{Footnote.N52084}}{{Footnote.N52085}}

Корпоративные SSD отличаются от клиентских SSD и по циклу нагрузки. SSD корпоративного класса должны выдерживать высокую нагрузку по чтению или записи в условиях, типичных для сервера ЦОД, требующего доступа к данным в течение 24 часов ежедневно, по сравнению с SSD клиентского класса, которые обычно используются полностью только 8 часов в день. Корпоративные SSD имеют цикл нагрузки 24x7, в отличие от клиентских SSD с циклом нагрузки 20/80 (20% времени активны, 80% в режиме ожидания или сна при использовании компьютера).

Расчет надежности при записи для любой области применения или накопителя SSD может быть сложным, поэтому комитет JEDEC также предложил показатель измерения надежности, использующий значение общего объема записанных данных хоста в терабайтах (TBW), для указания количества данных, которое может быть записано на SSD до того, как содержащаяся в нем флеш-память NAND станет малонадежной, и накопитель потребует замены.

С помощью предложенных JEDEC способов тестирования JESD218A и нагрузок для накопителей корпоративного класса JESD219 удобнее оценивать расчеты срока службы SSD, представленные производителями в TBW, и экстраполировать более наглядный показатель надежности, который можно применить к любому ЦОД.

Как отмечается в документах JESD218 и JESD219, нагрузки различных классов областей применения также подвергаются воздействию коэффициента увеличения объема записи (WAF), благодаря которому количество операций записи выше, чем действительное количество, отправленное хостом, что быстро приводит к неуправляемому износу флеш-памяти NAND, повышенной BER флеш-памяти NAND из-за избыточных операций записи в течение долгого времени и сниженной производительности из-за большого количества недействительных страниц на SSD.

Несмотря на то, что TBW является важным параметром, отличающим SSD корпоративного и клиентского классов, TBW – это модель оценки срока службы на уровне флеш-памяти NAND; для модели оценки срока службы и надежности уровня компонентов для компонентов, используемых в устройстве, применяется параметр "средняя наработка на отказ" (MTBF). Оценка срока службы компонентов накопителей SSD корпоративного класса учитывает превышение по сроку службы и повышенную нагрузку при управлении напряжением для всей флеш-памяти NAND в течение всего ожидаемого срока службы SSD. Все корпоративные SSD должны иметь показатель MTBF не менее миллиона часов, что эквивалентно более чем 114 годам! Kingston очень консервативно оценивает свои SSD, и можно часто видеть более высокие характеристики MTBF для SSD; важно заметить, что 1 миллиона часов более чем достаточно для корпоративных SSD.

Система контроля и отчетности S.M.A.R.T. накопителей SSD корпоративного уровня позволяет с легкостью определять состояние устройства, предшествующее неисправности, на основании коэффициента увеличения объема записи (WAF) и уровня износа. Также система часто поддерживает предупредительные сообщения, предшествующие неисправности, например, сообщения об отключении питания, о битовых ошибках, произошедших из-за физического интерфейса, или о неравномерном распределении износа. С веб-сайта Kingston можно загрузить утилиту Kingston SSD Manager и использовать ее для просмотра состояния накопителя.

Накопители SSD клиентского класса могут иметь только минимальные функции вывода S.M.A.R.T. для контроля SSD при стандартном использовании или после возникновения неисправности.

В зависимости от класса области применения и емкости SSD может выделяться расширенная резервная емкость флеш-памяти NAND. Резервная емкость скрыта от доступа пользователя и операционной системы и может использоваться как временный буфер записи для повышения усредненной производительности, а также в качестве замены дефектных ячеек флеш-памяти в течение ожидаемого срока службы SSD для увеличения надежности и срока службы SSD (с повышенным количеством запасных блоков).

Заключение

Существуют значительные различия между накопителями SSD корпоративного и клиентского классов: от количества циклов программирования-стирания флеш-памяти NAND до комплексных методов управления для соответствия нагрузкам различных классов областей применения.

Понимание таких различий в классах областей применения и их связи с производительностью, надежностью и сроком службы может способствовать минимизации рисков простоев, а также управлению такими рисками в ответственных и критически важных корпоративных средах. Дополнительные вопросы можно задать вашему представителю Kingston или воспользоваться для этого функцией "Обратитесь к специалисту" или чатом со службой технической поддержки на Kingston.com.