Memoria
Unidades de estado sólido
Unidades USB
Tarjetas Flash
Asistencia técnica
Búsqueda de módulos de memoria

Información general

Las unidades SSD de clase empresarial frente a las de cliente

Cada vez más centros de datos empresariales que requieren una alta capacidad de proceso y baja latencia de las transacciones y que antes confiaban en las unidades de disco duro (HDD) en sus servidores para operar, ahora se están topando con problemas de rendimiento y están contemplando la opción que representan las unidades de disco de estado sólido (SSD) como una solución de almacenamiento más viable que permite aumentar el rendimiento, la eficacia y la fiabilidad de su centro de datos, además de reducir los gastos operativos generales (OpEx).

Para empezar a entender las diferencias entre las clases de las unidades de SSD debemos distinguir los dos componentes clave que las conforman, el procesador de almacenamiento flash y la memoria flash no volátil basada en NAND que se usa para almacenar los datos.

En el mercado de hoy en día, el consumo de las unidades de SSD y de las memorias flash basadas en NAND se divide en tres grupos principales: dispositivos del consumidor final (tabletas, cámaras, teléfonos móviles), cliente (todo tipo de ordenadores portátiles, AIO y ordenadores personales de sobremesa), equipos subordinados/industriales (quiosco del ocio) e informática de la empresa (HPC y servidores de centros de datos).

Escoger el dispositivo de SSD de almacenamiento adecuado para centros de datos empresariales puede, sin embargo, ser un proceso largo y pesado a base de obtener información y calificar a los muchos proveedores de unidades de SSD diferentes y tipos de productos, puesto que no todas las unidades SSD y de memoria flash basadas en NAND se han creado del mismo modo.

Las unidades de SSD están hechas para que puedan implementarse de un modo fácil bien como elemento sustitutivo bien como disco magnético de rotación complementario basado en unidades de disco duro (HDD), y están disponibles en diferentes formatos, incluidos los de 2,5”, y protocolos de comunicación/interfaces, entre los que se incluyen Serial ATA (SATA) y Serial Attached SCSI (SAS) para transferir datos a y desde la unidad de procesamiento central (CPU) del servidor.

Que sean fácil de implementar, no obstante, no garantiza que todas las unidades SSD serán adecuadas a largo plazo para la empresa en la que se implementaron, y el coste de elegir la unidad de SSD incorrecta puede, a menudo, invalidar cualquier ahorro inicial y ventajas de rendimiento obtenidas cuando las SSD se desgasten de manera prematura debido al número excesivo de escrituras de datos, alcanzar un rendimiento de escritura sostenido bastante menor al ciclo de vida estimado o introducir latencia adicional en la matriz de almacenamiento y, por tanto, tener que sustituirla prematuramente.

En este documento vamos a ver las tres cualidades principales que distinguen una unidad SSD de clase empresarial de una SSD de cliente para ayudarle a tomar la decisión de compra más adecuada cuando llegue la hora de sustituir o de añadir más almacenamiento a su centro de datos empresarial.

Rendimiento

A través del uso de la arquitectura de multicanales y del acceso paralelo desde el FSP a los modelos flash basados en NAND, las unidades de SSD pueden proporcionar un rendimiento de lectura y escritura increíblemente alto con respecto a las solicitudes de datos tanto secuenciales como aleatorias que proceden de la CPU.

En un escenario de centro de datos típico que conlleva el procesamiento de millones de bytes de datos empresariales aleatorios, incluidos la colaboración en dibujos técnicos en CAD, datos de seísmos para análisis (por ejemplo, Big Data) o acceder a datos de clientes en todo el mundo para transacciones bancarias (por ejemplo, OLTP), los dispositivos de almacenamiento deben ser accesibles con la menor cantidad de latencia y pueden comportar un gran número de clientes que necesiten acceso a los mismos datos de modo simultáneo sin ninguna degradación en el tiempo de respuesta.

Una aplicación cliente se traduce en acceso por un único usuario o aplicación con un delta tolerable más alto entre el tiempo de respuesta mínimo y máximo de cualquiera de las acciones del usuario o del sistema.

Las matrices de almacenamiento complejas que usan unidades SSD como, por ejemplo, Network Attached Storage, Direct Attached Storage o Storage Area Network, también se ven afectadas de manera adversa por un rendimiento que no se corresponde a su sistema y que puede causar caos en la latencia del sistema de almacenamiento, del rendimiento sostenido y, finalmente, en la calidad del servicio.

A diferencia de las unidades SSD a nivel de cliente, las unidades de SSD de clase empresarial tales como la unidad de disco de estado sólido Kingston E100 han sido optimizadas no solo para ofrecer un rendimiento superior en los primeros pocos segundos de acceso, sino que, usando una mayor área de aprovisionamiento excesivo (OP), también ofrecen un rendimiento sostenido mayor durante periodos de tiempo más largos. [1]

Ello garantiza que el rendimiento del sistema de almacenamiento sigue siendo homogéneo con las condiciones de calidad de servicio que esperan las organizaciones durante los momentos más álgidos de tráfico de la carga.

Fiabilidad

La memoria flash NAND cuenta con una serie de problemas inherentes que se le asocian, siendo los dos más importantes su ciclo de vida finito y la frecuencia de errores que se producen de manera natural.

Durante el proceso de producción de la flash basada en NAND, cada modelo de flash NAND se prueba y se equipa con un sistema de Frecuencia de errores de bits (BER o RBER) extremo.

La frecuencia de errores de bits (BER) define con qué frecuencia se producen errores de bit de modo natural en la flash basada en NAND sin la ventaja de poseer el código de corrección de errores (ECC) y que el FSP los corrija, usando un ECC avanzado, sobre la marcha sin interrumpir el acceso al usuario o al sistema.

La capacidad de los procesadores de almacenamiento flash (FSP) para corregir estos errores de bits puede ser interpretada por la Frecuencia de errores de bits incorregibles (UBER), “una unidad de medida de la frecuencia de la corrupción de datos igual al número de errores de datos por bit leídos después de aplicar cualquier método de corrección de errores especificado”. [2]

Tal como se define y ha sido estandarizado por el Comité JEDEC en 2010 a través de los documentos Requisitos y método de prueba de resistencia JESD218A:Solid State Drive (SSD) y Cargas de trabajo de resistencia JESD219:Solid State Drive (SSD), la clase empresarial de las unidades SSD difiere en diferentes maneras de la clase cliente, entre las que se cuentan su capacidad para admitir cargas de trabajo de escritura mayores, condiciones de entorno más extremas y una recuperación de la frecuencia de errores de bits (BER) más alta que la que posee la unidad SSD de la clase cliente. [3] [4]

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

Tabla 1 - Requisitos y método de prueba de resistencia JESD218A:Solid State Drive (SSD) Copyright de JEDEC. Reproducido con el permiso de JEDEC.

Usando el requisito UBER propuesto por JEDEC para las unidades SSD empresariales frente a las de cliente, se espera que la SSD empresarial solamente experimente una proporción de 1 error de bit irrecuperable por cada 10 cuatrillones de bits (equivalente a 1,11 petabytes) en comparación con la unidad SSD de cliente, que cuenta con una proporción de 1 error de bit por cada cuatrillón de bits (equivalente a 0,11 petabytes) procesados.

En las unidades de SSD de clase empresarial, pueden implementarse métodos de protección adicionales, incluida la tecnología de Matriz Redundante de Elementos de Silicio Independientes (R.A.I.S.E.) de LSI® SandForce® , a través del uso de la paridad de banda en los modelos flash basados en NAND para combatir circunstancias en las que el ECC del FSP no puede recuperarse de un error de bits.

La tecnología R.A.I.S.E. ™ puede disminuir de manera efectiva el UBER hasta 1 error de bit por cada 100 octillones de bits (10-29) o el equivalente de 111022302462515,66 petabytes procesados, y ofrece un UBER de hasta casi 1 cuatrillón de veces menos que una unidad SSD estándar. [5]

Para complementar la tecnología R.A.I.S.E. ™ en la unidad SSD Kingston E100, se han implementado también funciones de creación periódica de control y un programa de protección interno integral de Cyclic Redundancy Check (CRC) a fin de garantizar la integridad de datos del host a través de la flash y de vuelta al host.

Parecido a las unidades SSD de clase empresarial reforzadas con la protección ECC contra los errores de bits, estas deben contener habitualmente también un sistema electrónico de control con una lógica de detección de pérdida de potencia equivalente al soporte del fallo de la energía de Kingston E100 para supervisar la energía entrante y proporcionar energía de modo temporal usando capacitadores de tantalio en el caso de un escenario de pérdida de energía, lo cual permita completar cualquier problema de escritura pendiente interno o externo.

Resistencia

Todas las memorias flash NAND contenidas en dispositivos de almacenamiento flash se degradan en su capacidad de almacenar de manera fiable bits de datos con cada programa o eliminar ciclos (P/E) de una celda de memoria NAND flash hasta que la flash con NAND ya no puede almacenar datos de una manera fiable, un punto en el que debe eliminarse del grupo de almacenamiento direccionable del usuario y la dirección lógica se mueve a una nueva dirección física en la matriz de almacenamiento de la flash NAND.

A medida que la celda es constantemente programada o eliminada, la BER también aumenta de modo lineal y es por esta razón que debe implementarse un conjunto complejo de técnicas de gestión en la FSP de la SSD empresarial que permita gestionar la capacidad de la celda en almacenar datos de manera fiable durante el ciclo de vida estimado de la SSD. [6]

La resistencia de escritura/borrado de una memoria flash NAND dada puede variar notablemente dependiendo del proceso de fabricación de litografía actual y del tipo de flash NAND producido.

Tipo de memoria flash basadas en NAND TLC MLC e-MLC SLC
Arquitectura 3 bits por celda 2 bits por celda 2 bits por celda 1 bit por celda
Capacidad Mayor capacidad Gran capacidad Gran capacidad Menor capacidad
Resistencia (escritura/borrado) Resistencia más baja Resistencia media Resistencia alta Mayor resistencia
Coste $ $$ $$$ $$$$
Frecuencia de errores de bits (BER) aproximada en NAND 10^4 10^7 10^8 10^9

Tabla 2 – Tipos de memoria flash basadas en NAND [6] [7] [8] [9]

La memoria flash basada en NAND Multi-Level Cell (e-MLC) de nivel de empresa utilizada en las unidades SSD Kingston E100 de clase empresarial es similar en funcionamiento a la memoria flash AND MLC a nivel de productos básicos pero cuenta con requisitos de análisis y condiciones adicionales para lograr una resistencia más alta de escritura/borrado y una BER menor que el MLC estándar usado en las unidades SSD de la clase cliente.

Mientras que la SSD de clase empresarial debe ser capaz de soportar una actividad de escritura intensa en escenarios típicos en el que el servidor de un centro de datos requiere acceso a los datos las 24 horas los 7 días de la semana, en comparación con las SSD de la clase cliente, que solo se utiliza normalmente en su totalidad durante 8 horas al día durante la semana, e-MLC es el sistema de canales perfecto para proporcionar un alto rendimiento, capacidad y resistencia a las SSD.

Entender la resistencia a la escritura de cualquier aplicación o SSD puede ser complejo, que es el motivo por el que el comité JEDEC también propuso un sistema de medida de la resistencia que usara el valor de terabytes escritos (TBW) para indicar la cantidad de datos simples que pueden escribirse en la unidad de SSD antes que la flash NAND contenida en la SSD se vuelva un medio de almacenamiento no fiable y se deba retirar la unidad.

Usando los métodos de prueba JEDEC propuestos JESD218A y JESD219, las cargas de trabajo de clase empresarial resultan una tasca más fácil al interpretar cálculos de la resistencia de los fabricantes de SSD a través de TBW y extrapolar una medida de resistencia más comprensible que pueda aplicarse a cualquier centro de datos.

Tal como se ha anotado en en documentos JESD218 y JESD219, diferentes cargas de trabajo de la clase de aplicaciones también pueden sufrir un factor de amplificación de escritura (WAF) para ampliar más el número real de escrituras enviado por el host y fácilmente acabar en un uso no gestionable de la flash NAND, una BER de la flash NAND más alta a partir de escrituras excesivas tras un tiempo y un rendimiento más lento de páginas no válidas ampliamente distribuidas en la unidad SSD. El mecanismo de compresión sobre la marcha utilizado en la Kingston E100 con la tecnología LSI® SandForce® DuraWrite™ reduce el WAF general y amplía la resistencia estimada de la flash NAND para aplicaciones de clase empresarial.

Aunque los TBW son un tema importante para el debate entre las unidades SSD de clase empresarial o de cliente, los TBW son solo un modelo de predicción de resistencia a nivel de la flash NAND y debe tenerse en cuenta el tiempo medio entre fallos (MTBF) como un modelo de fiabilidad y de resistencia basado en la fiabilidad de los componentes utilizados en el dispositivo. Entre las expectativas de unos componentes de la unidad SSD de clase empresarial se incluyen la duración y mayor capacidad de gestión de los voltajes en todas las memorias flash NAND con respecto a la esperanza de vida de las unidades SSD.

La supervisión y sistema de informes S.M.A.R.T. de las SSD de clase empresarial permite que el dispositivo sea fácilmente solicitado antes de fallo para un ciclo de vida basado en el factor amplificación de escritura actual y nivel de uso. Los avisos predictivos de prefallo para los eventos de fallos tales como un corte de electricidad, errores de bits produciéndose desde la interfaz física o en una distribución de uso desigual también son a menudo soportados.

Las unidades SSD de la clase cliente pueden solo incorporar el resultado S.M.A.R.T. mínimo para supervisar la SSD durante el uso estándar o después de fallo.

Dependiendo de la clase de la aplicación y de la capacidad de la unidad SSD, una mayor capacidad de reserva de la memoria flash basada en NAND también puede asignarse como una capacidad para espacio extra de aprovisionamiento excesivo (OP). La capacidad OP se oculta al acceso del usuario y del sistema operativo y puede utilizarse como un búfer de escritura temporal para un rendimiento sostenido mayor y como sustitutivo de las celdas defectuosas de la memoria flash durante el ciclo de vida de la SSD para reforzar su fiabilidad y resistencia.

Conclusión

Existen diferencias distintivas entre las unidades SSD de clase empresarial y de la clase cliente, las cuales van desde su resistencia a la escritura y borrado de la memoria flash NAND a sus técnicas de gestión complejas para adaptarse a las cargas de trabajo procedentes de las diferentes clases de aplicaciones.

Comprender estas diferencias de las clases de aplicaciones según se correspondan a rendimiento, fiabilidad y resistencia puede resultar una arma efectiva a la hora de minimizar y gestionar el riesgo de inactividad con interrupciones en un entorno empresarial exigente y a menudo crítico.