Memória
Unidades SSD
Dispositivos USB
Cartões de Memória Flash
Suporte
Configurador de Memória

Melhores práticas

SSD Empresarial X SSD para Consumidores

Cresce a cada dia o numero de datacenters empresarias que exigem altas taxas de transferência de dados nas transações e menor tempo de resposta nas solicitações. Empresas que até poucos dias atras confiavam seus dados em unidades de disco rígido (HDD) em seus servidores estão agora procurando os dispositivos de estado solido (SSD) como uma solução de armazenamento viável para eliminar os “gargalos” e maximizar o desempenho, a eficiência e a confiabilidade de seus “datacenters” como um todo, além de reduzir suas despesas operacionais (OpEx) de modo geral.

Para começar a entender as diferenças entre as classes de SSD, temos que distinguir os dois componentes chave do SSD, o Processador Flash de Armazenamento e a memória flash NAND não-volátil utilizada para armazenar dados.

No mercado atual, o uso de memória flash SSD e NAND está dividido nos seguintes principais grupos; dispositivos voltados para o consumidor (Tablets, câmeras, telefones celulares), cliente (Netbook, notebook, ultrabook, AIO, computadores pessoais), integrado/industrial (Quiosque, jogos) e computação empresarial (HPC, servidores de centros de processamento de dados).

Entretanto, escolher o dispositivo de armazenamento SSD certo para centros de processamento de dados pode ser um processo longo e complicado de conhecimento e qualificação de uma grande quantidade de SSDs de diferentes fornecedores e tipos de produto disponível no mercado, já que nem todas as memórias flash NAND e SSDs são, de fato, criadas da mesma maneira.

SSDs são fabricados para serem facilmente instalados como um substituto ou complemento para Unidades de Disco Rígido (HDD) que são fabricados com base em disco magnético giratório e estão disponíveis em uma série de diferentes formatos incluindo de 2,5" , protocolo de comunicação / interfaces incluindo ATA Serial (SATA) e Serial Attached SCSI (SAS) para transferir dados de/para a Unidade de Processamento Central (CPU) de um servidor.

Sua facilidade de instalação, entretanto, não garante que todos os SSDs serão adequados a longos prazos para as aplicações da empresa onde foram instalados. E ainda, optando pelo SSD errado, o custo pode anular qualquer economia inicial e os benefícios de desempenho obtidos quando os SSDs se houver desgaste prematuro devido a gravações excessivas, ou por devido ao desempenho de gravação constante muito mais baixo em relação a seu tempo de vida útil esperado ou por introduzir uma latência adicional no conjunto de armazenamento e com isso haver necessidade de substituição precoce.

Neste documento iremos discutir as três principais qualidades que distinguem um SSD de classe empresarial para auxiliar na tomada de decisão correta quando chegar o momento de substituir ou acrescentar mais armazenamento a um centro de processamento de dados de uma empresa.

Desempenho

Os SSDs podem oferecer desempenhos incrivelmente altos de leitura e gravação para solicitações de dados da CPU tanto sequenciais quanto aleatórias, através do uso de arquitetura de multicanal e acesso paralelo do FSP para as memórias flash NAND.

Em um cenário típico de centro de dados, envolvendo o processamento de milhões de bytes de dados randômicos da empresa, incluindo a colaboração em desenhos técnicos CAD, dados sísmicos para análise (por exemplo, Dados Mestre) ou o acessando dados de clientes em grande escala para transações bancárias (por exemplo, OLTP), os dispositivos de armazenamento devem ser acessíveis com os menores valores de latência e podem envolver um grande número de clientes necessitando acessar o mesmo segmento de dado simultaneamente sem degradação do tempo de resposta.

Um aplicativo voltado para clientes somente irá envolver um único usuário ou o acesso ao aplicativo com uma diferença mais alta entre o mínimo e o máximo tempo de resposta tolerável para quaisquer ações do usuário ou do sistema.

Conjuntos complexos de armazenamento usando SSDs (por exemplo, Network Attached Storage, Direct Attached Storage ou Storage Area Network - NAS, DAS, SAN) também são negativamente afetados por desempenho confuso e podem provocar aumentos na latência do conjunto de armazenamento, queda no desempenho contínuo e consequentemente, na qualidade do serviço.

Diferentemente dos SSDs voltados para clientes comuns , os SSDs da classe empresarial como a unidade de estado sólido E100 da Kingston são otimizados não somente para desempenho nos primeiros segundos de acesso, mas tambem no periodo da área sobredimensionada maior (OP) e assim oderecer um desempenho contante maior por longos períodos de tempo. [1]

Isso garante que o desempenho do conjunto de armazenamento permaneça consistente nas organizações que esperam qualidade de serviço durante picos de tráfico de cargas.

Confiabilidade

A memória flash NAND possui uma série de problemas inerentes, sendo os dois mais importantes, uma expectativa de vida finita e uma taxa natural de erros.

Durante o processo de produção de flash NAND, cada chip é testado e é atribuído uma taxa de erro de bit básica (BER ou RBER).

A BER define a taxa em que erros de bit ocorrendo naturalmente no flash NAND acontecem sem o benefício do Código de Correção de Erro (ECC) e que o FSP corrige usando ECC avançado dinamicamente, sem interromper o acesso do usuário ou do sistema.

A capacidade dos Processadores de Armazenamento Flash para corrigir esses erros de bit pode ser lida pela Taxa de Erro de Bit Incorrigível (UBER), “uma medida para a taxa de corrupção de dados igual ao número de erros de dados por bit, lidos após a aplicação de qualquer método específico de correção de erros." [2]

Conforme definido e padronizado pelo Comitê JEDEC em 2010 através dos documentos JESD218A: Requisitos da Unidade de Estado Sólido (SSD) e Método de Teste de Resistência (Solid State Drive (SSD) Requirements e Endurance Test Method) e JESD219: Cargas de Resistência da Unidade de Estado Sólido (SSD) (Solid State Drive (SSD) Endurance Workloads), a classe empresarial difere de diversos modos dos SSDs voltados para clientes, incluindo mas não limitado à sua capacidade de suportar cargas de trabalho de gravação mais intensas, condições ambientais extremas mais rígidas e recuperação de uma BER mais alta do que um SSD cliente. [3] [4]

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

Tabela 1 - JESD218A:Requisitos da Unidade de Estado Sólido (SSD) e Método de Teste de Resistência Copyright JEDEC. Reproduzido com a autorização da JEDEC.

Utilizando o requisito UBER proposto pela JEDEC para SSD empresa versus cliente, espera-se que um SSD de classe empresarial somente apresente 1 erro de bit irrecuperável em uma taxa de 1 erro de bit em 10 quatrilhões de bits (aprox. 1,11 Petabytes) comparada ao SSD cliente com uma taxa de 1 erro de bit em 1 quatrilhão de bits (aprox. 0,11 Petabytes) processados.

Métodos de proteção adicionais incluindo a tecnologia R.A.I.S.E. (Conjuntos Redundantes de Discos Independentes) da LSI® SandForce® podem ser implementados em SSDs classe empresarial através do uso de bandas de paridade em todas as memórias flash NAND para combater circunstâncias onde o ECC FSP não pode se recuperar de um erro de bit.

A tecnologia R.A.I.S.E. ™ pode reduzir efetivamente o UBER para um erro de bit para cada 100 octilhões de bits (10-29) ou ~111022302462515.66 petabytes processados e oferece um UBER de até aproximadamente 1 quatrilhão de vezes menos do que um SSD padrão. [5]

Para complementar a tecnologia R.A.I.S.E. ™, um sistema de proteção interna com a criação de checkpoints periódicos e Verificação Cíclica de Redundância (CRC) ponta a ponta também são implementados no SSD E100 da Kingston para garantir a integridade dos dados do host através do flash e na volta ao host.

Similar a proteção ECC contra erros de bit em SSDs classe empresarial, eles normalmente também devem conter componentes eletrônicos de controle com lógica de detecção de perda de energia, equivalente ao suporte à falha de energia do E100 da Kingston para monitorar a energia de entrada e fornecer energia temporária utilizando capacitores de tântalo no caso de uma situação de perda de energia para completar gravações pendentes criadas interna ou externamente.

Resistência

Toda a memória flash NAND contida em dispositivos de armazenamento flash reduz sua capacidade real de armazenar ou apagar com segurança bits de dados em todas as células de memória flash NAND até o flash NAND não poder mais armazenar dados com segurança, em cujo momento deve ser removido do pool de armazenamento acessível do usuário e o endereço lógico ser movido para um novo endereço físico no arranjo de armazenamento flash NAND.

À medida que a célula é constantemente gravada ou apagada, o BER também cresce linearmente e é por essa razão que um conjunto complexo de técnicas de gerenciamento deve ser implementado no FSP do SSD empresarial para controlar a capacidade da célula em relação ao armazenamento confiável dos dados durante a vida útil esperada do SSD. [6]

A resistência de gravação e limpeza de uma determinada memória flash NAND pode variar substancialmente dependendo da litografia no processo de fabricação atual e do tipo de flash NAND produzido.

Tipo de memória flash NAND TLC MLC e-MLC SLC
Arquitetura 3 bits por célula 2 bits por célula 2 bits por célula 1 bit por célula
Capacidade Altíssima capacidade Alta capacidade Alta capacidade Baixíssima capacidade
Resistência (Gravar/Apagar) Baixíssima resistência Média resistência Alta resistência Altíssima resistência
Custo $ $$ $$$ $$$$
Taxa aprox de erro de bit NAND (BER) 10^4 10^7 10^8 10^9

Tabela 2 – Tipos de memória flash NAND [6] [7] [8] [9]

A memória flash NAND da linha empresarial Multi-Level Cell (e-MLC) utilizada no SSD classe empresarial E100 da Kingston asemelha-se em sua operação à memória flash NAND da linha commodity MLC mas possui requisitos adicionais de filtragem e qualificação para atingir uma resistência (Gravar/Apagar) mais alta e BER mais baixo do que a MLC padrão usada em SSDs da classe cliente.

Como um SSD de classe empresarial, deve ser capaz de resistir a intensas atividades de gravação em cenários típicos com um centro de processamento de dados requisitando acesso aos dados durante 24 horas em todos os dias da semana, comparado a um SSD de classe cliente que normalmente só é totalmente utilizado durante 8 horas por dia na semana. O e-MLC é a escolha perfeita para SSDs de alto desempenho, capacidade e resistência.

Entendendo que a resistência de gravação de qualquer aplicativo no SSD pode ser complexa o comitê JEDEC também propôs uma unidade de medida de resistência utilizando o valor TeraBytes Written (TBW) (Terabytes gravados), para indicar o total de dados básicos que podem ser gravados no SSD antes que o flash NAND contido no SSD torne-se uma mídia de armazenamento não confiável e a unidade deva ser descartada.

Utilizando os métodos de teste JESD218A propostos pela JEDEC e cargas de trabalho empresarial, torna-se uma tarefa simples interpretar os cálculos de resistência dos fabricantes de SSDs através dos TBW e extrapolar uma medida de resistência mais compreensível que possa ser aplicada em qualquer centro de processamento de dados.

Conforme contido nos documentos JESD218 e JESD219, cargas de trabalho de classes diferentes também podem sofrer de um fator de amplificação de gravação (WAF) em uma ordem de magnitude mais alta do que as gravações efetivas submetidas pelo host, levando facilmente a um desgaste no flash NAND incontrolável, BER do flash NAND mais alto de gravações excessivas ao longo do tempo e desempenho mais lento de páginas inválidas amplamente distribuídas em todo o SSD. O mecanismo de compressão dinâmico utilizado no E100 da Kingston com tecnologia LSI® DuraWrite™ SandForce® reduz o WAF geral e estende a resistência do flash NAND para aplicativos na classe empresarial.

Embora o TBW seja um importante tópico para a discussão entre SSDs classe empresarial e classe cliente, TBW é somente um modelo de previsão de resistência a nível de flash NAND e o Tempo médio entre falhas (MTBF) deve ser observado como um modelo de previsão de resistência e confiabilidade a nível de componente com base na confiabilidade dos componentes utilizados no dispositivo. A previsão para os componentes de um SSD classe empresarial inclui maior vida útil e trabalho mais intenso no controle de voltagens em toda a memória flash NAND durante a expectativa de vida dos SSDs.

O monitoramento e relatórios S.M.A.R.T. nos SSDs classe empresarial permitem que o dispositivo seja facilmente examinado antes da falha para a expectativa de vida com base no fator de amplificação de gravação atual e nível de desgaste. Avisos de previsão de falhas para ocorrências como perda de energia, erros de bits ocorrendo na interface física ou distribuição irregular de desgaste frequentemente também são suportados.

SSDs classe cliente podem apresentar somente um resultado S.M.A.R.T. mínimo para monitorar o SSD durante o uso regular ou pós-falha.

Dependendo da classe do aplicativo e capacidade do SSD, uma maior capacidade de reserva da memória flash NAND também pode ser alocada como um provisionamento adicional (OP) de capacidade ociosa. A capacidade OP fica oculta do usuário e do acesso do sistema operacional e pode ser utilizada com um buffer de gravação temporário para um desempenho contínuo mais alto e como uma substituição para células de memória flash com defeito durante a expectativa de vida do SSD para aprimorar a confiabilidade e resistência do SSD.

Conclusão

Existem diferenças marcantes entre SSDs classe empresarial e classe cliente variando da resistência Programar e Apagar de sua memória flash NAND até suas complexas técnicas de gerenciamento para adequação a cargas de trabalho de diferentes classes de aplicativo.

Entender essas diferenças em classes de aplicativos, relacionadas a desempenho, confiabilidade e resistência pode ser uma ferramenta eficaz para minimizar e controlar o risco de uma paralisação no ambiente empresarial exigente e de missão critica.