Resistencia
Toda memoria flash NAND contenida en dispositivos de almacenamiento flash experimenta degradación en su capacidad para almacenar confiablemente bits de datos, con cada ciclo de programación o borrado (P/B) de una celda de memoria flash NAND, hasta el punto en que la memoria flash NAND ya no puede almacenar datos confiablemente; en este punto se remueve un bloque degradado o dañado de la acumulación de almacenamiento direccionable por parte del usuario, y la dirección lógica del bloque (LBA) es desplazada a una nueva dirección física sobre el arreglo de almacenamiento de memoria flash NAND. Un nuevo bloque de almacenamiento reemplaza al dañado, usando la acumulación de bloques de repuesto que es parte del almacenamiento para sobreaprovisionamiento (OP) en la SSD.
Dato che le celle di memoria sono costantemente soggette a cicli di programmazione e cancellazione, anche il valore del BER tende a crescere in modo lineare; ed è per questo motivo che è necessario implementare una serie di complesse tecnologie di gestione sul controller dell'SSD, al fine di gestire in modo ottimale la capacità delle celle di memoria di conservare i dati durante l'intero ciclo di vita stimato del drive SSD.
La resistencia de P/B de una memoria flash NAND dada puede variar sustancialmente dependiendo del proceso actual de fabricación de la litografía y el tipo de memoria flash NAND producida.
Tipo de memoria flash NAND | QLC | TLC | MLC | SLC |
Arquitectura |
4 bits por celda |
3 bits por celda |
2 bits por celda |
1 bit por celda |
Capacidad |
La capacidad más alta |
Mayor capacidad |
Alta capacidad |
La capacidad más baja |
Resistencia (P/B) |
La resistencia más baja |
Menor resistencia |
Resistencia mediana |
La resistencia más alta |
Costo |
$ |
$$ |
$$$ |
$$$$ |
Tasa de errores de bit (BER) de NAND, aprox. |
10^4 |
10^4 |
10^7 |
10^9 |
Tabla 2 – Tipos de memoria Flash NAND Flash
Gli SSD di classe enterprise si differenziano da quelli di classe client anche rispetto ai relativi cicli di lavoro. Un SSD di classe enterprise deve essere in grado di sostenere intensi processi di lettura o scrittura, negli scenari tipici dei server utilizzati nei data center, con un impiego costante 24/7. Questo dato va confrontato con quello degli SSD di classe client, che vengono tipicamente utilizzati per 8 ore al giorno durante la settimana.
Gli SSD di classe enterprise si caratterizzano per cicli di lavoro costanti 24/7, rispetto agli SSD client che hanno cicli di lavoro di tipo 20/80 (20% del tempo attivi e 80% in pausa o in modalità sospensione durante l’uso del computer).
Comprendere i fattori che determinano la resistenza di un SSD ai cicli di scrittura può rappresentare un'operazione complessa. Ecco perché il comitato del JEDEC ha anche proposto un metodo di misurazione della durata che utilizza un parametro basato sui TeraByte scritti (TBW), che indica la quantità di dati grezzi Host che può essere scritta su un SSD prima che la memoria NAND Flash contenuta nel drive SSD diventi inaffidabile e richieda la sostituzione del drive.
Utilizzando le procedure proposte dai documenti JEDEC, JESD218A "Testing methods" (Metodi di test) e ESD219 "Enterprise class workloads" (Carichi di lavoro per dispositivi di classe aziendale), diventa semplice interpretare i calcoli di durata effettuati dai produttori di drive SSD attraverso il parametro TBW, per poi estrapolare e convertire i dati di durata in una forma maggiormente comprensibile, applicabile a qualunque data center.
Come indicato nei documenti JESD218 e JESD219, gli impieghi di carichi di lavoro relativi a classi di applicazioni differenti possono anche essere influenzati da un fattore di amplificazione di scrittura (WAF), con un ordine di grandezza superiore a quello delle operazioni di scrittura effettive inviate dal dispositivo host. Ciò può facilmente causare fenomeni non gestibili di usura delle memorie NAND Flash, elevati valori BER delle memorie NAND Flash a causa degli eccessivi cicli di scrittura nel tempo, nonché un rallentamento delle prestazioni determinato dalla presenza di elevate quantità di pagine non valide distribuite sul disco SSD.
Sebbene il TBW sia un argomento importante in termini di comparazione tra gli SSD di classe enterprise e quelli destinati al segmento client, esso rappresenta unicamente un modello predittivo che indica il livello di durata di una determinata memoria NAND Flash. Il tempo medio fra i guasti (MBTF) può essere considerato come un modello predittivo indicante il livello di affidabilità e durata dei componenti basato sull'affidabilità dei componenti utilizzati dal dispositivo. Le aspettative relative ai componenti utilizzati sugli SSD di classe enterprise sono concentrate su elevata durata e alta resistenza nella gestione delle tensioni che attraversano la memoria NAND Flash, piuttosto che sulla durata del ciclo di vita stimata degli SSD. Tutti gli SSD di classe enterprise dovrebbero attestarsi a un valore MTBF nominale di 2 milione di ore, il che vuol dire oltre 230 anni! Le specifiche degli SSD di Kingston riportano dati molto prudenti, eppure non è raro vedere valori MTBF ancora più elevati sui drive SSD di Kingston; è importante in ogni caso sapere che il valore di 2 milione di ore è molto più che un buon punto di partenza per un SSD di classe enterprise.
Le funzioni di monitoraggio e reporting S.M.A.R.T integrate negli SSD di classe enterprise consentono, con la massima semplicità, di analizzare il dispositivo per valutare la presenza di sintomi che indichino un imminente malfunzionamento e di determinarne la durata stimata, sulla base del fattore di amplificazione in scrittura (WAF) corrente e del livello di usura rilevato. Spesso questi dispositivi supportano anche le funzionalità di notifica predittiva relative ai malfunzionamenti che indicano guasti imminenti, come le perdite di potenza, gli errori dei bit presenti sull'interfaccia fisica o la presenza di una distribuzione dell'usura non uniforme. Per controllare lo stato di un SSD è possibile scaricare l’applicazione Kingston SSD Manager dal sito web di Kingston.
Gli SSD di classe client offrono invece solamente le funzionalità S.M.A.R.T minime richieste per il monitoraggio dei drive durante il normale utilizzo, oppure dopo che il guasto si è verificato.
A seconda della classe dell'applicazione e della capacità dell'SSD è anche possibile allocare una maggiore quantità di memoria di riserva sulla memoria NAND Flash, da utilizzare come capacità di riserva avente funzioni di over provisioning (OP). La capacità di over provisioning (OP) viene nascosta all'utente e all'accesso da parte del sistema operativo. Inoltre può essere utilizzata come buffer di scrittura temporaneo per garantire performance elevate per tempi prolungati, nonché fungere da memoria sostitutiva per compensare eventuali celle di memoria Flash difettose, durante il ciclo di vita del drive SSD, al fine di ottimizzare l'affidabilità e la durata dello stesso (grazie a un maggior numero di celle disponibili).