对于可靠存储 NAND 闪存单元的每个程序或擦写 (P/E) 次数的数据位方面,闪存设备中所含的所有 NAND 闪存的此方面能力会有所下降,直至 NAND 闪存不再能够可靠地存储数据,此时,应将这类闪存从用户可寻址的存储池中除去,该逻辑地址会移至 NAND 闪存阵列上的新物理地址。
随着单元不断编程或擦除,BER 还会线性增加,出于此方面原因,必须对企业级 SSD FSP 施行一组复杂的管理技巧,以管理单元在 SSD 的预期寿命期间可靠存储数据的能力。 [6]
指定 NAND 闪存的擦写耐久性可能会有很大差异,这取决于当前的平版印刷术制造工艺以及生产的 NAND 闪存的类型。
| NAND 闪存类型 |
TLC |
MLC |
e-MLC |
SLC |
| 架构 |
每个单元三位 |
每个单元两位 |
每个单元两位 |
每个单元一位 |
| 存储容量 |
最大存储容量 |
大存储容量 |
大存储容量 |
最小存储容量 |
| 擦写耐久性 |
最低耐久性 |
中等耐久性 |
高耐久性 |
最高耐久性 |
| 成本 |
$ |
$$ |
$$$ |
$$$$ |
| NAND 位错误率 (BER) 约值 |
10^4 |
10^7 |
10^8 |
10^9 |
表 2 – NAND 闪存类型 [6] [7] [8] [9]
在金士顿 E100 企业级 SSD 上使用的企业级多级单元 (e-MLC) NAND 闪存在运行中与商品级 MLC NAND 闪存类似,但是前者具有额外的屏蔽和资格要求,以获得比在客户端级 SSD 上使用的标准 MLC 更高的擦写耐久性和更低的 BER。
由于客户端级 SSD 通常每周每天仅有 8 小时在充分利用,而企业级 SSD 必须能够承受需每周全天 24 小时访问数据的数据中心服务器的常见情形中繁重的写入活动,因此 e-MLC 非常适合高性能、高存储容量和高耐久性的 SSD。
了解任何应用或 SSD 的写入耐久性较为复杂,因此 JEDEC 委员会还建议使用写入 TB 数 (TBW) 的值来指示在向 SSD 写入多少原始数据量后,SSD 中所含的 NAND 闪存就会变成不可靠的存储介质并应将驱动器废弃。
通过运用 JEDEC 建议的 JESD218A 测试方法和 JESD219 企业级工作量,将更易于阐述 SSD 制造商借助 TBW 进行的耐久性计算以及预测可应用到任何数据中心的更易理解的耐久性措施。
正如文件 JESD218 和文件 JESD219 中所述,不同应用级的工作量还会经受按大于主机实际提交写入数的量排列的写入放大因子 (WAF),并很容易产生无法管控的 NAND 闪存损耗,由一段时间内过多的写入数造成的更高 NAND 闪存 BER,以及由 SSD 上广泛分布的无效页造成的更慢性能。 在具有 LSI® SandForce® DuraWrite™ 技术的金士顿 E100 上运用的传输中压缩机制降低了整体 WAF,并将企业级应用中 NAND 闪存的额定耐久性延长。
虽然 TBW 是企业级 SSD 与客户端级 SSD 之间重要的讨论话题,但是 TBW 仅仅是 NAND 闪存级的耐久性预测模型,应将平均无故障时间 (MTBF) 作为基于设备所用组件可靠性的组件级耐久性与可靠性预测模型来进行观测。 对企业级 SSD 组件的期望包括在 SSD 预期寿命期间管理所有 NAND 闪存的电压上更为耐久和更为得力。
对企业级 SSD 的 S.M.A.R.T. 监控和报告使得能够根据当前写入放大因子和损耗程度对设备进行故障前预期寿命的轻松查询。
通常还支持对故障前故障事件(例如电力损失、物理接口发生的位错误或不均衡的损耗分布)的预测警告。
对于在标准运用期间或故障后监控 SSD 方面,客户端级 SSD 可能仅具有最低的 S.M.A.R.T. 输出量。
根据 SSD 应用级和存储容量,还可分配更高的 NAND 闪存预留存储量作为过度配置 (OP) 的备用存储量。 用户和操作系统均无法访问 OP 存储量,OP 存储量 可用作临时写入缓冲以获得更高的持续稳定性能,并在 SSD 的预期寿命期间作为有缺陷的闪存单元的替代品,以提高 SSD 的可靠性和耐久性。