Tin cậy
Bộ nhớ NAND Flash có một số vấn đề cố hữu, trong đó hai vấn đề quan trọng nhất là giới hạn về tuổi thọ do các ô NAND Flash hao mòn đi trong quá trình ghi liên tục và tỷ lệ lỗi xảy ra một cách tự nhiên.
Trong quá trình sản xuất NAND Flash, mỗi đế bán dẫn NAND Flash cắt ra từ các tấm silic được thử nghiệm và biểu thị bằng tỉ lệ lỗi bit nguyên gốc (BER hoặc RBER).
BER là tỷ lệ lỗi bit xảy ra một cách tự nhiên trong NAND Flash mà không được hưởng lợi từ Mã sửa lỗi (ECC) và Bộ điều khiển SSD sửa lỗi bằng ECC Nâng cao khi thiết bị đang chạy (thường được các nhà sản xuất bộ điều khiển SSD khác nhau gọi là sửa lỗi BCH ECC, ECC Mạnh hoặc LDPC) mà không làm gián đoạn người dùng hoặc truy cập hệ thống.
Khả năng sửa những bit lỗi này của bộ điều khiển SSD có thể được diễn giải bằng Tỷ lệ bit lỗi không thể sửa được (UBER), "một đơn vị đo tỷ lệ hư hỏng dữ liệu tương đương với số lượng lỗi dữ liệu trên một bit được đọc sau khi áp dụng bất kỳ phương pháp sửa lỗi được chỉ định nào".{{Footnote.N48213}}
Theo định nghĩa và tiêu chuẩn của hiệp hội tiêu chuẩn công nghiệp JEDEC năm 2010 được ghi trong các văn bản JESD218A: Yêu cầu và Phương pháp Thử nghiệm Độ bền của Ổ cứng thể rắn (SSD) và JESD219: Tải công việc Độ bền của Ổ cứng thể rắn (SSD), ổ cấp doanh nghiệp có một số khác biệt so với ổ SSD cấp cá nhân bao gồm nhưng không giới hạn trong khả năng hỗ trợ các tải công việc ghi nặng hơn, điều kiện môi trường khắc nghiệt hơn và sự phục hồi từ một BER cao hơn so với một SSD cấp cá nhân.{{Footnote.N52081}}{{Footnote.N52082}}
Lớp ứng dụng | Khối lượng công việc (xem JESD219) | Sử dụng thường xuyên (bật) | Sử dụng không thường xuyên (tắt) | Yêu cầu về UBER |
Khách |
Khách |
40° C 8 giờ/ngày |
30° C 1 năm |
≤10 -15 |
Doanh nghiệp |
Doanh nghiệp |
55° C 24 giờ/ngày |
40° C 3 tháng |
≤10 -16 |
Bảng 1 - JESD218A: Yêu cầu và Phương pháp Thử nghiệm Độ bền của Ổ cứng thể rắn (SSD)
JEDEC giữ bản quyền. Được sao chép lại với sự cho phép của JEDEC
Theo yêu cầu UBER cho ổ SSD cấp doanh nghiệp so với cấp cá nhân do JEDEC đề xuất, một ổ SSD cấp doanh nghiệp được kỳ vọng chỉ có 1 bit lỗi không thể khôi phục được với tỷ lệ 1 bit lỗi trên mỗi 10 triệu tỷ bit (~1,11 Petabyte) so với một ổ SSD cấp cá nhân với tỷ lệ 1 bit lỗi trên 1 triệu tỷ bit (~0,11 Petabyte) được xử lý.
Ổ SSD cấp doanh nghiệp của Kingston cũng sẽ bổ sung các công nghệ cho phép khôi phục các khối dữ liệu bị lỗi sử dụng dữ liệu tương tự được lưu trữ trong các đế NAND (giống với ổ RAID, cho phép khôi phục những khối cụ thể mà có thể được xây dựng lại với dữ liệu tương tự được lưu trữ trong các khối khác).
Để bổ trợ các công nghệ khôi phục khối dữ liệu dư thừa được tích hợp vào ổ SSD cấp doanh nghiệp của Kingston, việc tạo điểm kiểm tra định kỳ, Kiểm tra Phần dư Tuần hoàn và sửa lỗi ECC cũng được thực thi trong một đồ án bảo vệ nội bộ từ đầu cuối đến đầu cuối để bảo đảm sự toàn vẹn của dữ liệu từ thiết bị chủ qua flash và quay trở lại thiết bị chủ. Bảo vệ dữ liệu từ đầu cuối đến đầu cuối có nghĩa là dữ liệu nhận được từ thiết bị chủ được kiểm tra tính toàn vẹn khi lưu trữ trong cache nội bộ của SSD và khi được ghi hoặc đọc lại từ các khu vực lưu trữ NAND.
Tương tự như chế độ bảo vệ ECC nâng cao trước các lỗi bit trong SSD cấp doanh nghiệp, SSD cũng có thể chứa các mạch vật lý để phát hiện ra việc mất điện và quản lý các tụ điện lưu trữ nguồn điện trên SSD. Tính năng hỗ trợ khi mất điện trong phần cứng theo dõi nguồn điện vào SSD và khi xảy ra mất điện đột ngột, nó cung cấp điện tạm thời cho mạch SSD bằng các tụ điện tantali để hoàn tất bất kỳ thao tác ghi nào chưa hoàn thành xuất phát từ bên ngoài hoặc bên trong trước khi tắt SSD. Mạch bảo vệ khi mất điện thường là bắt buộc với các ứng dụng mà trong đó dữ liệu mất đi không thể khôi phục được.
Tính năng bảo vệ khi mất điện cũng có thể được thực hiện trong firmware của SSD thông qua việc xóa thường xuyên dữ liệu trong các khu vực cache của bộ điều khiển SSD (ví dụ bảng Lớp FTranslation) để lưu vào bộ lưu trữ NAND – thao tác này không bảo đảm rằng dữ liệu sẽ không bị mất trong trường hợp mất điện nhưng cố gắng giảm thiểu tác động của các sự cố tắt nguồn không an toàn. Tính năng bảo vệ khi mất điện trên firmware cũng bảo đảm rằng SSD sẽ không trở nên không hoạt động được nữa sau khi gặp phải sự cố tắt nguồn không an toàn.
Trong nhiều tình huống, việc sử dụng lưu trữ do phần mềm định nghĩa hoặc cụm máy chủ có thể giảm bớt nhu cầu hỗ trợ khi mất điện dựa trên phần cứng vì mọi dữ liệu đều được sao chép sang một thiết bị lưu trữ riêng biệt và độc lập trên một hoặc nhiều máy chủ khác nhau. Các trung tâm dữ liệu ở quy mô web thường cung cấp hỗ trợ khi mất điện sử dụng lưu trữ do phần mềm định nghĩa, trên thực tế, đến các máy chủ RAID để lưu trữ các bản sao dư thừa của cùng một dữ liệu.