Tin cậy
Bản thân bộ nhớ NAND Flash vốn có một số vấn đề cố hữu. Trong đó, hai vấn đề trọng tâm nhất là giới hạn về tuổi thọ, do các ô NAND Flash hao mòn đi trong quá trình ghi liên tục, và tỷ lệ lỗi xảy ra một cách tự nhiên.
Trong quá trình sản xuất NAND Flash, mỗi đế bán dẫn NAND Flash cắt ra từ các tấm silicon được thử nghiệm và biểu thị bằng Tỷ lệ lỗi bit nguyên gốc (BER hoặc RBER).
BER là tỷ lệ lỗi bit xảy ra một cách tự nhiên trong NAND Flash mà không được hưởng lợi từ Mã sửa lỗi (ECC) và Bộ điều khiển SSD sửa lỗi bằng ECC Nâng cao khi thiết bị đang chạy (thường được các nhà sản xuất bộ điều khiển SSD khác nhau gọi là sửa lỗi BCH ECC, ECC Mạnh hoặc LDPC), mà không làm gián đoạn người dùng hoặc khả năng truy cập hệ thống.
Khả năng sửa những bit lỗi này của bộ điều khiển SSD có thể được diễn giải bằng Tỷ lệ bit lỗi không thể sửa được (UBER), "một đơn vị đo tỷ lệ hư hỏng dữ liệu tương đương với số lượng lỗi dữ liệu trên một bit được đọc sau khi áp dụng bất kỳ phương pháp sửa lỗi được chỉ định nào". {{Footnote.N48213}}
Theo định nghĩa và tiêu chuẩn của hiệp hội tiêu chuẩn công nghiệp JEDEC năm 2010 được ghi trong các văn bản JESD218A: Yêu cầu và phương pháp thử nghiệm độ bền của Ổ cứng thể rắn (SSD) và JESD219: Lượng công việc độ bền của Ổ cứng thể rắn (SSD), ổ cấp doanh nghiệp có một số khác biệt so với ổ SSD máy khách, bao gồm nhưng không giới hạn trong khả năng hỗ trợ các tải công việc ghi nặng hơn, điều kiện môi trường khắc nghiệt hơn và khả năng phục hồi khi gặp tỷ lệ BER cao hơn so với SSD máy khách.{{Footnote.N52081}}{{Footnote.N52082}}
Lớp ứng dụng | Khối lượng công việc (xem JESD219) | Sử dụng thường xuyên (bật) | Sử dụng không thường xuyên (tắt) | Yêu cầu về UBER |
Khách |
Khách |
40° C 8 giờ/ngày |
30° C 1 năm |
≤10 -15 |
Doanh nghiệp |
Doanh nghiệp |
55° C 24 giờ/ngày |
40° C 3 tháng |
≤10 -16 |
Bảng 1 - JESD218A: Yêu cầu và Phương pháp Thử nghiệm Độ bền của Ổ cứng thể rắn (SSD)
JEDEC giữ bản quyền. Được sao chép lại với sự cho phép của JEDEC
Theo yêu cầu về UBER cho ổ SSD cấp doanh nghiệp so với máy khách do JEDEC đề xuất, một ổ SSD doanh nghiệp chỉ được gặp 1 bit lỗi không thể khôi phục, với tỷ lệ là 1 bit lỗi/10 triệu tỷ bit (~1,11 Petabyte), so với SSD máy khách là 1 bit lỗi/1 triệu tỷ bit (~0,11 Petabyte) được xử lý.
Ổ SSD cấp doanh nghiệp của Kingston cũng sẽ bổ sung các công nghệ cho phép khôi phục các khối dữ liệu bị lỗi sử dụng dữ liệu chẵn lẻ được lưu trữ trong các đế NAND khác (giống với ổ RAID, cho phép khôi phục một số khối cụ thể bằng cách dùng dữ liệu chẵn lẻ được lưu trữ trong các khối khác để dựng lại).
Để bổ trợ các công nghệ khôi phục khối dữ liệu dự phòng được tích hợp vào ổ SSD cấp doanh nghiệp của Kingston, tính năng tạo điểm kiểm tra định kỳ, Kiểm tra dự phòng theo chu kỳ (CRC) và sửa lỗi ECC cũng được triển khai theo một sơ đồ bảo vệ toàn diện từ đầu đến cuối, từ đó bảo đảm tính toàn vẹn của dữ liệu từ thiết bị chủ qua flash và quay trở lại thiết bị chủ. Bảo vệ dữ liệu toàn diện từ đầu đến cuối có nghĩa là dữ liệu nhận được từ thiết bị chủ được kiểm tra tính toàn vẹn khi lưu trữ trong cache nội bộ của ổ SSD và khi được ghi hoặc đọc lại từ các khu vực lưu trữ NAND.
Tương tự như chế độ bảo vệ ECC nâng cao trước các lỗi bit trong ổ SSD cấp doanh nghiệp, ổ SSD cũng có thể chứa các mạch vật lý để phát hiện ra việc mất điện và quản lý các tụ điện lưu trữ nguồn điện trên ổ SSD. Tính năng hỗ trợ khi mất điện trong phần cứng theo dõi nguồn điện vào ổ SSD và khi xảy ra mất điện đột ngột thì sẽ cung cấp điện tạm thời cho mạch ổ SSD bằng các tụ điện để hoàn tất bất kỳ thao tác ghi nào chưa hoàn thành xuất phát từ bên ngoài hoặc bên trong trước khi tắt ổ SSD. Mạch Bảo vệ khi mất điện (PLP) thường là yêu cầu bắt buộc với các ứng dụng không thể khôi phục được dữ liệu nếu làm mất.
Tính năng Bảo vệ khi mất điện cũng có thể được triển khai vào phần mềm điều khiển của ổ SSD thông qua việc thường xuyên chuyển dữ liệu trong các khu vực cache của bộ điều khiển SSD (ví dụ: Bảng lớp chuyển đổi flash) vào bộ lưu trữ NAND – thao tác này không bảo đảm rằng dữ liệu sẽ không bị mất trong trường hợp mất điện, nhưng cố gắng giảm thiểu tác động của các sự cố tắt nguồn không an toàn. Tính năng Bảo vệ khi mất điện trên phần mềm điều khiển cũng bảo đảm rằng ổ SSD sẽ không hỏng hóc đến mức mất khả năng hoạt động sau khi gặp phải sự cố tắt nguồn không an toàn.
Trong nhiều tình huống, việc sử dụng Lưu trữ định nghĩa bằng phần mềm hoặc cụm máy chủ có thể giảm bớt nhu cầu phải bổ sung khả năng hỗ trợ khi mất điện bằng phần cứng, vì mọi dữ liệu đều được sao chép sang một thiết bị lưu trữ riêng biệt và độc lập trên một hoặc nhiều máy chủ khác nhau. Các trung tâm dữ liệu quy mô web thường bỏ luôn tính năng Hỗ trợ khi mất điện bằng cách sử dụng Lưu trữ xác định bằng phần mềm nối đến các máy chủ RAID để lưu trữ các bản sao dự phòng của cùng một dữ liệu.