Bộ nhớ
Ổ cứng thể rắn
Ổ USB
Thẻ Flash
Hỗ trợ
Tìm kiếm Bộ nhớ

Các Quy tắc Thực hiện Tốt nhất

So sánh SSD cấp Doanh nghiệp và cấp Cá nhân

Ngày càng có nhiều trung tâm dữ liệu của doanh nghiệp yêu cầu lưu lượng dữ liệu cao và độ trễ giao dịch thấp, trước đây phụ thuộc vào Ổ đĩa cứng (HDD) trong các máy chủ, hiện nay đang gặp phải những vấn đề về hiệu năng và đang tìm đến Ổ đĩa thể rắn (SSD) như là một giải pháp lưu trữ hữu hiệu để tăng hiệu năng, hiệu suất, độ tin cậy của trung tâm dữ liệu và giảm bớt các chi phí vận hành tổng thể (OpEx).

Để có thể hiểu rõ sự khác biệt giữa các loại SSD, chúng ta phải phân biệt được hai thành phần chính của một ổ SSD, đó là Bộ xử lý Lưu trữ Flash và bộ nhớ NAND flash được dùng để lưu trữ dữ liệu.

Trên thị trường hiện nay, SSD và bộ nhớ NAND flash được chia thành ba nhóm chính: thiết bị tiêu dùng (máy tính bảng, máy ảnh, điện thoại di động), máy khách (netbook, máy tính xách tay, ultrabook, AIO, máy tính để bàn), điện toán nhúng/công nghiệp (thiết bị chơi game) và doanh nghiệp (HPC, máy chủ trong trung tâm dữ liệu).

Tuy nhiên, chọn được đúng thiết bị lưu trữ SSD cho các trung tâm dữ liệu của doanh nghiệp có thể là một quá trình khó khăn và lâu dài khi phải tìm hiểu và đánh giá rất nhiều nhà sản xuất SSD và các loại sản phẩm khác nhau, vì trong thực tế không phải tất cả SSD và bộ nhớ NAND flash đều được chế tạo như nhau.

SSD được sản xuất để dễ dàng thay thế hoặc bổ sung cho Ổ đĩa cứng (HDD) dùng phiến đĩa từ và có nhiều kích cỡ khác nhau kể cả loại 2,5", nhiều giao thức/giao tiếp truyền dữ liệu như Serial ATA (SATA), Serial Attached SCSI (SAS) để truyền dữ liệu với Bộ Xử lý Trung tâm (CPU) trong máy chủ.

Việc triển khai tuy dễ dàng nhưng không đảm bảo rằng tất cả các SSD sẽ phù hợp cho các ứng dụng doanh nghiệp về lâu dài và việc chọn sai SSD có thể loại bỏ hết các khoản lợi ích có được từ tiết kiệm chi phí và hiệu năng đạt được khi các SSD bị hao mòn quá sớm do việc ghi quá nhiều, tốc độ ghi liên tục bị thấp hơn nhiều trong suốt chu kỳ hoạt động hoặc phát sinh thêm độ trễ trong dãy lưu trữ và do đó phải thay thế sớm.

Trong nghiên cứu này chúng tôi sẽ thảo luận ba đặc trưng chính giúp phân biệt SSD cấp doanh nghiệp và cấp cá nhân nhằm giúp bạn đưa ra quyết định mua sắm đúng đắn khi cần thay thế hoặc bổ sung dung lượng lưu trữ cho trung tâm dữ liệu của doanh nghiệp.

Hiệu năng

SSD có thể mang đến hiệu năng đọc và ghi cao một cách kinh ngạc cho các yêu cầu dữ liệu cả tuần tự và ngẫu nhiên từ CPU thông qua việc sử dụng kiến trúc đa kênh và truy cập song song từ FSP đến đế bán dẫn NAND flash.

Trong môi trường trung tâm dữ liệu điển hình bao gồm việc xử lý hàng triệu byte dữ liệu ngẫu nhiên của công ty như cộng tác trên các bản vẽ kỹ thuật CAD, phân tích dữ liệu địa chấn (vd: Big Data) hoặc truy cập dữ liệu khách hàng trên toàn thế giới để thực hiện các giao dịch ngân hàng (vd: OLTP), các thiết bị lưu trữ cần phải được truy cập với độ trễ thấp nhất và có thể liên quan đến một số lượng lớn các khách hàng cần truy cập đồng thời một dữ liệu mà không có sự giảm sút về thời gian đáp ứng.

Một ứng dụng máy khách sẽ chỉ gồm một người dùng đơn nhất hoặc truy cập ứng dụng với độ lệch (delta) cao hơn có thể chấp nhận được giữa thời gian đáp ứng tối thiểu và tối đa đối với bất kỳ hoạt động nào của người dùng hay hệ thống.

Các dãy lưu trữ phức tạp sử dụng SSD (vd: Network Attached Storage, Direct Attached Storage hoặc Storage Area Network) cũng chịu ảnh hưởng tiêu cực do hiệu năng không tương đồng mang lại và có thể gây tổn hại đến độ trễ của dãy lưu trữ, hiệu năng liên tục và cuối cùng là chất lượng dịch vụ.

Không giống các SSD cấp cá nhân, các SSD cấp doanh nghiệp như ổ cứng thể rắn Kingston E100 được tối ưu hoá không những mang đến hiệu năng tối đa trong vài giây truy cập đầu tiên mà còn sử dụng một vùng lưu trữ dự phòng (OP) lớn hơn, chúng cũng cung cấp hiệu năng liên tục ở trạng thái ổn định cao hơn trong khoảng thời gian dài sử dụng. [1]

This guarantees that the storage array performance stays consistent with the organizations expected quality of service during peak traffic load.

Tin cậy

Bộ nhớ NAND flash có một số vấn đề cố hữu, trong đó hai vấn đề quan trọng nhất là giới hạn về tuổi thọ và tỷ lệ lỗi xảy ra một cách tự nhiên.

Trong quá trình sản xuất NAND flash, mỗi đế bán dẫn NAND flash được thử nghiệm và biểu thị bằng tỉ lệ bit lỗi (BER hoặc RBER).

BER là tỷ lệ bit lỗi xảy ra một cách tự nhiên trong NAND flash mà không được hưởng lợi từ Mã sửa lỗi (ECC) và nhờ đó FSP sửa lỗi bằng cách sử dụng ECC nâng cao mà không làm ngắt quãng các truy cập của người dùng hoặc hệ thống.

Khả năng sửa những bit lỗi này của Bộ xử lý Lưu trữ Flash có thể được diễn giải bằng Tỷ lệ bit lỗi không thể sửa được (UBER), "một đơn vị đo tỷ lệ hư hỏng dữ liệu tương đương với số lượng lỗi dữ liệu trên một bit được đọc sau khi áp dụng bất kỳ phương pháp sửa lỗi được chỉ định nào". [2]

Theo định nghĩa và tiêu chuẩn của Uỷ ban JEDEC năm 2010 được ghi trong các văn bản JESD218A:Yêu cầu và Phương pháp Thử nghiệm Độ bền của Ổ thể rắn (SSD) và JESD219:Tải công việc Độ bền của Ổ thể rắn (SSD), ổ cấp doanh nghiệp có một số khác biệt so với ổ SSD cấp cá nhân bao gồm nhưng không giới hạn trong khả năng hỗ trợ các tải công việc ghi nặng hơn, điều kiện môi trường khắc nghiệt hơn và sự phục hồi từ một BER cao hơn so với một SSD cấp cá nhân. [3] [4]

Application Class Workload (see JESD219) Active Use (power on) Retention Use (power off) Functional Failure Requirement (FFR) Uber Requirement
Client Client 40° C
8 hrs/day
30° C
1 year
≤3% ≤10 -15th
Enterprise Enterprise 55° C 24hrs/day 40° C
3 monts
≤3% ≤10 -16

Bảng 1 - JESD218A:Yêu cầu và Phương pháp Thử nghiệm Độ bền của Ổ thể rắn (SSD) JEDEC giữ bản quyền. Được sao chép lại với sự cho phép của JEDEC.

Theo yêu cầu UBER cho ổ SSD cấp doanh nghiệp so với cấp cá nhân do JEDEC đề xuất, một ổ SSD cấp doanh nghiệp được kỳ vọng chỉ có 1 bit lỗi không thể khôi phục được với tỷ lệ 1 bit lỗi trên mỗi 10 triệu tỷ bit (~1,11 Petabyte) so với một ổ SSD cấp cá nhân với tỷ lệ 1 bit lỗi trên 1 triệu tỷ bit (~0,11 Petabyte) được xử lý.

Các phương pháp bảo vệ bổ sung bao gồm công nghệ Dãy Dự phòng các Thành phần Silic Độc lập (R.A.I.S.E.™) của LSI® SandForce® có thể được thực thi trên các SSD cấp doanh nghiệp thông qua việc sử dụng khả năng kiểm tra chẵn lẻ chia nhỏ trên các đế bán dẫn NAND flash để giải quyết các tình huống khi FSP ECC không thể phục hồi từ một bit lỗi. Công nghệ R.A.I.S.E. ™ có thể giảm UBER một cách hiệu quả xuống 1 bit lỗi trên mỗi 100 tỷ tỷ tỷ bit (10-29) hoặc ~111022302462515,66 Petabyte được xử lý và đưa ra một UBER lên đến gần 1 triệu tỷ lần nhỏ hơn so với một SSD tiêu chuẩn. [5]

Để bổ sung cho công nghệ R.A.I.S.E. ™ trên ổ SSD Kingston E100, việc tạo ra điểm kiểm tra định kỳ và một hệ thống bảo vệ bên trong đầu cuối tới đầu cuối Kiểm tra Phần dư Tuần hoàn (CRC) cũng được thực thi để đảm bảo sự toàn vẹn của dữ liệu truyền từ thiết bị chủ qua flash và quay trở về thiết bị chủ.

Tương tự với sự bảo vệ ECC được tăng cường trong ổ SSD cấp doanh nghiệp để chống lại các bit lỗi, thông thường chúng cũng chứa các thành phần điện tử điều khiển với cơ chế phát hiện sự tổn hao năng lượng giống với tính năng hỗ trợ khi mất điện của Kingston E100 để theo dõi nguồn điện vào và cung cấp năng lượng tạm thời sử dụng tụ điện Tantalum trong trường hợp xảy ra mất điện để hoàn thành nốt các tác vụ ghi được gửi đến từ bên trong hoặc bên ngoài.

Độ bền

Tất cả các bộ nhớ NAND flash chứa trong thiết bị lưu trữ flash đều giảm sút khả năng lưu trữ một lượng nhỏ dữ liệu với mỗi chu kỳ ghi hoặc xoá (P/E) của một ô nhớ NAND flash cho đến khi NAND flash không còn khả năng lưu trữ dữ liệu một cách tin cậy nữa, đến lúc đó nó sẽ được gỡ ra khỏi vùng nhớ có thể truy cập qua địa chỉ và địa chỉ logic được di chuyển đến một địa chỉ vật lý mới trên dãy nhớ NAND flash.

Khi ô nhớ thường xuyên được ghi và xoá, BER cũng tăng lên theo tỷ lệ thuận và vì lý do này một tập hợp phức tạp các kỹ thuật quản lý phải được thực thi trên FSP của SSD cấp doanh nghiệp để quản lý khả năng của ô nhớ trong việc lưu trữ dữ liệu một cách tin cậy trong suốt thời gian chu kỳ hoạt động của SSD. [6]

Độ bền P/E của một bộ nhớ NAND flash nào đó có thể khác biệt rất nhiều phụ thuộc vào công nghệ sản xuất hiện tại và loại NAND flash được sản xuất.

Loại bộ nhớ NAND flash TLC MLC e-MLC SLC
Kiến trúc 3 bit mỗi ô 2 bit mỗi ô 2 bit mỗi ô 1 bit mỗi ô
Dung lượng Dung lượng cao nhất Dung lượng cao Dung lượng cao Dung lượng thấp nhất
Độ bền (P/E) Độ bền thấp nhất Độ bền trung bình Độ bền cao Độ bền cao nhất
Cost $ $$ $$$ $$$$
Tỷ lệ bit lỗi (BER) NAND ước tính 10^4 10^7 10^8 10^9

Bảng 2 – Loại bộ nhớ NAND flash [6] [7] [8] [9]

Bộ nhớ NAND flash Ô nhớ Đa cấp cấp doanh nghiệp (e-MLC) được sử dụng trên các ổ SSD cấp doanh nghiệp Kingston E100 có cách hoạt động tương tự với bộ nhớ NAND flash MLC thông thường nhưng có thêm các yêu cầu về giám sát và tiêu chuẩn kỹ thuật để đạt được độ bền P/E cao hơn và BER thấp hơn so với MLC tiêu chuẩn sử dụng trên các SSD cấp cá nhân.

Vì một SSD cấp doanh nghiệp phải có khả năng chịu đựng được các hoạt động ghi nặng trong các tình huống điển hình với một máy chủ trong trung tâm dữ liệu yêu cầu truy cập dữ liệu suốt 24 giờ mỗi ngày trong tuần so với một ổ SSD cấp cá nhân thường chỉ hoạt động tối đa 8 giờ mỗi ngày trong tuần, nên e-MLC là giải pháp hoàn hảo để tạo ra các SSD có hiệu năng, dung lượng và độ bền cao.

Hiểu rõ độ bền ghi của bất kỳ ứng dụng hoặc SSD nào thường rất phức tạp, đó là lý do tại sao uỷ ban JEDEC cũng đã đề xuất một đơn vị đo độ bền sử dụng là giá trị số TeraByte được ghi (TBW) để biểu thị lượng dữ liệu nguyên gốc có thể được ghi vào SSD trước khi NAND flash chứa trong SSD trở nên không đáng tin cậy và cần phải loại bỏ.

Sử dụng các phương pháp thử nghiệm JESD218A và tải công việc cấp doanh nghiệp JESD219 do JEDEC đề xuất giúp dễ dàng hơn khi diễn giải các tính toán về độ bền của nhà sản xuất thông qua TBW và ngoại suy một số đo về độ bền dễ hiểu hơn để có thể áp dụng cho bất kỳ trung tâm dữ liệu nào.

Như đã được ghi chú trong các văn bản JESD218 và JESD219, các tải công việc lớp ứng dụng khác nhau cũng có thể chịu một hệ số khuếch đại ghi (WAF) có thông số cao hơn so với tốc độ ghi thực sự do thiết bị chủ đưa ra và dễ dàng dẫn đến sự hao mòn NAND flash không thể quản lý được, BER của NAND flash cao hơn do việc ghi quá nhiều qua thời gian và hiệu năng thấp hơn từ các trang không hợp lệ được phân phối rộng rãi trên khắp SSD. Cơ chế nén khi đang hoạt động được sử dụng trên Kingston E100 với công nghệ LSI® SandForce® DuraWrite™ giúp giảm WAF tổng thể và kéo dài độ bền của NAND flash cho các ứng dụng trong môi trường doanh nghiệp.

Tuy TBW là một chủ đề quan trọng khi thảo luận về ổ SSD cho doanh nghiệp và cho máy khách nhưng TBW chỉ là một mô hình dự đoán độ bền cấp độ NAND flash và Thời gian Trung bình giữa các Sự cố (MTBF) nên được coi là một mô hình dự đoán độ tin cậy và độ bền ở cấp độ thành phần dựa trên độ tin cậy của các thành phần được sử dụng trên thiết bị.

Các thành phần của ổ SSD cấp doanh nghiệp được kỳ vọng sẽ tồn tại lâu hơn và hoạt động mạnh mẽ hơn trong việc quản lý điện áp trên khắp bộ nhớ NAND flash trong suốt thời gian hoạt động của SSD.

Việc giám sát và báo cáo S.M.A.R.T về các ổ SSD cấp doanh nghiệp cho phép thiết bị dễ dàng được truy vấn trước khi xảy ra sự cố để đảm bảo tuổi thọ dựa trên hệ số khuếch đại ghi hiện tại và mức độ hao mòn. Các cảnh báo trước khi xảy ra sự cố như mất điện, các lỗi bit xảy ra từ giao tiếp vật lý hoặc phân bố hao mòn không đồng đều cũng thường được hỗ trợ.

Các ổ SSD cấp cá nhân có thể chỉ trang bị tối thiểu đầu ra S.M.A.R.T. để giám sát ổ SSD trong quá trình sử dụng thông thường hoặc sau khi xảy ra sự cố.

Tuỳ thuộc vào lớp ứng dụng và dung lượng của SSD, việc tăng dung lượng dự trữ của bộ nhớ NAND flash cũng có thể được cấp phát như một vùng lưu trữ dự phòng (OP). Dung lượng OP được giấu khỏi người dùng và hệ điều hành và có thể được sử dụng như một vùng đệm ghi tạm thời để nâng cao hiệu năng liên tục và là một giải pháp thay thế các ô nhớ flash bị lỗi trong suốt thời gian hoạt động của SSD nhằm nâng cao độ tin cậy và độ bền của SSD.

Kết luận

Có những khác biệt rõ rệt giữa ổ SSD cấp doanh nghiệp và cấp cá nhân từ độ bền Ghi và Xoá của bộ nhớ NAND flash đến các kỹ thuật quản lý phức tạp để đáp ứng các tải công việc của các lớp ứng dụng khác nhau.

Hiểu rõ những khác biệt này trong các lớp ứng dụng liên quan đến hiệu năng, độ tin cậy và độ bền có thể là một công cụ hiệu quả để giảm thiểu và quản lý nguy cơ về thời gian hoạt động bị ngắt quãng trong một môi trường doanh nghiệp đòi hỏi cao và tối quan trọng.