SSD Doanh nghiệp so với Máy khách

Một chuyên gia đang đối mặt với bức tường, có hai mũi tên, một chỉ về bên trái, một chỉ về bên phải.

Hiện nay, ngày càng nhiều trung tâm dữ liệu (vốn cần có thông lượng dữ liệu cao và độ trễ giao dịch thấp) bị tắc nghẽn về hiệu năng, mà lý do là vì trước đó đã sử dụng các Ổ đĩa cứng (HDD) cho máy chủ. Họ tìm đến Ổ cứng thể rắn (SSD) làm giải pháp tăng hiệu năng, hiệu suất và độ tin cậy của trung tâm dữ liệu, cũng như hạ bớt chi phí vận hành (OpEx) tổng.

Để giúp bạn hiểu rõ sự khác nhau giữa các loại SSD, chúng tôi tiến hành phân biệt hai thành phần chính của một ổ SSD – đó là Bộ điều khiển lưu trữ Flash (gọi đơn giản là bộ điều khiển SSD) và bộ nhớ NAND Flash điện tĩnh dùng để lưu trữ dữ liệu.

Trên thị trường ngày nay, đối tượng sử dụng SSD và bộ nhớ NAND Flash được chia thành ba nhóm chính:
  • Thiết bị tiêu dùng (máy tính bảng, camera, điện thoại di động),
  • Hệ thống máy khách (Netbook, máy tính xách tay, Ultrabook, AIO, máy tính cá nhân để bàn), hệ thống nhúng/công nghiệp (quầy game, hệ thống xây dựng có mục đích, bảng hiệu điện tử)
  • Nền tảng điện toán doanh nghiệp (HPC, máy chủ trung tâm dữ liệu).

Chọn được đúng thiết bị lưu trữ SSD cho các trung tâm dữ liệu của doanh nghiệp có thể là một quá trình khó khăn và lâu dài khi phải tìm hiểu và đánh giá rất nhiều nhà sản xuất SSD và các loại sản phẩm khác nhau, vì không phải tất cả SSD và bộ nhớ NAND Flash đều được chế tạo như nhau.

Ổ SSD được sản xuất để dễ dàng thay thế hoặc bổ trợ cho HDD và có nhiều kích cỡ khác nhau, kể cả loại 2,5", các giao thức/giao diện truyền dữ liệu như Serial ATA (SATA), Serial Attached SCSI (SAS) và gần đây là NVMe PCIe để truyền dữ liệu với Bộ xử lý trung tâm (CPU) trong máy chủ.

Việc triển khai tuy dễ dàng nhưng không đảm bảo rằng tất cả các SSD sẽ phù hợp cho các ứng dụng doanh nghiệp về lâu dài và việc chọn sai SSD có thể loại bỏ hết các lợi ích như tiết kiệm chi phí và hiệu năng đạt được khi các SSD bị hao mòn quá sớm do việc ghi quá nhiều, tốc độ ghi liên tục bị thấp hơn nhiều trong suốt chu kỳ hoạt động dự kiến hoặc phát sinh thêm độ trễ trong dãy lưu trữ và do đó phải thay thế sớm.

Chúng tôi sẽ thảo luận ba đặc trưng chính giúp phân biệt ổ SSD cấp doanh nghiệp và cấp máy khách nhằm giúp bạn đưa ra quyết định mua vật tư đúng đắn khi cần thay thế hoặc bổ sung dung lượng lưu trữ cho máy chủ.

Hiệu năng

Ổ SSD có thể mang đến hiệu năng đọc và ghi đỉnh cao cho các yêu cầu dữ liệu, cả tuần tự và ngẫu nhiên, từ CPU thông qua kiến trúc đa kênh và khả năng truy cập song song từ Bộ điều khiển của SSD đến chip NAND Flash.

Trong môi trường trung tâm dữ liệu điển hình cần xử lý hàng triệu byte dữ liệu ngẫu nhiên của công ty, như cộng tác trên các bản vẽ kỹ thuật CAD, phân tích dữ liệu địa chấn (ví dụ: Big Data) hoặc truy cập dữ liệu khách hàng trên toàn thế giới để thực hiện các giao dịch ngân hàng (ví dụ: OLTP), các thiết bị lưu trữ phải cho phép truy cập với độ trễ thấp nhất và cho phép trường hợp nhiều khách hàng cần truy cập đồng thời một dữ liệu mà không bị giảm sút về thời gian đáp ứng. Độ trễ thấp là cơ sở để mang lại trải nghiệm tốt, qua đó nâng cao năng suất cho người dùng. Khi nhân rộng phép tính này ra toàn bộ lực lượng lao động, bạn sẽ thấy lợi ích của độ trễ thấp sẽ phóng đại lên đến nhường nào.

Một ứng dụng máy khách sẽ chỉ gồm một người dùng đơn nhất hoặc truy cập ứng dụng với độ lệch (delta) cao hơn có thể chấp nhận được giữa thời gian đáp ứng (độ trễ) tối thiểu và tối đa đối với bất kỳ hoạt động nào của người dùng hay hệ thống.

Các dãy lưu trữ phức tạp sử dụng SSD (ví dụ: Network Attached Storage, Direct Attached Storage hoặc Storage Area Network) cũng sẽ chịu ảnh hưởng tiêu cực do hiệu năng không tương ứng mang lại và có thể gây tổn hại đến độ trễ dãy lưu trữ, hiệu năng liên tục và cuối cùng là chất lượng dịch vụ do người dùng cảm nhận.

Không giống ổ SSD máy khách, các ổ SSD doanh nghiệp của Kingston được tối ưu hoá để không những mang đến hiệu năng tối đa trong vài giây truy cập đầu tiên, mà còn để sử dụng một vùng lưu trữ dự phòng (OP) lớn hơn, cung cấp hiệu năng liên tục ở trạng thái ổn định cao hơn trong khoảng thời gian dài sử dụng. Có thể tìm thấy thêm thông tin về các ổ cụ thể trên trang web của Kingston dưới phần Ổ SSD doanh nghiệp.{{Footnote.N48213}}

Điều này đảm bảo rằng hiệu năng của dãy lưu trữ tương xứng với Chất lượng dịch vụ (QoS) mà các tổ chức mong đợi khi tải lưu lượng đạt mức cực đại.

Bảng điều khiển LED gắn trên tủ mạng trong một phòng máy chủ

Tin cậy

Bản thân bộ nhớ NAND Flash vốn có một số vấn đề cố hữu. Trong đó, hai vấn đề trọng tâm nhất là giới hạn về tuổi thọ, do các ô NAND Flash hao mòn đi trong quá trình ghi liên tục, và tỷ lệ lỗi xảy ra một cách tự nhiên.

Trong quá trình sản xuất NAND Flash, mỗi đế bán dẫn NAND Flash cắt ra từ các tấm silicon được thử nghiệm và biểu thị bằng Tỷ lệ lỗi bit nguyên gốc (BER hoặc RBER).

BER là tỷ lệ lỗi bit xảy ra một cách tự nhiên trong NAND Flash mà không được hưởng lợi từ Mã sửa lỗi (ECC) và Bộ điều khiển SSD sửa lỗi bằng ECC Nâng cao khi thiết bị đang chạy (thường được các nhà sản xuất bộ điều khiển SSD khác nhau gọi là sửa lỗi BCH ECC, ECC Mạnh hoặc LDPC), mà không làm gián đoạn người dùng hoặc khả năng truy cập hệ thống.

Khả năng sửa những bit lỗi này của bộ điều khiển SSD có thể được diễn giải bằng Tỷ lệ bit lỗi không thể sửa được (UBER), "một đơn vị đo tỷ lệ hư hỏng dữ liệu tương đương với số lượng lỗi dữ liệu trên một bit được đọc sau khi áp dụng bất kỳ phương pháp sửa lỗi được chỉ định nào". {{Footnote.N48213}}

Theo định nghĩa và tiêu chuẩn của hiệp hội tiêu chuẩn công nghiệp JEDEC năm 2010 được ghi trong các văn bản JESD218A: Yêu cầu và phương pháp thử nghiệm độ bền của Ổ cứng thể rắn (SSD) và JESD219: Lượng công việc độ bền của Ổ cứng thể rắn (SSD), ổ cấp doanh nghiệp có một số khác biệt so với ổ SSD máy khách, bao gồm nhưng không giới hạn trong khả năng hỗ trợ các tải công việc ghi nặng hơn, điều kiện môi trường khắc nghiệt hơn và khả năng phục hồi khi gặp tỷ lệ BER cao hơn so với SSD máy khách.{{Footnote.N52081}}{{Footnote.N52082}}

Lớp ứng dụngKhối lượng công việc (xem JESD219)Sử dụng thường xuyên (bật)Sử dụng không thường xuyên (tắt)Yêu cầu về UBER
Khách Khách 40° C 8 giờ/ngày 30° C 1 năm ≤10 -15
Doanh nghiệp Doanh nghiệp 55° C 24 giờ/ngày 40° C 3 tháng ≤10 -16

Bảng 1 - JESD218A: Yêu cầu và Phương pháp Thử nghiệm Độ bền của Ổ cứng thể rắn (SSD)
JEDEC giữ bản quyền. Được sao chép lại với sự cho phép của JEDEC

Theo yêu cầu về UBER cho ổ SSD cấp doanh nghiệp so với máy khách do JEDEC đề xuất, một ổ SSD doanh nghiệp chỉ được gặp 1 bit lỗi không thể khôi phục, với tỷ lệ là 1 bit lỗi/10 triệu tỷ bit (~1,11 Petabyte), so với SSD máy khách là 1 bit lỗi/1 triệu tỷ bit (~0,11 Petabyte) được xử lý.

Ổ SSD cấp doanh nghiệp của Kingston cũng sẽ bổ sung các công nghệ cho phép khôi phục các khối dữ liệu bị lỗi sử dụng dữ liệu chẵn lẻ được lưu trữ trong các đế NAND khác (giống với ổ RAID, cho phép khôi phục một số khối cụ thể bằng cách dùng dữ liệu chẵn lẻ được lưu trữ trong các khối khác để dựng lại).

Để bổ trợ các công nghệ khôi phục khối dữ liệu dự phòng được tích hợp vào ổ SSD cấp doanh nghiệp của Kingston, tính năng tạo điểm kiểm tra định kỳ, Kiểm tra dự phòng theo chu kỳ (CRC) và sửa lỗi ECC cũng được triển khai theo một sơ đồ bảo vệ toàn diện từ đầu đến cuối, từ đó bảo đảm tính toàn vẹn của dữ liệu từ thiết bị chủ qua flash và quay trở lại thiết bị chủ. Bảo vệ dữ liệu toàn diện từ đầu đến cuối có nghĩa là dữ liệu nhận được từ thiết bị chủ được kiểm tra tính toàn vẹn khi lưu trữ trong cache nội bộ của ổ SSD và khi được ghi hoặc đọc lại từ các khu vực lưu trữ NAND.

Tương tự như chế độ bảo vệ ECC nâng cao trước các lỗi bit trong ổ SSD cấp doanh nghiệp, ổ SSD cũng có thể chứa các mạch vật lý để phát hiện ra việc mất điện và quản lý các tụ điện lưu trữ nguồn điện trên ổ SSD. Tính năng hỗ trợ khi mất điện trong phần cứng theo dõi nguồn điện vào ổ SSD và khi xảy ra mất điện đột ngột thì sẽ cung cấp điện tạm thời cho mạch ổ SSD bằng các tụ điện để hoàn tất bất kỳ thao tác ghi nào chưa hoàn thành xuất phát từ bên ngoài hoặc bên trong trước khi tắt ổ SSD. Mạch Bảo vệ khi mất điện (PLP) thường là yêu cầu bắt buộc với các ứng dụng không thể khôi phục được dữ liệu nếu làm mất.

Tính năng Bảo vệ khi mất điện cũng có thể được triển khai vào phần mềm điều khiển của ổ SSD thông qua việc thường xuyên chuyển dữ liệu trong các khu vực cache của bộ điều khiển SSD (ví dụ: Bảng lớp chuyển đổi flash) vào bộ lưu trữ NAND – thao tác này không bảo đảm rằng dữ liệu sẽ không bị mất trong trường hợp mất điện, nhưng cố gắng giảm thiểu tác động của các sự cố tắt nguồn không an toàn. Tính năng Bảo vệ khi mất điện trên phần mềm điều khiển cũng bảo đảm rằng ổ SSD sẽ không hỏng hóc đến mức mất khả năng hoạt động sau khi gặp phải sự cố tắt nguồn không an toàn.

Trong nhiều tình huống, việc sử dụng Lưu trữ định nghĩa bằng phần mềm hoặc cụm máy chủ có thể giảm bớt nhu cầu phải bổ sung khả năng hỗ trợ khi mất điện bằng phần cứng, vì mọi dữ liệu đều được sao chép sang một thiết bị lưu trữ riêng biệt và độc lập trên một hoặc nhiều máy chủ khác nhau. Các trung tâm dữ liệu quy mô web thường bỏ luôn tính năng Hỗ trợ khi mất điện bằng cách sử dụng Lưu trữ xác định bằng phần mềm nối đến các máy chủ RAID để lưu trữ các bản sao dự phòng của cùng một dữ liệu.

Độ bền

Một chuyên gia chạm vào một ô lục giác nằm trên hình tổ ong, mỗi ô chứa một biểu tượng biểu trưng cho một khái niệm công nghệ, như điện toán đám mây.

Tất cả các bộ nhớ NAND Flash chứa trong thiết bị lưu trữ Flash đều giảm sút khả năng lưu trữ một lượng nhỏ dữ liệu với mỗi chu kỳ ghi hoặc xoá (P/E) của một ô nhớ NAND Flash cho đến khi khối NAND Flash không còn khả năng lưu trữ dữ liệu một cách tin cậy nữa, đến lúc đó một khối xấu hoặc xuống cấp sẽ được gỡ ra khỏi vùng nhớ có thể truy cập qua địa chỉ và địa chỉ khối logic (hay LBA) được di chuyển đến một địa chỉ vật lý mới trên dãy nhớ NAND Flash. Một khối lưu trữ mới thay thế khối hỏng sử dụng vùng Khối Dự trữ là một bộ phận của Dung lượng Dự phòng (OP) trên SSD.

Khi ô nhớ liên tục được ghi hoặc xoá, BER cũng tăng lên theo tỷ lệ tuyến tính. Vì lý do này, một tập hợp phức tạp các kỹ thuật quản lý phải được triển khai trên Bộ điều khiển của SSD doanh nghiệp để quản lý khả năng lưu trữ dữ liệu một cách đáng tin cậy của ô nhớ trong suốt vòng đời hoạt động được kỳ vọng của SSD.{{Footnote.N52083}}

Độ bền P/E của một bộ nhớ NAND Flash nào đó có thể khác biệt rất nhiều phụ thuộc vào công nghệ sản xuất hiện tại và loại NAND Flash được sản xuất.

Loại bộ nhớ NAND FlashQLCTLCMLCSLC
Kiến trúc 4 bit mỗi ô 3 bit mỗi ô 2 bit mỗi ô 1 bit mỗi ô
Dung lượng Dung lượng cao nhất Dung lượng cao hơn Dung lượng cao Dung lượng thấp nhất
Độ bền (P/E) Độ bền thấp nhất Độ bền thấp hơn Độ bền trung bình Độ bền cao nhất
Chi phí $ $$ $$$ $$$$
Tỷ lệ bit lỗi (BER) NAND ước tính 10^4 10^4 10^7 10^9

Bảng 2 – Loại bộ nhớ NAND Flash {{Footnote.N52084}}{{Footnote.N52085}}

Ổ SSD doanh nghiệp cũng sẽ khác với ổ SSD máy khách về chu kỳ hoạt động. Ổ SSD doanh nghiệp phải có khả năng chịu đựng được các hoạt động đọc hoặc ghi nặng trong các tình huống điển hình của một máy chủ trung tâm dữ liệu luôn nhận yêu cầu truy cập dữ liệu suốt 24 giờ trong tuần. Trong khi đó, ổ SSD máy khách thường chỉ được dùng hết công suất trong 8 giờ/ngày vào các ngày trong tuần.

Ổ SSD doanh nghiệp có chu kỳ làm việc 24x7, so với chu kỳ của ổ SSD máy khách là 20/80 (20% thời gian hoạt động, 80% thời gian nghỉ hoặc ở chế độ ngủ khi máy tính bật).

Hiểu rõ độ bền ghi của bất kỳ ứng dụng hoặc ổ SSD nào thường rất phức tạp, đó là lý do tại sao uỷ ban JEDEC cũng đã đề xuất một đơn vị đo độ bền bằng giá trị số TeraByte được ghi (TBW) để biểu thị lượng dữ liệu nguyên gốc từ thiết bị chủ có thể được ghi vào ổ SSD trước khi NAND Flash chứa trong ổ SSD trở nên không đáng tin cậy và cần phải loại bỏ.

Nhờ sử dụng các phương pháp thử nghiệm JESD218A và lượng công việc cấp doanh nghiệp JESD219 do JEDEC đề xuất, ta có thể dễ dàng diễn giải các tính toán về độ bền của nhà sản xuất thông qua TBW và ngoại suy một chỉ số đo độ bền dễ hiểu hơn để có thể áp dụng cho bất kỳ trung tâm dữ liệu nào.

Như lưu ý trong tài liệu JESD218 và JESD219, lượng công việc thuộc các cấp ứng dụng khác nhau cũng phải chịu Hệ số khuếch đại ghi (WAF) cao hơn gấp mười lần lượng ghi thực tế mà thiết bị chủ gửi đến. Tình trạng này rất dễ khiến NAND Flash bị ăn mòn đến mức không thể kiểm soát, tỷ lệ BER NAND Flash cao hơn do bị ghi quá mức qua thời gian và hiệu năng dần chậm hơn khi các trang bất hợp lệ phân tán rộng rãi khắp ổ SSD.

Dù TBW là một chủ đề quan trọng khi thảo luận về ổ SSD cấp doanh nghiệp so với máy khách, TBW chỉ mới là một trong các mô hình dự đoán độ bền cấp độ NAND Flash. Cũng cần quan sát Tuổi thọ trung bình (MTBF) làm mô hình dự đoán độ bền và độ tin cậy cấp cấu phần thông qua độ tin cậy của các cấu phần được dùng trên thiết bị. Các cấu phần của ổ SSD doanh nghiệp được kỳ vọng sẽ tồn tại lâu hơn và hoạt động mạnh mẽ hơn trong việc quản lý điện áp trên khắp bộ nhớ NAND Flash trong suốt thời gian hoạt động dự kiến của SSD. Tất cả các ổ SSD doanh nghiệp phải đạt xếp hạng MTBF tối thiểu hai triệu giờ, tức là hơn 230 năm! Kingston đưa ra các thông số cho ổ SSD của mình khá dè dặt và việc thấy thông số MTBF cao hơn trên các ổ SSD khác không phải là không phổ biến; có một điều quan trọng cần lưu ý rằng 2 triệu giờ là một điểm khởi đầu quá đủ cho ổ SSD cấp doanh nghiệp. Việc giám sát và báo cáo S.M.A.R.T về các ổ SSD cấp doanh nghiệp cho phép dễ dàng truy vấn thiết bị để biết tuổi thọ trước khi xảy ra sự cố dựa trên hệ số khuếch đại ghi (WAF) và mức độ hao mòn hiện tại. Cảnh báo trước khi xảy ra sự cố, như mất điện, lỗi bit xảy ra từ giao diện vật lý hoặc phân bố hao mòn không đồng đều, cũng thường được hỗ trợ. Tiện ích Kingston SSD Manager có thể được tải về từ trang web của Kingston và dùng để xem tình trạng của ổ.

Các ổ SSD máy khách có thể chỉ trang bị đầu ra S.M.A.R.T. ở mức cơ bản nhất để giám sát ổ SSD trong quá trình sử dụng thông thường hoặc sau khi xảy ra sự cố.

Tuỳ thuộc vào cấp ứng dụng và dung lượng của ổ SSD, số dung lượng dự trữ tăng lên trong bộ nhớ NAND Flash cũng có thể được phân bổ làm vùng lưu trữ dự phòng (OP). Dung lượng OP được ẩn đi đối với người dùng và hệ điều hành, có thể được dùng làm một vùng đệm ghi tạm thời để nâng cao hiệu năng liên tục và làm giải pháp thay thế các ô nhớ Flash bị lỗi trong suốt vòng đời ổ SSD nhằm nâng cao độ tin cậy và độ bền của ổ SSD (với số lượng Khối dự trữ lớn hơn).

Kết luận

Có những khác biệt rõ rệt giữa ổ SSD cấp doanh nghiệp và ổ SSD máy khách từ độ bền Ghi và Xoá của bộ nhớ NAND Flash đến các kỹ thuật quản lý phức tạp để đáp ứng lượng công việc của các cấp ứng dụng khác nhau.

Hiểu rõ những khác biệt này trong các cấp ứng dụng có thể là một công cụ hiệu quả để giảm thiểu và quản lý nguy cơ bị gián đoạn ngừng hoạt động trong môi trường doanh nghiệp đòi hỏi cao và thường đóng vai trò trọng yếu.

Nếu bạn có thêm câu hỏi hoặc muốn biết thêm về ổ SSD doanh nghiệp của Kingston, vui lòng liên hệ đại diện Kingston, nhóm Hỏi chuyên gia hoặc kênh Hỗ trợ kỹ thuật qua trò chuyện của chúng tôi.

Video liên quan

Bài viết liên quan