
Việc huấn luyện một mô hình‑học máy có thể tiêu thụ nhiều chu kỳ CPU, bộ nhớ và băng thông I/O hơn bất kỳ tác vụ phần mềm nào khác. Một mô hình hiện đại có thể đọc và ghi hàng trăm terabyte dữ liệu qua nhiều vòng lặp, thử thách giới hạn của cả những hệ thống lưu trữ nhanh nhất. Với sự bùng nổ của cuộc đua AI, khi mọi ngành công nghiệp và cơ quan chính phủ đều cạnh tranh để nâng cao hiệu năng AI, nhu cầu về một cách đáng tin cậy và có thể lặp lại để đo chuẩn tài nguyên phần cứng cụ thể cho lượng công việc học máy đã trở nên thiết yếu. Nhóm MLCommons đã tiên phong trong nỗ lực này với MLPerf Storage v2.0, giới thiệu những phương pháp đổi mới để đánh giá hiệu năng lưu trữ trong huấn luyện và suy luận học máy. Tài liệu này nghiên cứu cách mà ổ SSD DC3000ME PCIe Gen5 NVMe U.2 của Kingston hoạt động trong khung đánh giá chuẩn MLPerf mà không cần tới phần cứng GPU đắt tiền. Sử dụng mô phỏng khi ngủ, MLPerf tái hiện lượng công việc AI thực tế, cho phép các doanh nghiệp kiểm tra hiệu năng lưu trữ theo cách tiết kiệm chi phí và có khả năng mở rộng.
Tại sao điều này quan trọng? Lưu trữ nhanh giúp GPU hiệu quả bằng cách cung cấp dữ liệu nhanh chóng, giảm thiểu thời gian nhàn rỗi và tối đa hiệu suất tính toán. Ổ DC3000ME của Kingston giúp các doanh nghiệp tăng tốc các chu kỳ huấn luyện, giảm chi phí hạ tầng và đạt hiệu năng mở rộng với ít ổ hơn, khiến chúng trở thành một khoản đầu tư thông minh cho triển khai AI hiện đại.
Trong tài liệu này, chúng tôi:
- Phân tích phương pháp kiểm tra mô phỏng khi ngủ mới với bộ lưu trữ MLPerf v2
- Giới thiệu lượng công việc đào tạo và điểm kiểm tra khác nhau được bộ lưu trữ MLPerf v2 đảm nhiệm
- Thảo luận về kết quả ứng dụng của DC3000ME Kingston trong lượng công việc huấn luyện và kiểm tra theo điểm trên nền tảng PCIe Gen5 và Gen4
Kết quả cho thấy các giải pháp PCIe Gen5 NVMe như DC3000ME mang đến lựa chọn hấp dẫn cho các doanh nghiệp đang tìm kiếm mức tận dụng bộ tăng tốc và số giờ GPU hoạt động cao nhất trong quá trình làm việc cho học máy của họ. Chúng tôi đi sâu vào các tham số điều chỉnh, phương pháp kiểm tra và tinh chỉnh sau thử nghiệm cũng như tác động của chúng đến lượng công việc khác nhau.
Ổ SSD DC3000ME PCIe Gen5 NVMe U.2 của Kingston là một giải pháp hiệu quả cao cho lượng công việc AI. Dù bạn đang huấn luyện mô hình học sâu hay tinh chỉnh các mô hình ngôn ngữ lớn, những ổ đĩa này mang lại tốc độ, độ tin cậy và hiệu quả cần thiết để dẫn đầu trong cuộc đua AI.
Tải xuống sách trắng