Yêu cầu về dữ liệu của doanh nghiệp
Hiểu được yêu cầu về khối, tệp và đối tượng
Khi triển khai ứng dụng mới, điều quan trọng là phải hiểu rõ loại dữ liệu được lưu trữ để đưa ra quyết định sáng suốt về việc nên sử dụng lưu trữ khối, tệp hay đối tượng.
Lưu trữ khối là trường hợp sử dụng phổ biến nhất trong môi trường DAS và SAN. Trong môi trường DAS, toàn bộ dung lượng ổ đĩa RAID hoặc Ổ đĩa vật lý được hiển thị cho HĐH dưới dạng ổ đĩa thô, chưa được định dạng. Trong môi trường SAN, toàn bộ LUN (bao gồm một số ổ đĩa vật lý) được hiển thị từ mảng lưu trữ sẽ được trình bày cho HĐH thông qua mạng tốc độ cao và xuất hiện dưới dạng ổ đĩa thô, chưa được định dạng. Các lớp cơ bản của ổ đĩa thô bao gồm các phạm vi hoặc khu vực nhỏ hơn mà hệ điều hành xử lý. Sau đó, hệ thống con lưu trữ cơ bản có thể ánh xạ các khối logic đó tới các khối vật lý cụ thể trên (các) ổ đĩa cụ thể. Bộ lưu trữ cấp khối có tốc độ cao, đáng tin cậy và là giải pháp lý tưởng nhất cho loại dữ liệu thay đổi liên tục như cơ sở dữ liệu quan hệ, cơ sở dữ liệu xử lý giao dịch trực tuyến (OLTP), máy chủ email hoặc cơ sở hạ tầng máy tính ảo. Đó là những loại dữ liệu yêu cầu thông lượng giao dịch cao và độ trễ thấp.
Bộ lưu trữ đối tượng có khả năng lưu trữ dữ liệu (và siêu dữ liệu được liên kết) trong các vùng chứa có mã nhận dạng không trùng lặp, không có thư mục hoặc thư mục con, chẳng hạn như các thư mục hoặc thư mục con được liên kết với bộ lưu trữ tệp. Bộ lưu trữ này sử dụng khái niệm kho lưu trữ khóa–giá trị, trong đó mỗi khóa trỏ đến một “giá trị” cụ thể hoặc một phần dữ liệu và được truy xuất thông qua API.
Giải pháp này chủ yếu được sử dụng để xử lý một lượng lớn dữ liệu phi cấu trúc, như email, hình ảnh sao lưu, video cảnh quay giám sát hoặc trong IoT, quản lý dữ liệu cho học máy và phân tích dữ liệu. Giải pháp lưu trữ đối tượng là lựa chọn phù hợp để xử lý lượng dữ liệu rất lớn và có thể thay đổi quy mô nhanh chóng theo yêu cầu của ứng dụng. Tuy nhiên, giải pháp này có tốc độ truy xuất dữ liệu chậm, nên không hiệu quả đối với cơ sở dữ liệu hoặc điện toán có hiệu năng cao. Ví dụ về bộ lưu trữ đối tượng bao gồm Amazon S3, bộ lưu trữ đối tượng Google Cloud hoặc bộ lưu trữ Azure Blob.
Bộ lưu trữ tệp có chức năng lưu trữ dữ liệu trong các tệp, được sắp xếp trong các thư mục và thư mục con và được chia sẻ qua mạng bằng SMB (Windows) hoặc NFS (Linux). Đây là giải pháp hiệu quả với các tệp lưu trữ tập trung như video, hình ảnh hoặc tài liệu. Tuy nhiên, giải pháp này có khả năng mở rộng hạn chế khi lượng dữ liệu không ngừng tăng lên. Đây không phải là ứng dụng phù hợp nhất để xử lý lượng dữ liệu phi cấu trúc rất lớn hoặc dữ liệu thay đổi liên tục như cơ sở dữ liệu OLTP.