Requisitos de datos empresariales
Comprensión del requisito de bloque, archivo y objeto
Al incorporar nuevas aplicaciones, es importante comprender el tipo de datos que se almacenan para tomar una decisión informada sobre el uso de almacenamiento de bloques, archivos u objetos.
El almacenamiento en bloques es el caso de uso más común para entornos DAS y SAN. En el caso de DAS, un volumen RAID completo o una unidad física se presenta al sistema operativo como un volumen sin formato, sin procesar. En el caso de entornos SAN, el LUN completo (comprometido de varias unidades físicas) presentado desde la matriz de almacenamiento se presenta al sistema operativo a través de una red de alta velocidad y aparece como un volumen sin formato sin procesar. Las capas subyacentes del volumen sin procesar consisten en extensiones o sectores más pequeños que maneja el sistema operativo y luego el subsistema de almacenamiento subyacente puede asignar esos bloques lógicos a bloques físicos específicos en la(s) unidad(es) específica(s). El almacenamiento a nivel de bloque es rápido, confiable e ideal para datos que cambian continuamente, como bases de datos relacionales, bases de datos de procesamiento de transacciones en línea (OLTP), servidores de correo electrónico o infraestructura de escritorio virtual, donde se requiere un alto rendimiento de transacciones y baja latencia.
El almacenamiento de objetos almacena datos (y los metadatos asociados con ellos) en contenedores con identificadores únicos, sin carpetas ni subdirectorios como los asociados con el almacenamiento de archivos. Utilizan el concepto de base de datos clave, donde cada clave apunta a un "valor" específico o pieza de datos y se recupera a través de APIs.
Se utiliza principalmente para manejar grandes cantidades de datos no estructurados, como correos electrónicos, imágenes de respaldo, imágenes de videovigilancia o, en IoT, administración de datos para aprendizaje automático y analítica de datos de datos. El almacenamiento de objetos es bueno para manejar grandes cantidades de datos y puede escalar tan rápido como lo requiera la aplicación, pero es lento en la recuperación de datos, lo que lo hace ineficiente para bases de datos o computación de alto rendimiento. Ejemplos de almacenamiento de objetos son Amazon S3, el almacenamiento de objetos de Google Cloud o el almacenamiento de Azure Blob.
El almacenamiento de archivos almacena datos en archivos, organizados en carpetas y subdirectorios, y se comparte a través de una red usando SMB (Windows) o NFS (Linux). Es bueno para centralizar archivos de almacenamiento como videos, imágenes o documentos, pero tiene una escalabilidad limitada a medida que la cantidad de datos continúa creciendo. No es la aplicación más adecuada para manejar grandes cantidades de datos no estructurados o datos que cambian continuamente, como las bases de datos OLTP.