Requisitos de datos empresariales
Explicación del requisito de bloques, archivos y objetos
A la hora de adoptar nuevas aplicaciones, es importante entender el tipo de datos a almacenar para poder adoptar una decisión fundamentada sobre si se deben utilizar almacenamiento de bloques, de archivos o de objetos.
El almacenamiento de bloques es la situación de uso más habitual para los entornos DAS y SAN. En el caso de DAS, el volumen de RAID íntegro, o la unidad física entera, se presentan a sistema operativo como un volumen bruto sin formato. En el caso de los entornos SAN, el LUN íntegro (compuesto de varias unidades físicas) procedente desde la matriz de almacenamiento se presenta al sistema operativo a través de una red de alta velocidad, y aparece como un volumen sin formato. Las capas subyacentes del volumen sin formato constan de extensiones o sectores más pequeños que maneja el sistema operativo, tras lo cual el subsistema de almacenamiento subyacente es capaz de asignar estos bloques lógicos a bloques físicos específicos en la(s) unidad(es) específica(s). El almacenamiento a nivel de bloque es rápido y fiable, e ideal para datos continuamente cambiantes, como las bases de datos relacionales, las bases de datos de procesamiento de transacciones en línea (OLTP), los servidores de correo electrónico o las infraestructuras de escritorios virtuales, entornos en los cuales una alta velocidad de ejecución de transacciones y una baja latencia son imprescindibles.
El almacenamiento de objetos almacena los datos (y los metadatos asociados a los mismos) en contenedores con identificadores únicos, sin carpetas ni subdirectorios como los habituales del almacenamiento de archivos. Emplean el concepto de almacenes de valores-clave, en los cuales cada clave apunta a un “valor”, o elemento de datos, específico, y se recupera a través de API.
Se utiliza fundamentalmente para procesar grandes volúmenes de datos no estructurados, como correos electrónicos, imágenes de copias de seguridad, metraje de vídeos de vigilancia o, en el IdC, la administración de datos para aprendizaje automático y análisis de datos. El almacenamiento de objetos es adecuado para procesar grandes volúmenes de datos, y puede escalarse tan rápido como lo requiera la aplicación. No obstante, es lento para la recuperación de datos, lo cual lo hace ineficiente para bases de datos o para computación de alto rendimiento. Entre ejemplos de almacenamiento de objetos merecen mencionarse Amazon S3, el almacenamiento de objetos en Google Cloud o el almacenamiento Azure Blob.
El almacenamiento de archivos guarda los datos en archivos, organizados en carpetas y subdirectorios, que se comparten a través de una red utilizando SMB (Windows) o NFS (Linux). Es adecuado para centralizar los archivos de almacenamiento, como vídeos, imágenes o documentos, aunque su escalabilidad es limitada a medida que el volumen de datos continúa creciendo. No es la aplicación más idónea para procesar enormes volúmenes de datos no estructurados, ni para los entornos caracterizados por un cambio continuo de los datos, como las bases de datos OLTP.