Anforderungen der Unternehmensdaten
Verständnis der Block-, Datei- und Objektanforderungen
Bei der Einführung neuer Anwendungen ist es wichtig, die Art der zu speichernden Daten zu kennen, damit eine fundierte Entscheidung über die Verwendung von Block-, Datei- oder Objektspeicher getroffen werden kann.
Blockspeicher ist der häufigste Anwendungsfall für DAS- und SAN-Umgebungen. Bei DAS wird ein gesamtes RAID-Volume oder physisches Laufwerk dem Betriebssystem als unbearbeitetes und unformatiertes Volume zur Verfügung gestellt. Bei SAN-Umgebungen wird die gesamte LUN (bestehend aus mehreren physischen Laufwerken) dem Betriebssystem vom Speicher-Array über ein Hochgeschwindigkeitsnetzwerk zur Verfügung gestellt und erscheint als unbearbeitetes, unformatiertes Volume. Die zugrunde liegenden Schichten des unbearbeiteten Laufwerks bestehen aus kleineren Extents oder Sektoren, die vom Betriebssystem bearbeitet werden, und das zugrunde liegende Speichersubsystem ist in der Lage, diese logischen Blöcke bestimmten physischen Blöcken auf dem bzw. den jeweiligen Laufwerk(en) zuzuordnen. Die Speicherung auf Blockebene ist schnell, zuverlässig und ideal für sich ständig ändernde Daten wie relationale Datenbanken, OLTP-Datenbanken (Online Transaction Processing), E-Mail-Server oder virtuelle Desktop-Infrastrukturen, bei denen ein hoher Transaktionsdurchsatz und niedrige Latenzzeiten erforderlich sind.
Der Objektspeicher speichert die Daten (und die dazugehörigen Metadaten) in Containern mit eindeutigen Bezeichnungen, ohne Ordner oder Unterverzeichnisse wie beim Dateispeicher. Er nutzt das Konzept der Key-Value-Stores oder Schlüssel-Werte-Datenbanken, bei denen jeder Schlüssel auf einen bestimmten „Wert“ oder ein bestimmtes Datenelement verweist und über APIs abgerufen wird.
Der Objektspeicher wird vor allem für die Verarbeitung großer Mengen unstrukturierter Daten wie E-Mails, Backup-Images, Videoüberwachungsmaterial oder im IoT für die Datenverwaltung für maschinelles Lernen und Datenanalysen verwendet. Objektspeicher eignen sich gut für die Verarbeitung sehr großer Datenmengen und lassen sich so schnell skalieren, wie es die Anwendung erfordert, sind aber beim Datenabruf langsam, wodurch sie für Datenbanken oder Hochleistungsrechner ineffizient sind. Beispiele für Objektspeicher sind Amazon S3, Google Cloud Object Storage oder Azure Blob Storage.
Beim Dateispeicher werden Daten in Dateien gespeichert, die in Ordnern und Unterverzeichnissen organisiert sind und über ein Netzwerk mit SMB (Windows) oder NFS (Linux) freigegeben werden. Er ist ideal für die Zentralisierung von Speicherdateien wie Videos, Bilder oder Dokumente, ist aber nur begrenzt skalierbar, wenn die Datenmenge weiter wächst. Der Datenspeicher ist für sehr große Mengen unstrukturierter Daten oder die Verarbeitung sich ständig ändernder Daten, wie OLTP-Datenbanken, nicht am besten geeignet.