
El entrenamiento de un modelo de aprendizaje automático puede consumir más ciclos de CPU, memoria y ancho de banda de E/S que cualquier otra tarea de software. Un único modelo de vanguardia puede leer y escribir cientos de terabytes de datos en múltiples épocas, superando los límites incluso de las matrices de almacenamiento más rápidas. Con el surgimiento de la carrera de la IA y a medida que todas las industrias y agencias gubernamentales compiten para superar los límites de rendimiento de la IA, la necesidad de una forma fiable y repetible de comparar recursos de hardware específicos para las cargas de trabajo de aprendizaje automático se ha vuelto esencial. El grupo MLCommons ha sido pionero en este esfuerzo con MLPerf Storage v2.0, ya que ha introducido métodos innovadores para evaluar el rendimiento del almacenamiento en lo que respecta al entrenamiento y la inferencia del aprendizaje automático. En este documento técnico se explora el rendimiento de los SSD DC3000ME PCIe Gen5 NVMe U.2 de Kingston de acuerdo con el marco de evaluación comparativa de MLPerf sin necesidad de ningún costoso hardware de GPU. Al utilizar la emulación del sueño, MLPerf simula las cargas de trabajo de IA del mundo real, lo que permite a las organizaciones probar el rendimiento del almacenamiento de una manera rentable y escalable.
¿Por qué es importante? Un almacenamiento rápido mantiene la productividad de las GPU, ya que permite proporcionar datos de forma rápida, minimizar el tiempo de inactividad y maximizar la eficiencia de cómputo. Las unidades DC3000ME de Kingston ayudan a las organizaciones a acelerar los ciclos de entrenamiento, reducir los costes de infraestructura y lograr un rendimiento escalable con menos unidades, lo que las convierte en una inversión inteligente para implementaciones de IA modernas.
En este documento técnico, abordamos lo siguiente:
- Examinamos el nuevo método de prueba de emulación del sueño de almacenamiento MLPerf v2
- Presentamos las distintas cargas de trabajo de entrenamiento y control cubiertas por el almacenamiento de MLPerf v2
- Analizamos los resultados de la presentación de las DC3000ME de Kingston en las cargas de trabajo de entrenamiento y control de las plataformas PCIe Gen5 y Gen4
Los resultados muestran que las soluciones PCIe Gen5 NVMe, como la DC3000ME, constituyen una opción convincente para las organizaciones que buscan acelerar al máximo los ciclos y aprovechar las GPU el máximo número de horas activas posible en sus flujos de trabajo de aprendizaje automático. Profundizamos en los parámetros ajustables, la metodología de prueba y los ajustes realizados tras los análisis de prueba, y cómo todo ello afecta a distintos tipos de cargas de trabajo.
Los SSD DC3000ME PCIe Gen5 NVMe U.2 de Kingston son una solución de alto impacto para las cargas de trabajo de IA. Independientemente de si desea entrenar modelos de aprendizaje profundo o afinar grandes modelos de lenguaje, estas unidades le ofrecen la velocidad, fiabilidad y eficiencia necesarias para mantenerse a la vanguardia en la carrera de la IA.
Descargar el documento