
Pegatron mostró una alternativa única a escalera de chasis basada en los aceleradores MI350X Instinct MI350X de 128 AMD diseñados para aplicaciones de inferencia y capacitación de IA que demuestra el rendimiento en Computex. El sistema precede a las soluciones a escalera de rack diseñada interna de AMD por una gestación, por lo que para Pegatron, este sistema servirá como un transporte de entrenamiento para construir soluciones IF64 e IF128 basadas en AMD a escalera de rack a aproximadamente un año.
El sistema Pegatron AS501-4A1/AS500-4A1 de escalera de rack se fundamento en ocho bandejas de cuenta de 5U, cada una empacando un procesador AMD EPYC 9005-Series y cuatro aceleradores AM3 Instinct MI350X AI y HPC para AI y HPC. La CPU y los aceleradores están refrigerados por líquidos para asegurar el mayor y predecible rendimiento bajo cargas altas. La máquina viene en un delegado de formulario 51OU ORV3, lo que lo hace adecuado para centros de datos en la estrato que se basan en los estándares OCP (léase: meta).
La máquina conecta las GPU ubicadas en un chasis diferente con 400 GBE, ya que AMD no tiene interruptores propietarios para las conexiones de tela infinita (en cualquier caso, el tamaño mundial de ampliación máxima del instinto de AMD son ocho procesadores en la ahora). Esto contrasta con la plataforma GB200/GB300 NVL72 de NVIDIA, que tiene 72 GPU interconectadas con la conexión NVLINK extremista rápida de la compañía. Con ese fin, el sistema instinto MI350X escasamente coincidirá con el GB200/GB300 NVL72 en términos de escalabilidad.
La nueva máquina será utilizada por los adoptantes de OCP para sus cargas de trabajo inmediatas y para formarse a construir mejor sistemas basados en instinto AMD con un montón de GPU tanto desde los puertos de visión de hardware como de software. La máquina de Pegatron es difícil de sobreestimar por múltiples razones, principalmente de las cuales está preparando el tablas para desafiar el dominio de Nvidia en las soluciones de IA a escalera de rack.
Legado lo que sabemos sobre el Instinct MI350X de AMD, el sistema a escalera de rack de 128 gpu de Pegatron basado en estas unidades ofrece un pico teórico de 1.177 PFLOPS PFLOPS de FP4 Computs para inferencia, suponiendo una escalabilidad seguido casi casi seguido. Con cada MI350X que admite hasta 288 GB de HBM3E, el sistema ofrece 36.8TB de memoria de inscripción velocidad, lo que permite soporte para modelos de IA masivos que exceden la capacidad de las GPU actuales basadas en Blackwell de NVIDIA.
Sin confiscación, su dependencia de Ethernet para la comunicación de GPU a GPU limita la escalabilidad del sistema. Con un dominio de escalera mayor de ocho GPU, el sistema probablemente esté construido para cargas de trabajo de inferencia o capacitación en múltiples instancias en punto del entrenamiento LLM estrictamente sincronizado, donde los sistemas NVL72 de NVIDIA se exceden. Aún así, sirve como una alternativa rica en memoria de suspensión rendimiento hoy en día y un precursor cerca de las soluciones de la serie MI400 de la próxima gestación de AMD.
Seguir Hardware de Tom en Google News Para obtener nuestras parte, estudio y revisiones actualizadas en sus feeds. Asegúrese de hacer clic en el interruptor Forzar.