
Mark Papermaster, Director de Tecnología de AMD, introdujo formalmente los aceleradores Instinct MI355X de la compañía para AI y HPC en ISC 2025, revelando mejoras de rendimiento masivas para la inferencia de IA, pero todavía señalando el consumo de energía casi duplicado de la nueva GPU insignia en comparación con su predecesor de 2023, informa informes, informa informes, informa Cojín de la computadora.
El ADNc 4 de AMD entra en número
Las GPU de la serie MI350X de AMD se basan en la edificio de ADNc 4 que introduce soporte para formatos de precisión FP4 y FP6 conexo con FP8 y FP16. Estos formatos de pequeño precisión han crecido en relevancia en las cargas de trabajo de IA, particularmente para la inferencia. AMD posiciona sus procesadores Instinct MI350X principalmente para la inferencia, lo que tiene sentido como escalera de tamaño mundial de MI350X continúa limitándose a ocho GPU, lo que reduce sus capacidades competitivas en comparación con las GPU Blackwell de Nvidia. Todavía Pegatron está preparando una máquina MI350X de 128 vías.
La grupo MI350X de AMD de AI y HPC GPU consta de dos modelos: el módulo MI350X instinto predeterminado con un consumo de energía de 1000W diseñado para el refrigeramiento de atmósfera, así como el Instinct MI355X de decano rendimiento que consumirá hasta 1400W y estará diseñada principalmente para la refrigeramiento de humor directo (aunque AMD cree que algunos de sus clientes podrán usar el atmósfera para usar el atmósfera.
Uno y otro SKU vendrán con una memoria HBM3E 288GB que ofrecerá hasta 8 TB/s de encantado de lado, pero el MI350X ofrecerá un rendimiento mayor de FP4/FP6 de 18.45 PFLOP, mientras que el MI355X se lleva al mayor de FP4/FP6 a 20.1 Pflops. En el papel, los dos modelos Instinct MI350X superan a la GPU B300 (Blackwell Intolerante) de NVIDIA que supera a 15 FP4 PFLOPS, aunque queda por ver cómo el MI350X y MI355X de AMD funcionan en aplicaciones del mundo efectivo.
Fila 0 – celda 0 |
AMD Instinct MI325X GPU |
AMD Instinct MI350X GPU |
Plataforma AMD Instinct MI350X (8x OAM) |
AMD Instinct MI355X GPU |
Plataforma AMD Instinct MI355X (8x OAM) |
GPU |
Instinct MI325X OAM |
Instinct MI350X OAM |
8x instinto mi350x oam |
Instinct MI355X OAM |
8x Instinct MI355X OAM |
Construcción de GPU |
ADNc 3 |
ADNc 4 |
ADNc 4 |
ADNc 4 |
ADNc 4 |
Tamaño de memoria dedicado |
256 GB HBM3E |
288 GB HBM3E |
2.3 TB HBM3E |
288 GB HBM3E |
2.3 TB HBM3E |
Encantado de lado de memoria |
6 TB/s |
8 TB/s |
8 TB/s por OAM |
8 TB/s |
8 TB/s por OAM |
Rendimiento de la medio de la medio de precisión (FP16) |
2.61 Pflops |
4.6 Pflops |
36.8 Pflops |
5.03 Pflops |
40.27 Pflops |
Rendimiento mayor de precisión de ocho bits (FP8) |
5.22 Pflops |
9.228 Pflops |
72 Pflops |
10.1 Pflops |
80.53 Pflops |
Rendimiento de precisión de seis bits (FP6) pico |
– |
18.45 Pflops |
148 Pflops |
20.1 Pflops |
161.06 Pflops |
Rendimiento de precisión de cuatro bits (FP4) de cuatro bits |
– |
18.45 Pflops |
148 Pflops |
20.1 Pflops |
161.06 Pflops |
Refrigeramiento |
Flato |
Flato |
Flato |
Dlc / atmósfera |
Dlc / atmósfera |
Potencia de placa típica (TBP) |
Pico de 1000W |
Pico de 1000W |
Pico de 1000W por OAM |
Pico de 1400W |
Pico de 1400W por OAM |
Cuando se prostitución de la comparación de rendimiento con su predecesor, el rendimiento de cálculo de FP8 del MI350X se enumera a aproximadamente 9.3 PFLOPS, mientras que el MI355X más rápido se dice que es 10.1 PFLOPS, hasta 2.61/5.22 FLOPS FP8 (sin/con escasez estructurada) en el Instincer MI325X, hasta un rendimiento significativo, esto representa una mejoramiento de rendimiento significativo. Mientras tanto, el MI355X todavía supera al B300 de NVIDIA por 0.1 FP8 PFLOPS.
GPU más rápidas entrantes
Papermaster expresó su confianza en que la industria continuará desarrollando CPU y aceleradores aún más poderosos para las supercomputadoras para conseguir el rendimiento de Zettascale en aproximadamente una término a partir de ahora. Sin bloqueo, ese rendimiento tendrá el costo de un válido aumento del consumo de energía, por lo que una supercomputadora que ofrece un rendimiento de Zetaflops podría consumir 500 MW de energía, la medio de lo que una planta de energía nuclear puede producir.
En ISC 2025, AMD presentaron datos que muestran que las supercomputadoras principales han seguido constantemente una trayectoria en la que el rendimiento calculador se duplica aproximadamente cada 1,2 abriles. El descriptivo cubrió el rendimiento desde 1990 hasta el presente, demostrando GFLOPS del sistema mayor. El crecimiento temprano fue impulsado por los sistemas solo de CPU, pero desde cerca de de 2005, un cambio a arquitecturas heterogéneas, mezclar CPU con GPU y aceleradores, se hizo cargo. Ahora, en lo que AMD apasionamiento ‘Era de precipitación de AI, sistemas como El Capitan y Frontier están empujando más allá de 1 exaflop, continuando la tendencia de crecimiento exponencial con hardware cada vez más especializado por IA.
Pero el rendimiento tiene un costo de consumo de energía. Para abastecer el crecimiento del rendimiento, el encantado de lado de la memoria y la escalera de potencia se han convertido en desafíos urgentes. La diapositiva de AMD indicó que el encantado de lado de la memoria GPU debe más del doble de cada dos abriles para preservar la relación de encantado de lado por flops. Esto ha requerido aumentar el número de pilas HBM por GPU, lo que a su vez da como resultado GPU y módulos más grandes y hambrientos de potencia.
De hecho, el consumo de energía de los aceleradores para las supercomputadoras está aumentando rápidamente. Mientras que el Instinct MI300X de AMD se introdujo a mediados de 2023 consumió 750W Peak, el instinto MI355X, que se presentará formalmente esta semana, contará con un consumo mayor de energía de 1.400W. Papermaster prevé aceleradores de 1,600 W en 2026 – 2027 y luego procesadores de 2,000W a finales de esta término. Por el contrario, los compañeros de AMD de Nvidia parecen ser aún más ambiciosos cuando se prostitución de consumo de energía, ya que se aplazamiento que sus GPU de Rubin Intolerante con cuatro chiplets de enumeración de tamaño retícula consuman hasta 3.600W.
La buena novedad es que, adicionalmente del aumento del consumo de energía, las supercomputadoras y los aceleradores todavía han estado ganando eficiencia de rendimiento rápidamente. Otra de las diapositivas secreto de AMD ISC 2025 ilustra que la eficiencia de rendimiento aumentó de aproximadamente 3.2 GFLOPS/W en 2010 a aproximadamente 52 GFLOPS/W cuando llegaron los sistemas Exascale como Frontier.
Mirando con destino a el futuro, abastecer este ritmo de escalera de rendimiento requerirá duplicar la eficiencia energética cada 2.2 abriles. Un sistema de Zettascale proyectado que ofrece un rendimiento de clase exagera de 1,000 × necesitaría cerca de de 500 MW de potencia a un nivel de eficiencia de 2,140 GFLOPS/W (un aumento de 41 veces a partir de hoy). Sin tales ganancias, las supercomputadoras futuras podrían exigir energía a escalera de Gigawatt, comparable a una planta de energía nuclear completa, lo que las hace demasiado caras para intervenir.
AMD cree que para aumentar el rendimiento de las supercomputadoras dramáticamente interiormente de una término, no solo tendrá que hacer una serie de avances arquitectónicos, sino que la industria tendrá que abastecer el ritmo de las capacidades de cálculo para proporcionar un encantado de lado de memoria adecuado. Aún así, el uso de reactores nucleares para las supercomputadoras de potencia parece en la término de 2030 parece ser una posibilidad cada vez más realista.
Seguir Hardware de Tom en Google News Para obtener nuestras noticiero, exploración y revisiones actualizadas en sus feeds. Asegúrese de hacer clic en el interruptor Forzar.