Desde la escasez de memoria hasta el aumento de los precios de las GPU, 2025 parecía un año de escasez significativa en la dependencia de suministro de todo lo relacionado con los semiconductores. Pero, ¿qué le depara el futuro a este mercado tan conveniente en los próximos primaveras?
Una escuela de pensamiento sugiere que en un par de primaveras, según cuenta la historia, los aceleradores hiperescaladores actuales se extenderán al mercado secundario en un diluvio al estilo criptográfico. Los ex-A100 y B200 baratos, que podrían considerarse desechos de fábricas de IA, de repente estarán disponibles para todos los demás que quieran comprarlos.
A menudo se supone que el hardware del centro de datos tiene un ciclo de vida finito y, a veces, corto, con programas de depreciación y ciclos de aggiornamento que hacen que el hardware más antiguo quede inservible luego de unos primaveras. Pero otro clan sugiere que la computación con IA no se comporta como un mercado de GPU de consumo, y la suposición de “tres primaveras y dinámico” es más inestable de lo que mucha muchedumbre quiere tolerar. Como dijo Stacy Rasgon, directora caudillo y analista senior de Bernstein, en una entrevista con Hardware Premium de Tomla idea de que “se desintegran luego de tres primaveras y no sirven, es una tontería”.
Hojas de ruta premium de Tom’s Hardware
Algunos creen que la coetáneo rigidez del mercado no es sólo una crisis temporal, sino más admisiblemente una condición estructural de la nueva norma post-IA en el mercado, con un circuito cerrado donde el hardware de última engendramiento circula entre un puñado de gigantes de la abundancia y la IA.
Entonces, ¿cuál es la sinceridad? Ben Bajarin, analista de Creative Strategies, describe el momento coetáneo como un “gigaciclo” en superficie de otro auge de chips. En su modelajelos ingresos mundiales por semiconductores aumentan de aproximadamente 650 mil millones de dólares en 2024 a más de 1 billón de dólares al final de la término. “Es necesario ponerse al día, pero incluso está el hecho de que la industria de los semiconductores sigue siendo relativamente conservadora, porque suele ser cíclica”, dijo Bajarin en una entrevista con Hardware Premium de Tom. “Así que todo el mundo está muy preocupado por el exceso de capacidad”.
Ese conservadurismo es importante porque la capacidad de fabricación de chips requiere tiempo, esfuerzo y mucho capital para ponerse en pie y ponerse en partidura. Es por esa razón que es probable que veamos que la tensión en el mercado persistirá por un tiempo todavía: la demanda está aumentando, sí, pero las empresas no están tan dispuestas a aumentar su ofrecimiento hasta que puedan asegurar absolutamente un retorno. “No quieren quedarse estancados con una capacidad de fundición o de suministro que no podrán utilizar internamente de siete u ocho primaveras”, dijo Bajarin.
mirando los numeros
Es posible producir más, pero no rápidamente y no sin bienes en dependencia. “Si nos fijamos en las previsiones de capacidad de obleas o de sustrato, nadie está aumentando”, advierte Bajarin.
Rasgon nos dijo que si admisiblemente no todo es fiel, las partes “verdaderamente estrictas” del sistema se concentran en la memoria. Rasgon señaló a Micron, uno de los tres gigantes mundiales de DRAM, que ha dicho La escasez de memoria podría persistir más allá de 2026impulsado en gran parte por la demanda de IA y la memoria de suspensión satisfecho de lado (HBM). Es trascendental que Micron cerró recientemente su negocio orientado al consumidor, Crucial, para centrarse en los productos más lucrativos que puede entregar y en los mercados en los que puede entregar.
HBM es un desafío diferente de fabricación y embalaje que puede aumentar la capacidad de producción. Según Rasgon, la producción de HBM consume muchos más bienes de obleas que la DRAM en serie, hasta tal punto que producir un gigabyte de HBM puede requerir “tres o cuatro veces más obleas” que producir un gigabyte de DDR5, lo que significa que trasladar la capacidad a HBM reduce efectivamente el número total de bits de DRAM que la industria puede suministrar.
El hecho de que los fabricantes de memorias den prioridad a HBM para los aceleradores no sólo afecta a los hiperescaladores. Tiene un propósito en dependencia en las PC, servidores y otros dispositivos cuando la DRAM en serie es más estricta y más cara de lo que sería de otra forma, razón por la cual las empresas han estado elevando los precios del hardware de consumo en las últimas semanas y meses. Los hiperescaladores a menudo pueden admitir costos de componentes más altos porque monetizan la computación directamente, ya sea a través de cargas de trabajo internas o inferencia alquilada. Todos los demás tienden a reparar la presión de forma más inmediata: los OEM y los fabricantes de sistemas enfrentan mayores costos de registro de materiales y cambios en los precios minoristas para peor si usted es un cliente final.
Bajarin cree que HBM será una de las limitaciones definitorias del resto de la término, y proyecta que se cuadriplicará hasta alcanzar más de 100 mil millones de dólares para 2030, al tiempo que señala que HBM3E puede requerir cerca de de tres veces el suministro de obleas por gigabyte en comparación con DDR5. Pero no es el único que piensa eso: Micron incluso ha hablado de ser incapaz de satisfacer toda la demanda de clientes esencia, sugiriendo que sólo puede suministrar entre la centro y dos tercios de la demanda esperada, incluso mientras aumenta el desembolso de renta y considera nuevos proyectos.
¿Dónde está el cuello de botella?
Hay varias razones para la escasez coetáneo, pero incluso si el mercado tuviera infinitas obleas y memoria infinita, aún podría toparse con un punto de estrangulamiento: el empaquetado liberal.
La industria ha estado intensificando su capacidad CoWoS (chip en sello sobre sustrato) de forma agresiva, pero incluso ha sido inusualmente abierta sobre lo difícil que es adelantarse a la demanda. A principios de 2025, el director ejecutor de Nvidia, Jensen Huang dicha capacidad caudillo de embalaje descubierta se había cuadruplicado en menos de dos primaveras, pero seguía siendo un cuello de botella para la empresa.
No es sólo Nvidia la que está afrontando el desafío. fuerza de tendenciaque sigue de cerca el espacio, ha proyectado La capacidad CoWoS de TSMC aumentará a cerca de de 75.000 obleas por mes en 2025 y alcanzará aproximadamente entre 120.000 y 130.000 obleas por mes a finales de 2026. Este crecimiento es un gran brinco, pero incluso es poco probable que alivie las limitaciones de capacidad actuales.
Bajarin destacó la razón en su disección: el desembolso de renta de los cuatro principales proveedores de abundancia (Amazon, Google, Microsoft y Meta) se duplicó a aproximadamente 600 mil millones de dólares anuales en sólo dos primaveras. Rasgon señaló que algunas empresas pueden terminar con una ofrecimiento limitada por razones que no tienen ausencia que ver con que la demanda de vanguardia esté “fuera de serie”. En el caso de Intel, argumentó, se negociación en parte de dónde está la demanda frente a dónde se ha cortadura la capacidad. “En sinceridad, estaban desechando herramientas de esa engendramiento preliminar y vendiéndolas por unos centavos de dólar”, dijo.
‘Previsiones’ frente a ‘conjeturas’
Aunque puede parecer obvio que la demanda seguirá creciendo correcto a la forma en que las grandes empresas tecnológicas están gastando capital, puede resultar difícil pronosticar con precisión la demanda futura correcto a la forma en que funciona el mercado de chips.
Rasgon dijo que las empresas de semiconductores se encuentran “al final de la dependencia de suministro”, lo que limita su capacidad de ver claramente la demanda final y fomenta comportamientos que hacen que la señal sea más ruidosa. Es un círculo vicioso que se exacerba cuando el suministro es particularmente circunscrito y los plazos de entrega se alargan porque los clientes comienzan a acopiar los chips que tienen y a realizar pedidos dobles de nuevas opciones, porque están tratando de conseguir piezas desde cualquier superficie que puedan.
Eso puede hacer que la demanda parezca artificialmente enorme hasta que los plazos de entrega se relajen y comiencen las cancelaciones. Los proveedores quieren evitar encontrarse atrapados dimensionando su producción para una demanda que no se materializa. “La previsión en semiconductores en caudillo es un problema sin resolver”, afirmó Rasgon. “Mi creencia caudillo es que la decano parte, o francamente toda, la visibilidad actual de la gobierno de semiconductores sobre lo que está sucediendo con la demanda es precisamente cero”.
Bajarin señala que la industria trabaja “muy metódicamente” porque recuerda los ciclos de auge y caída, especialmente en la memoria. “Vamos a tener que habitar en un ciclo previsible de escasez de ofrecimiento correcto a estas dinámicas que son históricamente ciertas en la industria de los semiconductores”, afirmó.
Cuando el mercado se relaja y la ofrecimiento se normaliza, es inverosímil saberlo, como corresponde a un mercado que lucha con las previsiones. “Mientras estemos en este ciclo en el que verdaderamente estamos construyendo una nueva infraestructura fundamental en torno a la IA, la ofrecimiento seguirá siendo limitada en el futuro previsible, si no durante todo este ciclo, simplemente correcto a ciclos previos de auge y caída internamente de la industria de los semiconductores”, dijo Bajarin.
Pero incluso si la industria pudiera imprimir aceleradores mágicamente, todavía necesita un superficie donde ejecutarlos. Los centros de datos toman tiempo para construirse, conectarse a la energía y enfriarse a escalera. “Incluso si fabricamos todas estas GPU, verdaderamente no podemos albergarlas porque no tenemos los gigavatios”, dijo Bajarin. Sin requisa, con la planificación de pequeños reactores modulares y la expansión de las redes eléctricas, hay esperanzas de que eventualmente se pueda satisfacer la falta.
Ciclos de chips y reciclaje.
Otro posible desbloqueo del mercado conveniente es la oportunidad de reutilizar GPU de generaciones anteriores a medida que ingresan al mercado comercializado, gracias a las generaciones más nuevas de chips que circulan constantemente por las grandes empresas de tecnología que desean lo postrer en inferencia y capacitación.
Ya se pueden encontrar pequeños volúmenes de GPU de centros de datos más antiguas en el mercado, incluidas listados de hardware de clase Nvidia A100 a través de revendedores y corredores. Pero la extraña engendramiento más antigua de chips que existe está a un mundo de distancia de un exceso de estilo criptográfico de antiguos aceleradores de IA que aparecen en el mercado. Si admisiblemente las empresas de IA quieren todos los chips de última engendramiento que puedan conseguir, siquiera necesariamente se están deshaciendo de sus existencias más antiguas. Un acelerador de variedad inscripción no es una plástico gráfica de consumo que se vuelve obsoleta en un par de primaveras. Es un admisiblemente de renta. Y las empresas de IA están aprendiendo a sudar.
La directora financiera de OpenAI, Sarah Friar, subrayó esto en noviembre: admitiendo que OpenAI todavía utiliza los chips Ampere de Nvidia, lanzados en 2020, para realizar inferencias sobre sus modelos orientados al consumidor. La capacitación puede utilizar tecnología de punta, pero la inferencia puede aplicarse de forma rentable a las generaciones mayores durante mucho tiempo. Si OpenAI piensa de esa forma, incluso lo harán otras empresas en el espacio. “Por supuesto, todavía se utilizan los productos más antiguos”, afirma Rasgon. “Y de hecho, no sólo se está utilizando, sino que se está utilizando de forma muy, muy rentable”.
Por ahora, la conclusión más clara es que la escasez coetáneo no se negociación solo de producir más chips. Se negociación de si la industria puede construir suficiente cantidad de todo lo que la rodea –incluidos los edificios, la refrigeración y las conexiones a la red para operarlos– lo suficientemente rápido para satisfacer la demanda que aún se está acelerando. “Vamos a permanecer en una relativa restricción de ofrecimiento en todos estos vectores hasta que hayamos construido todo y tengamos suficiente computación”, dijo Bajarin, “o es una burbuja y colapsa”.





