Simplificando la pila de IA: la esencia para una inteligencia escalable y portátil desde la nimbo hasta el borde

Presentado por benefactor

Una pila de software más simple es la esencia para una IA portátil y escalable en la nimbo y en el perímetro.

La IA ahora impulsa aplicaciones del mundo vivo, pero las pilas de software fragmentadas la están frenando. Los desarrolladores reconstruyen asiduamente los mismos modelos para diferentes objetivos de hardware, perdiendo tiempo pegando el código en oportunidad de mandar funciones. La buena anuncio es que se está produciendo un cambio. Las cadenas de herramientas unificadas y las bibliotecas optimizadas hacen posible implementar modelos en todas las plataformas sin comprometer el rendimiento.

Sin requisa, aún queda un obstáculo crítico: la complejidad del software. Las herramientas dispares, las optimizaciones específicas del hardware y las pilas de tecnología en capas continúan obstaculizando el progreso. Para desbloquear la próxima ola de innovación en IA, la industria debe alejarse decisivamente del mejora marginado y adoptar plataformas optimizadas de extremo a extremo.

Esta transformación ya está tomando forma. Los principales proveedores de nimbo, proveedores de plataformas de borde y comunidades de código destapado están convergiendo en cadenas de herramientas unificadas que simplifican el mejora y aceleran la implementación, desde la nimbo hasta el borde. En este artículo, exploraremos por qué la simplificación es la esencia para una IA escalable, qué impulsa este impulso y cómo las plataformas de próxima reproducción están convirtiendo esa visión en resultados del mundo vivo.

El cuello de botella: fragmentación, complejidad e ineficiencia

El problema no es sólo la variedad de hardware; es el esfuerzo duplicado entre marcos y objetivos lo que ralentiza el tiempo de fabricación de valencia.

Diversos objetivos de hardware: GPU, NPU, dispositivos solo de CPU, SoC móviles y aceleradores personalizados.

Fragmentación de herramientas y marcos.: TensorFlow, PyTorch, ONNX, MediaPipe y otros.

Restricciones de borde: Los dispositivos requieren un rendimiento energéticamente efectivo y en tiempo vivo con una sobrecarga mínima.

De acuerdo a Investigación de Gartnerestos desajustes crean un obstáculo esencia: más del 60% de las iniciativas de IA se estancan ayer de la producción, impulsadas por la complejidad de la integración y la variabilidad del rendimiento.

Cómo se ve la simplificación del software

La simplificación se está fusionando en torno a cinco medidas que reducen los costos y riesgos de la reingeniería:

Capas de contemplación multiplataforma que minimizan la reingeniería al portar modelos.

Bibliotecas optimizadas para el rendimiento integrado en los principales marcos de ML.

Diseños arquitectónicos unificados que escalera desde el centro de datos hasta el móvil.

Estándares abiertos y tiempos de ejecución (p. ej., ONNX, MLIR) reduciendo el incomunicación y mejorando la compatibilidad.

Ecosistemas centrados en el desarrollador enfatizando la velocidad, reproducibilidad y escalabilidad.

Estos cambios están haciendo que la IA sea más accesible, especialmente para las empresas emergentes y los equipos académicos que ayer carecían de medios para una optimización personalizada. Proyectos como los puntos de remisión Optimum y MLPerf de Hugging Face incluso están ayudando a estandarizar y validar el rendimiento entre hardware.

Impulso del ecosistema y señales del mundo vivo La simplificación ya no es una aspiración; está sucediendo ahora. En toda la industria, las consideraciones de software están influyendo en las decisiones a nivel de diseño de IP y silicio, lo que da como resultado soluciones que están listas para producción desde el primer día. Los principales actores del ecosistema están impulsando este cambio alineando los esfuerzos de mejora de hardware y software, brindando una integración más estrecha en toda la pila.

Un catalizador esencia es el rápido aumento de la inferencia periférica, donde los modelos de IA se implementan directamente en dispositivos en oportunidad de en la nimbo. Esto ha intensificado la demanda de pilas de software optimizadas que admitan la optimización de un extremo a otro, desde el silicio hasta el sistema y la aplicación. Empresas como Arm están respondiendo permitiendo un engranaje más angosto entre sus plataformas informáticas y cadenas de herramientas de software, ayudando a los desarrolladores a acelerar el tiempo de implementación sin ofrendar el rendimiento o la portabilidad. La aparición de modelos de fundaciones multimodales y de propósito caudillo (por ejemplo, LLaMA, Gemini, Claude) incluso ha añadido emergencia. Estos modelos requieren tiempos de ejecución flexibles que puedan subir en entornos de nimbo y de borde. Los agentes de IA, que interactúan, se adaptan y realizan tareas de forma autónoma, impulsan aún más la obligación de software multiplataforma de ingreso eficiencia.

MLPerf Inference v3.1 incluyó más de 13.500 resultados de rendimiento de 26 remitentes, lo que validó la evaluación comparativa multiplataforma de cargas de trabajo de IA. Los resultados abarcaron tanto el centro de datos como los dispositivos perimetrales, lo que demuestra la complejidad de implementaciones optimizadas que ahora se están probando y compartiendo.

En conjunto, estas señales dejan claro que la demanda y los incentivos del mercado se están alineando en torno a un conjunto global de prioridades, que incluyen maximizar el rendimiento por vatio, asegurar la portabilidad, minimizar la latencia y ofrecer seguridad y coherencia a escalera.

¿Qué debe suceder para que la simplificación tenga éxito?

Para hacer efectividad la promesa de las plataformas de IA simplificadas, deben ocurrir varias cosas:

Musculoso codiseño de hardware/software: características de hardware que están expuestas en marcos de software (p. ej., multiplicadores de matriz, instrucciones de acelerador) y, a la inversa, software diseñado para rendir el hardware subyacente.

Bibliotecas y cadenas de herramientas consistentes y sólidas: los desarrolladores necesitan bibliotecas confiables y perfectamente documentadas que funcionen en todos los dispositivos. La portabilidad del rendimiento sólo es útil si las herramientas son estables y cuentan con buen soporte.

Ecosistema destapado: Los proveedores de hardware, los mantenedores del situación de software y los desarrolladores de modelos deben cooperar. Los estándares y los proyectos compartidos ayudan a evitar reinventar la rueda para cada nuevo dispositivo o caso de uso.

Abstracciones que no oscurecen el rendimiento: si perfectamente la contemplación de detención nivel ayuda a los desarrolladores, aún debe permitir el ajuste o la visibilidad cuando sea necesario. El estabilidad adecuado entre contemplación y control es esencia.

Seguridad, privacidad y confianza integradas: especialmente a medida que más computación cambia a dispositivos (periféricos/móviles), cuestiones como la protección de datos, la ejecución segura, la integridad del maniquí y la privacidad son importantes.

Arm como un ejemplo de simplificación impulsada por el ecosistema

La simplificación de la IA a escalera ahora depende del diseño de todo el sistema, donde el silicio, el software y las herramientas de mejora evolucionan al mismo tiempo. Este enfoque permite que las cargas de trabajo de IA se ejecuten de modo efectivo en diversos entornos, desde clústeres de inferencia en la nimbo hasta dispositivos periféricos con cacharros limitada. Todavía reduce los gastos generales de la optimización personalizada, lo que facilita el dispersión de nuevos productos al mercado con decano celeridad. Arm (Nasdaq:Arm) está avanzando en este maniquí con un enfoque centrado en la plataforma que impulsa las optimizaciones de hardware y software a través de la pila de software. En COMPUTEX 2025Arm demostró cómo sus últimas CPU Arm9, combinadas con extensiones ISA específicas de IA y las bibliotecas Kleidi, permiten una integración más estrecha con marcos ampliamente utilizados como PyTorch, ExecuTorch, ONNX Runtime y MediaPipe. Esta afiliación reduce la obligación de kernels personalizados u operadores ajustados manualmente, lo que permite a los desarrolladores desbloquear el rendimiento del hardware sin desistir cadenas de herramientas familiares.

Las implicaciones en el mundo vivo son significativas. En el centro de datos, las plataformas basadas en Arm ofrecen un rendimiento por vatio mejorado, fundamental para subir las cargas de trabajo de IA de modo sostenible. En los dispositivos de consumo, estas optimizaciones permiten experiencias de adjudicatario con gran capacidad de respuesta e inteligencia en segundo plano que está siempre activa y, al mismo tiempo, es energéticamente efectivo.

En términos más generales, la industria se está uniendo en torno a la simplificación como un imperativo de diseño, integrando el soporte de IA directamente en las hojas de ruta del hardware, optimizando la portabilidad del software y estandarizando el soporte para los tiempos de ejecución de IA convencionales. El enfoque de Arm ilustra cómo la integración profunda entre la pila informática puede hacer que la IA escalable sea una efectividad actos.

Garra e impulso del mercado.

En 2025, Casi la centro de la computación enviada a los principales hiperescaladores se ejecutará en arquitecturas basadas en Arm.un hito que subraya un cambio significativo en la infraestructura de la nimbo. A medida que las cargas de trabajo de IA consumen más medios, los proveedores de nimbo están dando prioridad a arquitecturas que ofrecen un rendimiento por vatio superior y admiten una portabilidad de software perfecta. Esta transformación marca un vuelta importante cerca de una infraestructura escalable y energéticamente efectivo optimizada para el rendimiento y las demandas de la IA moderna.

En el borde, los motores de inferencia compatibles con Arm permiten experiencias en tiempo vivo, como traducción en vivo y asistentes de voz siempre activos, en dispositivos que funcionan con baterías. Estos avances aportan potentes capacidades de IA directamente a los usuarios, sin ofrendar la eficiencia energética.

El impulso de los desarrolladores incluso se está acelerando. En una colaboración nuevo, GitHub y Arm introdujeron ejecutores nativos de Arm Linux y Windows para GitHub Actions, optimizando los flujos de trabajo de CI para plataformas basadas en Arm. Estas herramientas reducen la barrera de entrada para los desarrolladores y permiten un mejora multiplataforma más efectivo a escalera.

¿Qué viene a posteriori?

La simplificación no significa eliminar por completo la complejidad; significa gestionarlo de modo que potencien la innovación. A medida que la pila de IA se estabilice, los ganadores serán aquellos que ofrezcan un rendimiento consumado en un panorama fragmentado.

Desde una perspectiva de cara al futuro, espere:

Puntos de remisión como barandillas: Mentor de suites MLPerf + OSS sobre dónde optimizar a continuación.

Más aguas hacia lo alto, menos bifurcaciones: Las características de hardware se encuentran en herramientas convencionales, no en ramas personalizadas.

Convergencia de investigación + producción: Transferencia más rápida de los documentos al producto a través de tiempos de ejecución compartidos.

Conclusión

La próxima etapa de la IA no se tráfico de hardware extravagante; incluso se tráfico de software que viaja perfectamente. Cuando el mismo maniquí llega de modo efectivo a la nimbo, al cliente y al borde, los equipos realizan envíos más rápido y dedican menos tiempo a recobrar la pila.

La simplificación de todo el ecosistema, no los eslóganes liderados por marcas, separará a los ganadores. El manual práctico es claro: uniformar plataformas, optimizaciones ascendentes y determinar con puntos de remisión abiertos. Explore cómo las plataformas de software Arm AI están permitiendo este futuro: de modo efectivo, segura y a escalera.

Los artículos patrocinados son contenido producido por una empresa que paga por la publicación o tiene una relación comercial con VentureBeat, y siempre están claramente marcados. Para más información, póngase en contacto ventas@venturebeat.com.

DeUltimoMinuto

Or check our Popular Categories...

DeUltimoMinuto

Or check our Popular Categories...

Simplificando la pila de IA: la esencia para una inteligencia escalable y portátil desde la nimbo hasta el borde

El cuello de botella: fragmentación, complejidad e ineficiencia

Cómo se ve la simplificación del software

¿Qué debe suceder para que la simplificación tenga éxito?

Arm como un ejemplo de simplificación impulsada por el ecosistema

Garra e impulso del mercado.

¿Qué viene a posteriori?

Conclusión

ztevenreal

Related Posts

Se suponía que el 4K nativo sería el final del serie, pero la restablecimiento cambió eso

Scale AI venablo Voice Showdown, el primer punto de relato del mundo positivo para IA de voz, y los resultados son humillantes para algunos de los mejores modelos.

You Missed

Ligia Bonetti insta unir carácter y humanidad

Se suponía que el 4K nativo sería el final del serie, pero la restablecimiento cambió eso

Meditación puede someter la actividad de genes asociados al envejecimiento y el estrés

Dominicanos en el exógeno podrán comprar su cédula en mayo sin presentarse en el mes de cumpleaños

Scale AI venablo Voice Showdown, el primer punto de relato del mundo positivo para IA de voz, y los resultados son humillantes para algunos de los mejores modelos.

Jair Bolsonaro sigue en cuidados intensivos