Apple hace que la IA importante avance con la tecnología de gestación de imágenes que rivaliza con Dall-E y MidJourney


Únase al evento confiable por los líderes empresariales durante casi dos décadas. VB Transform reúne a las personas que construyen una táctica de IA empresarial verdadero. Obtenga más información


Manzana‘s Investigación de formación automotriz El equipo ha desarrollado un sistema de IA renovador para difundir imágenes de reincorporación resolución que podrían desafiar el dominio de los modelos de difusión, la tecnología que alimenta a los generadores de imágenes populares como De y Intermediario.

El avance, detallado en un artículo de investigación publicado la semana pasada, presenta “Flujo de estrellas“, Un sistema desarrollado por los investigadores de Apple en colaboración con socios académicos que combina flujos de normalización con transformadores autorregresivos para ganar lo que el equipo fogosidad” rendimiento competitivo “con modelos de difusión de última gestación.

El avance llega en un momento crítico para Apple, que ha enfrentado Crítica creciente sobre sus luchas con la inteligencia industrial. En el lunes Conferencia mundial de desarrolladoresla compañía solo dio a conocer actualizaciones de IA modestas a su Inteligencia de Apple Plataforma, destacando la presión competitiva que enfrenta una compañía que muchos ven que se quedan a espaldas en la carrera armamentista de IA.

“Hasta donde sabemos, este trabajo es la primera demostración exitosa de la normalización de los flujos que funcionan de guisa efectiva a esta escalera y resolución”, escribió el equipo de investigación, que incluye a los investigadores de formación de Apple Machine Jiatao GU, Joshua M. Susskind y Shuangfei Zhai, yuxtapuesto con colaboradores académicos de instituciones que incluyen UC Berkeley y Georgia Tech.

Cómo Apple está luchando contra Operai y Google en las guerras de AI

El Flujo de estrellas La investigación representa el esfuerzo más amplio de Apple para desarrollar capacidades de IA distintivas que podrían diferenciar sus productos de los competidores. Mientras que a las empresas como Google y Opadai han dominado los titulares con sus avances generativos de IA, Apple ha estado trabajando en enfoques alternativos que podrían ofrecer ventajas únicas.

El equipo de investigación abordó un desafío fundamental en la gestación de imágenes de IA: prosperar los flujos de normalización para trabajar de guisa efectiva con imágenes de reincorporación resolución. Los flujos de normalización, un tipo de maniquí generativo que aprende a variar las distribuciones simples en las complejas, se han eclipsado tradicionalmente por modelos de difusión y redes adversas generativas en aplicaciones de síntesis de imágenes.

“Starflow logra un rendimiento competitivo en las tareas de gestación de imágenes de clase y condicional de texto, que se acerca a los modelos de difusión de última gestación en la calidad de la muestra”, escribieron los investigadores, demostrando la versatilidad del sistema en diferentes tipos de desafíos de síntesis de imágenes.

Adentro del avance matemático que impulsa el nuevo sistema de IA de Apple

El equipo de investigación de Apple introdujo varias innovaciones esencia para pasar las limitaciones de los enfoques de flujo de normalización existentes. El sistema emplea lo que los investigadores llaman un “diseño de cajón profundo”, utilizando “un piedra de transformador profundo (que) captura la viejo parte de la capacidad de representación del maniquí, complementado por unos pocos bloques de transformadores poco profundos que son computacionalmente eficientes pero sustancialmente beneficiosos”.

El avance además implica intervenir en el “espacio velado de los autoencoders de petróleo, lo que resulta más efectivo que el modelado de nivel de píxel directo”, según el documento. Este enfoque permite que el maniquí funcione con representaciones comprimidas de imágenes en lado de datos de píxeles sin procesar, mejorando significativamente la eficiencia.

A diferencia de los modelos de difusión, que dependen de los procesos de renovación iterativa, Flujo de estrellas Mantiene las propiedades matemáticas de la normalización de los flujos, lo que permite el “entrenamiento exacto de máxima realismo en espacios continuos sin discretización”.

¿Qué significa Starflow para los futuros productos para iPhone y Mac de Apple?

La investigación llega cuando Apple enfrenta una presión creciente para demostrar un progreso significativo en la inteligencia industrial. Un nuevo Descomposición de Bloomberg Destacó cómo Apple Intelligence y Siri han luchado para competir con los rivales, mientras que los modestos anuncios de Apple en WWDC esta semana subrayaron los desafíos de la compañía en el espacio de IA.

Para Apple, la capacitación exacta de probabilidad de Starflow podría ofrecer ventajas en aplicaciones que requieren un control preciso sobre el contenido generado o en los escenarios en los que la comprensión de la incertidumbre del maniquí es crítica para la toma de decisiones, potencialmente valioso para aplicaciones empresariales y capacidades de IA en disposición que Apple ha enfatizado.

La investigación demuestra que los enfoques alternativos para los modelos de difusión pueden ganar resultados comparables, lo que puede destapar nuevas vías para la innovación que podrían aventurar con las fortalezas de Apple en la integración de hardware-software y el procesamiento en el dispositivo.

Por qué Apple está apostando por las asociaciones universitarias para resolver su problema de IA

La investigación ejemplifica la táctica de Apple de colaborar con las principales instituciones académicas para avanzar en sus capacidades de IA. Coautor Tianrong Chenun estudiante de doctorado en Georgia Tech que internó con el equipo de investigación de formación automotriz de Apple aporta experiencia en control perfecto imprevisto y modelado generativo.

La colaboración además incluye Ruixiang Zhang del Área de Matemáticas de UC Berkeley y Laurent Dinh, un investigador de formación automotriz conocido por el trabajo pionero en modelos basados ​​en el flujo durante su tiempo en Google Brain y Profundo.

“Crucialmente, nuestro maniquí sigue siendo un flujo de normalización de extremo a extremo”, enfatizaron los investigadores, distinguiendo su enfoque de los métodos híbridos que sacrifican la tractabilidad matemática para mejorar el rendimiento.

El trabajo de investigación completo está habitable en arxivproporcionando detalles técnicos para investigadores e ingenieros que buscan desarrollar este trabajo en el campo competitivo de la IA generativa. Si aceptablemente Starflow representa un logro técnico significativo, la prueba verdadero será si Apple puede traducir tales avances de investigación en el tipo de características de IA orientadas al consumidor que han hecho competidores como los nombres familiares de ChatGPT. Para una empresa que una vez revolucionó las industrias enteras con productos como el iPhone, la pregunta no es si Apple puede innovar en la IA, si pueden hacerlo lo suficientemente rápido.


Related Posts

Vigésimo primaveras robusto: una carta de inclinación a TechCrunch

TechCrunch está cumpliendo 20 primaveras. He estado aquí la centro de esa vez. Trabajé anteriormente en numerosas propiedades principales de medios, incluidas Time Inc, Dow Jones y Reuters; Este ha…

El CEO de Klarna ahora está recibiendo sus llamadas, sobre una cuerda directa de IA

El CEO de Klarna, Sebastian Siemiatkowski, ya ha usado IA para reemplazarse durante los informes de ganancias, y ahora Klarna está usando IA para clonarlo de otra forma: a través…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Servicio de Patrimonio y JICA presentan a siete nuevos voluntarios del gobierno del Japón

Servicio de Patrimonio y JICA presentan a siete nuevos voluntarios del gobierno del Japón

Vigésimo primaveras robusto: una carta de inclinación a TechCrunch

Vigésimo primaveras robusto: una carta de inclinación a TechCrunch

Las áreas protegidas… lo están efectivamente?

Las áreas protegidas… lo están efectivamente?

72.5% de proyectos del Gobierno con un 0% de ejecución en 2025

72.5% de proyectos del Gobierno con un 0% de ejecución en 2025

El CEO de Klarna ahora está recibiendo sus llamadas, sobre una cuerda directa de IA

El CEO de Klarna ahora está recibiendo sus llamadas, sobre una cuerda directa de IA

Sectores se enfrentan por prácticas violentas de crianza

Sectores se enfrentan por prácticas violentas de crianza