El doble de Will Smith de Google es mejor para engullir espagueti de IA … pero es crujiente?

El doble de Will Smith de Google es mejor para engullir espagueti de IA … pero es crujiente?

El martes, Google emprendedor VEO 3un nuevo maniquí de síntesis de video AI que puede hacer poco que ningún productor de video de IA importante ha podido hacer antiguamente: crear una pista de audio sincronizada. Mientras que de 2022 a 2024, vimos los primeros pasos en la vivientes de videos de IA, cada video era silencioso y generalmente de muy corta duración. Ahora puede escuchar voces, diálogo y existencias de sonido en videoclips de incorporación definición de ocho segundos.

Poco a posteriori del nuevo extensión, la muchedumbre comenzó a hacer la pregunta de evaluación comparativa más obvia: ¿Qué tan bueno es Veo 3 en fingir al actor campeón del Oscar Will Smith en engullir espagueti?

Primero, un breve sinopsis. El punto de remisión Spaghetti en AI Video traza sus orígenes hasta marzo de 2023, cuando cubrimos por primera vez un ejemplo temprano de horrible video generado por IA utilizando un maniquí de síntesis de video de código hendido llamado ModelsCope. El ejemplo de espagueti más tarde se hizo lo suficientemente conocido como para que Smith lo parodíe casi un año a posteriori en febrero de 2024.

Así es como se veía el video virulento innovador:


Una cosa que la muchedumbre olvida es que en ese momento, el ejemplo de Smith no era el mejor productor de videos de IA que existe: un maniquí de síntesis de video llamado Gen-2 de Pista ya había conseguido resultados superiores (aunque aún no era accesible públicamente). Pero el resultado de Modelscope fue divertido y extraño para quedarse en los memorias de las personas como un mal ejemplo de síntesis de video, a medida que avanzaban los modelos de IA.

La desarrolladora de aplicaciones de IA, Javi López, llegó por primera vez al rescate para los curiosos fanáticos de los espagueti a principios de esta semana con Veo 3, realizando la prueba Smith y Difundir los resultados En X. Pero como notará a continuación cuando mira, la pandilla sonora tiene una cualidad curiosa: el apócrifo Smith parece estar crujiendo en los espagueti.

En X, Javi López dirigió “Will Smith comiendo Spaghetti” en el productor de videos Veo 3 AI de Google y recibió este resultado.

Es una equivocación en la capacidad empírico de Veo 3 para aplicar existencias de sonido a los videos, probablemente porque los datos de entrenamiento utilizados para crear los modelos de IA de Google presentaban muchos ejemplos de bocas de masticación con existencias de sonido crujientes. Los modelos generativos de IA son máquinas de predicción de coincidencia de patrones, y deben mostrarse suficientes ejemplos de varios tipos de medios para suscitar nuevas panorama convincentes. Si un concepto está sobrerrepresentado o subrepresentado en los datos de capacitación, verá resultados de vivientes inusuales, como Jabberwockies.

Related Posts

Un comprador obtiene $1,000 en hardware de PC por solo $86 en un error impactante en los precios: Newegg hace caso omiso de la pérdida masiva y replica con un emoji de aprobación

A menudo cubrimos casos desafortunados de grandes minoristas que decepcionan a sus clientes, intencionalmente o no, pero es igualmente importante resaltar casos positivos poco comunes. Mientras que algunas personas reciben…

El cineasta más importante de Hollywood acaba de aclarar el uso de la IA en las películas

El maravilloso cineasta Steven Spielberg expresó su preocupación por el creciente papel de la inteligencia industrial en las industrias creativas durante una aparición en el SXSW de Austin. Durante una…

You Missed

Un comprador obtiene $1,000 en hardware de PC por solo $86 en un error impactante en los precios: Newegg hace caso omiso de la pérdida masiva y replica con un emoji de aprobación

Un comprador obtiene ,000 en hardware de PC por solo  en un error impactante en los precios: Newegg hace caso omiso de la pérdida masiva y replica con un emoji de aprobación

WordPress venablo un espacio de trabajo privado que se ejecuta en el navegador

WordPress venablo un espacio de trabajo privado que se ejecuta en el navegador

Nueva era en relaciones Venezuela con izamiento bandera Estados Unidos

Nueva era en relaciones Venezuela con izamiento bandera Estados Unidos

¿Cuál es positivamente más saludable para tu bienestar?

¿Cuál es positivamente más saludable para tu bienestar?

Austin Wells disfruta su gran momento

Austin Wells disfruta su gran momento

El cineasta más importante de Hollywood acaba de aclarar el uso de la IA en las películas

El cineasta más importante de Hollywood acaba de aclarar el uso de la IA en las películas