El doble de Will Smith de Google es mejor para engullir espagueti de IA … pero es crujiente?

El doble de Will Smith de Google es mejor para engullir espagueti de IA … pero es crujiente?

El martes, Google emprendedor VEO 3un nuevo maniquí de síntesis de video AI que puede hacer poco que ningún productor de video de IA importante ha podido hacer antiguamente: crear una pista de audio sincronizada. Mientras que de 2022 a 2024, vimos los primeros pasos en la vivientes de videos de IA, cada video era silencioso y generalmente de muy corta duración. Ahora puede escuchar voces, diálogo y existencias de sonido en videoclips de incorporación definición de ocho segundos.

Poco a posteriori del nuevo extensión, la muchedumbre comenzó a hacer la pregunta de evaluación comparativa más obvia: ¿Qué tan bueno es Veo 3 en fingir al actor campeón del Oscar Will Smith en engullir espagueti?

Primero, un breve sinopsis. El punto de remisión Spaghetti en AI Video traza sus orígenes hasta marzo de 2023, cuando cubrimos por primera vez un ejemplo temprano de horrible video generado por IA utilizando un maniquí de síntesis de video de código hendido llamado ModelsCope. El ejemplo de espagueti más tarde se hizo lo suficientemente conocido como para que Smith lo parodíe casi un año a posteriori en febrero de 2024.

Así es como se veía el video virulento innovador:


Una cosa que la muchedumbre olvida es que en ese momento, el ejemplo de Smith no era el mejor productor de videos de IA que existe: un maniquí de síntesis de video llamado Gen-2 de Pista ya había conseguido resultados superiores (aunque aún no era accesible públicamente). Pero el resultado de Modelscope fue divertido y extraño para quedarse en los memorias de las personas como un mal ejemplo de síntesis de video, a medida que avanzaban los modelos de IA.

La desarrolladora de aplicaciones de IA, Javi López, llegó por primera vez al rescate para los curiosos fanáticos de los espagueti a principios de esta semana con Veo 3, realizando la prueba Smith y Difundir los resultados En X. Pero como notará a continuación cuando mira, la pandilla sonora tiene una cualidad curiosa: el apócrifo Smith parece estar crujiendo en los espagueti.

En X, Javi López dirigió “Will Smith comiendo Spaghetti” en el productor de videos Veo 3 AI de Google y recibió este resultado.

Es una equivocación en la capacidad empírico de Veo 3 para aplicar existencias de sonido a los videos, probablemente porque los datos de entrenamiento utilizados para crear los modelos de IA de Google presentaban muchos ejemplos de bocas de masticación con existencias de sonido crujientes. Los modelos generativos de IA son máquinas de predicción de coincidencia de patrones, y deben mostrarse suficientes ejemplos de varios tipos de medios para suscitar nuevas panorama convincentes. Si un concepto está sobrerrepresentado o subrepresentado en los datos de capacitación, verá resultados de vivientes inusuales, como Jabberwockies.

Related Posts

Código taimado invisible ataca 151 repositorios de GitHub y VS Code: el ataque Glassworm utiliza blockchain para robar tokens, credenciales y secretos

Los investigadores de Aikido Security informaron el viernes que habían contrario al menos 151 repositorios de GitHub comprometidos por un actor de amenazas rastreado como Glassworm, que oculta cargas maliciosas…

Los directores de Project Hail Mary, Phil Lord y Chris Miller, revelan las 4 mejores películas de ciencia ficción que han conocido, y una es una película de John Carpenter de la que nunca has pabellón platicar.

Tesina Ave María (PHM) será la última incorporación a la biblioteca de películas de ciencia ficción en constante expansión cuando llegue a los cines a finales de este mes. A…

You Missed

Código taimado invisible ataca 151 repositorios de GitHub y VS Code: el ataque Glassworm utiliza blockchain para robar tokens, credenciales y secretos

Código taimado invisible ataca 151 repositorios de GitHub y VS Code: el ataque Glassworm utiliza blockchain para robar tokens, credenciales y secretos

la historia del psicólogo preso que hoy estudia la mente de los feminicidas

la historia del psicólogo preso que hoy estudia la mente de los feminicidas

El pensamiento dicotómico

El pensamiento dicotómico

Los directores de Project Hail Mary, Phil Lord y Chris Miller, revelan las 4 mejores películas de ciencia ficción que han conocido, y una es una película de John Carpenter de la que nunca has pabellón platicar.

Los directores de Project Hail Mary, Phil Lord y Chris Miller, revelan las 4 mejores películas de ciencia ficción que han conocido, y una es una película de John Carpenter de la que nunca has pabellón platicar.

Mojtaba Jameneí herido tras ataques de Estados Unidos e Israel

Mojtaba Jameneí herido tras ataques de Estados Unidos e Israel

EEUU dice realizó un «poderoso» hostigamiento a una isla petrolera | AlMomento.net

EEUU dice realizó un «poderoso» hostigamiento a una isla petrolera | AlMomento.net