
Incluso a primera aspecto, hay poco en el cuerpo en la calle. La sábana blanca que está debajo está demasiado limpia, y los movimientos de los oficiales están totalmente desprovistos de propósito. “Necesitamos despejar la calle”, dice uno de ellos con un aspaviento de mano firme, aunque sus labios no se mueven. Es ai, está correctamente. Pero aquí está el pateador: mi aviso no incluyó ningún diálogo.
VEO 3, el nuevo maniquí de gestación de videos AI de Google, agregó esa camino por sí sola. En las últimas 24 horas, creé una docena de clips que representan informes de noticiero, desastres y gatos de dibujos animados con audio convincente, algunos de los cuales el maniquí inventó por sí solo. Es más que un poco espeluznante y mucho más sofisticado de lo que había imaginado. Y aunque no creo que nos vaya a impulsar a un día de fin de información errónea, Veo 3 me parece una máquina de irresoluto de IA absoluta.
Google introduced Veo 3 En E/S esta semana, destacando su nueva capacidad más importante: suscitar sonido para agregar su video de IA. “Estamos entrando en una nueva era de la creación”, explicó el vicepresidente de Géminis de Google, Josh Woodward, en la nota principal, calificándola de “increíblemente realista”. No estaba completamente vendido, pero luego, unos días a posteriori, tuve Veo 3 suscitar un video de un presentador de noticiero que anunció un fuego en la manecilla espacial. Todo lo que se necesitó fue un mensaje de texto fundamental, unos minutos y una suscripción costosa al plan AI Extremista de Google. ¿Y sabes que? Woodward no estaba exagerando. Es realista como el abismo.
Probé el indicador de noticiero a posteriori de ver lo que Alejandra Caraballo, una instructora clínica de la Clínica Cyberlaw de la Destreza de Derecho de Harvard, pudo producir. Uno de sus clips presenta un presentador de noticiero que anuncia la asesinato del Secretario de Defensa de los Estados Unidos, Pete Hegseth. No está muerto, pero el clip es increíblemente convincente. Una publicación que incluye una prisión de videos con Personajes generados por IA que protestan por las indicaciones utilizadas para crearlos Tiene 50,000 votos en Reddit. Las escenas incluyen desastres, una mujer en una cama de hospital que usa un tubo de respiración y un personaje amenazado a punta de pistola, todo con diálogo hablado y sonidos de fondo realistas. ¡Cosas en realidad alegres!
Tal vez estoy siendo ingenuo, pero a posteriori de brincar con Veo 3 no soy harto Tan preocupado como estaba al principio. Para entablar, las barandillas obvias están en su empleo. No puede solicitarlo que cree un video de Biden Tripping and Call. No puede hacer que un presentador de noticiero anuncie el crimen del presidente, o incluso genere un video de un CEO de una compañía de tecnología de camiseta y prisión que se ríe mientras los billetes de dólar lloven a su rodeando. Eso es un aparición.
Dicho esto, puedes suscitar una mierda preocupante. Sin ninguna decisión inteligente, impulsé a Veo 3 a crear un video de la manecilla espacial en llamas. Comenzando con mi propia foto del Monte Rainier, generé un video en erupción con humo y escoria. Próximo con un clip de un presentador de noticiero que anuncia dicho desastre, puedo ver cómo podría sembrar poco de travesura muy fácilmente con esta útil.
Aquí están las mejores noticiero: no parece una máquina profunda preparada. Le di un par de fotos mías y le pedí que generara un video con diálogo específico y no cumpliera. Asimismo le pedí que trajera un par de botas gigantes en una foto a la vida y que salieran de la terreno; Midió una bota pisoteando la margen con algunos ruidos cómicos en el fondo.
Tuve más casquivana suscitar videos cuando mis indicaciones eran menos específicas, así es como confirmé poco Mi colega Andrew Marino señaló: VEO 3 es excelente para crear el tipo de contenido de YouTube de pequeño denominador más bajo dirigido a los niños.
Si nunca has sido sometido al pozo interminable de basura en los niños de YouTube, déjame iluminarte. Imagine ver la peor representación en 3D de un camión monstruo que conduce por una rampa, aterrizando en una tina de pintura de colores. Próximo a él, otro camión monstruo conduce por otra rampa a otra tina de pintura, esta vez, un color diferente. Ahora mira eso de nuevo. Y de nuevo. Y de nuevo. Hay horas de estas cosas en YouTube diseñadas para hipnotizar a los niños pequeños. Estos videos suelen ser inofensivos, solo calorías vacías diseñadas para acumular vistas que hacen que el cocomelón se vea como Ciudadano Kane. En aproximadamente 10 minutos con Veo 3, arrojé un clip siguiendo la misma fórmula básica: completa con música de fondo alegre. Pero el clip que es aún más preocupante para mí son los dos gatos de dibujos animados en un terminal.
Pensé que sería divertido que los gatos se quejen entre sí de que los peces no están mordiendo. En solo un par de minutos, tuve un clip completo con dos gatos y un diálogo generado por IA que nunca escribí. Si es tan casquivana hacer un clip de 10 segundos, estirarlo en un video de YouTube de siete minutos sería trivial. En su forma contemporáneo, los clips vuelven a VEO 2 cuando intenta extenderlos a escenas más largas, lo que elimina el audio. Pero la forma en que Google ha estado impulsando estas herramientas sin alivio, no puedo imaginar que pase mucho tiempo ayer de que pueda editar un video completo con VeO 3.
Honestamente, me interrogo si este tipo de uso para el video generado por IA es una característica y no un error. Google nos mostró un elegante video generado por IA de cineastas reales, incluida Eliza McNitt, quien está trabajando con Darren Aronofsky en una nueva película con algunos fundamentos generados por IA. Y claro, el video de IA podría ser una útil interesante en las manos correctas. Pero creo que lo que es más probable que veamos es una proliferación del tipo de imágenes suaves que la IA es tan buena para suscitar, esta vez, en estereofónico.