Google garrocha el nuevo maniquí de vídeo AI Veo 3.1 en Flow y API: lo que significa para las empresas

Google garrocha el nuevo maniquí de vídeo AI Veo 3.1 en Flow y API: lo que significa para las empresas

Como se esperaba posteriormente de días de filtraciones y rumores en sarta, Google ha unveiled Veo 3.1su posterior maniquí de concepción de video con IA, que ofrece un conjunto de actualizaciones creativas y técnicas destinadas a mejorar el control narrativo, la integración de audio y el realismo en el video generado con IA.

Si perfectamente las actualizaciones amplían las posibilidades para los aficionados y creadores de contenido que utilizan la aplicación de creación de IA en sarta de Google, Fluirel tirada asimismo señala una oportunidad creciente para empresas, desarrolladores y equipos creativos que buscan herramientas de vídeo escalables y personalizables.

La calidad es longevo, la física mejor, el precio es el mismo que ayer y las funciones de control y estampación son más sólidas y variadas.

Mi pruebas iniciales demostró ser un maniquí potente y de parada rendimiento que inmediatamente deleita a cada concepción. Sin requisa, el aspecto es más cinematográfico, pulido y un poco más "químico" que por defecto que rivales como el nuevo Sora 2 de OpenAI, arrojado a finales del mes pasado, que puede ser o no lo que un adjudicatario en particular exploración (Sora sobresale en dispositivos portátiles y "sincero" vídeos de estilo).

Control ampliado sobre la novelística y el audio

Veo 3.1 se zócalo en su predecesor, Veo 3 (arrojado en mayo de 2025) con soporte mejorado para diálogos, sonido ambiental y otros existencias de audio.

La concepción de audio nativo ahora está arreglado en varias funciones secreto de Flow, incluidas “Marcos a video”, “Ingredientes a video” y “Extender," que brindan a los usuarios la capacidad de, respectivamente: convertir imágenes fijas en video; utilizar nociones, personajes y objetos de múltiples imágenes en un solo video; y crear clips más largos que los 8 segundos iniciales, hasta más de 30 segundos o incluso más de 1 cuando se continúa desde el fotograma final de un clip aludido.

Antiguamente, tenías que asociar audio manualmente posteriormente de usar estas funciones.

Esta incorporación brinda a los usuarios un longevo control sobre el tono, las emociones y la narración, capacidades que anteriormente requerían trabajo de posproducción.

En contextos empresariales, este nivel de control puede estrechar la menester de canales de audio separados, ofreciendo una forma integrada de crear contenido de capacitación, videos de marketing o experiencias digitales con sonido e imágenes sincronizados.

Google anotó en una publicación de blog que las actualizaciones reflejan los comentarios de los usuarios que exigen un control estético más profundo y un soporte de audio mejorado. Gallegos enfatiza la importancia de hacer posibles las ediciones y mejoras directamente en Flow, sin tener que retornar a trabajar las escenas desde cero.

Entradas más ricas y capacidades de estampación

Con Veo 3.1, Google introduce soporte para múltiples tipos de entrada y un control más granular sobre los resultados generados. El maniquí acepta indicaciones de texto, imágenes y clips de vídeo como entrada y asimismo admite:

  • Imágenes de relato (hasta tres) Para pilotar la apariencia y el estilo en el resultado final.

  • Interpolación del primer y posterior cuadro para crear escenas fluidas entre puntos finales fijos

  • Extensión de ambiente que continúa la entusiasmo o el movimiento de un vídeo más allá de su duración presente

Estas herramientas tienen como objetivo desear a los usuarios empresariales una forma de ajustar la apariencia de su contenido, lo que resulta útil para la coherencia de la marca o el cumplimiento de los resúmenes creativos.

Asimismo se están introduciendo capacidades adicionales como “Insertar” (asociar objetos a escenas) y “Eliminar” (eliminar nociones o caracteres), aunque no todas están disponibles de inmediato a través de la API de Gemini.

Implementación en plataformas

Se puede lograr a Veo 3.1 a través de varios de los servicios de inteligencia químico existentes de Google:

  • Fluirla interfaz propia de Google para la realización cinematográfica asistida por IA

  • API de Géminisdirigido a desarrolladores que incorporan capacidades de vídeo en aplicaciones

  • IA de vérticedonde la integración empresarial pronto admitirá la “Extensión de ambiente” de Veo y otras características secreto

La disponibilidad a través de estas plataformas permite a los clientes empresariales designar el entorno adecuado (basado en GUI o programático) en función de sus equipos y flujos de trabajo.

Precios y acercamiento

El maniquí Veo 3.1 se encuentra actualmente en avance y arreglado sólo en el nivel pagado de la API de Géminis. La estructura de costos es la misma que la de Veo 3, la concepción aludido de modelos de video con IA de Google.

  • Maniquí típico: $0.40 por segundo de video

  • maniquí rápido: 0,15 dólares por segundo

No existe un nivel sin cargo y a los usuarios solo se les cobra si un video se genera correctamente. Este maniquí es consistente con versiones anteriores de Veo y proporciona precios predecibles para equipos empresariales preocupados por su presupuesto.

Especificaciones técnicas y control de salida

Veo 3.1 emite vídeo en Resolución de 720p o 1080pcon un Velocidad de fotogramas de 24 fps.

Las opciones de duración incluyen 4, 6 u 8 segundos desde un mensaje de texto o imágenes cargadas, con la capacidad de extender videos hasta 148 segundos (¡más de 2 minutos y medio!) cuando se utiliza la función “Extender”.

La nueva funcionalidad asimismo incluye un control más cumplidor sobre los sujetos y los entornos. Por ejemplo, las empresas pueden cargar una imagen de producto o una relato visual, y Veo 3.1 generará escenas que preserven su apariencia y señales estilísticas en todo el video. Esto podría optimizar los procesos de producción creativa para los equipos de producción de contenido supuesto, publicidad y cesión minorista.

Reacciones iniciales

La comunidad más amplia de creadores y desarrolladores ha respondido al tirada de Veo 3.1 con una mezcla de optimismo y crítica moderada, particularmente al compararlo con modelos rivales como Sora 2 de OpenAI.

Matt Shumer uno de los fundadores de AI de Otherside AI/Hyperwrite, y uno de los primeros en adoptarlo, describió su reacción original como “frustración”, señalando que Veo 3.1 es “notablemente peor que Sora 2” y asimismo “asaz más caro”.

Sin requisa, reconoció que las herramientas de Google, como el soporte para referencias y extensión de escenas, son un punto brillante en el tirada.

Travis Davidsun intérprete digital 3D y creador de contenidos de IA, se hizo eco de parte de ese sentimiento. Si perfectamente notó mejoras en la calidad del audio, particularmente en los existencias de sonido y el diálogo, expresó su preocupación por las limitaciones que aún persisten en el sistema.

Estos incluyen la desidia de soporte de voz personalizado, la incapacidad de separar voces generadas directamente y el contorno continuo de generaciones de 8 segundos, a pesar de algunas afirmaciones públicas sobre producciones más largas.

Davids asimismo señaló que la coherencia de los personajes en los ángulos cambiantes de la cámara aún requiere indicaciones cuidadosas, mientras que otros modelos como Sora 2 manejan esto de modo más cibernética. Cuestionó la marcha de una resolución de 1080p para usuarios de niveles pagos como Flow Pro y expresó desconfianza sobre la paridad de funciones.

En el flanco más positivo, @kimmonismus, un redactor del boletín de AI, afirmó que “Veo 3.1 es asombroso”, aunque aun así concluyó que el posterior maniquí de OpenAI sigue siendo preferible en caudillo.

En conjunto, estas primeras impresiones sugieren que, si perfectamente Veo 3.1 ofrece mejoras significativas en las herramientas y nuevas funciones de control creativo, las expectativas han cambiado a medida que los competidores elevan el franja tanto en calidad como en usabilidad.

Prohijamiento y escalera

Desde el tirada de Flow hace cinco meses, Google dice que se acabó 275 millones de vídeos se han generado en varios modelos de Veo.

El ritmo de admisión sugiere un interés significativo no sólo por parte de individuos sino asimismo de desarrolladores y empresas que experimentan con la creación automatizada de contenido.

Thomas Iljic, director de papeleo de productos de Google Labs, destaca que el tirada de Veo 3.1 acerca las capacidades a la forma en que los cineastas humanos planifican y filman. Estos incluyen composición de escenas, continuidad entre tomas y audio coordinado, todas áreas que las empresas buscan cada vez más automatizar o optimizar.

Seguridad y uso responsable de la IA

Los vídeos generados con Veo 3.1 tienen marcas de agua utilizando Google SynthID tecnología, que incorpora un identificador imperceptible para señalar que el contenido es generado por IA.

Google aplica filtros de seguridad y moderación en todas sus API para ayudar a minimizar los riesgos de privacidad y derechos de autor. El contenido generado se almacena temporalmente y se elimina posteriormente de dos días, a menos que se descargue.

Para los desarrolladores y las empresas, estas características brindan tranquilidad sobre la procedencia y el cumplimiento, poco fundamental en industrias reguladas o sensibles a las marcas.

Dónde se encuentra Veo 3.1 entre un espacio de modelos de vídeo de IA abarrotado

Veo 3.1 no es solo una iteración de modelos anteriores: representa una integración más profunda de entradas multimodales, control de narración y herramientas a nivel empresarial. Si perfectamente los profesionales creativos pueden ver beneficios inmediatos en la estampación de flujos de trabajo y la fidelidad, las empresas que exploran la automatización en la capacitación, la publicidad o las experiencias virtuales pueden encontrar un valencia aún longevo en la componibilidad del maniquí y la compatibilidad con API.

Los primeros comentarios de los usuarios destacan que, si perfectamente Veo 3.1 ofrece herramientas valiosas, las expectativas en torno al realismo, el control de voz y la duración de la concepción están evolucionando rápidamente. A medida que Google amplía el acercamiento a través de Vertex AI y continúa perfeccionando Veo, su posicionamiento competitivo en la concepción de videos empresariales dependerá de la celeridad con la que se aborden estos puntos débiles de los usuarios.

Related Posts

Kit de herramientas de primavera de 2026 de Fanttik: – Tendencias digitales

Un cantera compacto para sus sueños de bricolaje en parking, parterre y muebles y escritorios Si los planes de su hogar alguna vez se han trillado estancados por herramientas voluminosas…

La paradoja de la tecnología profunda en Europa

Europa no sufre escasez de hacienda. Lo que le desatiendo es el coraje constitucional y la competencia analítica necesarios para dirigir ese hacienda en dirección a las áreas donde puede…

You Missed

Impuestos: cambios tributarios esperados (OPINION) | AlMomento.net

Impuestos: cambios tributarios esperados (OPINION) | AlMomento.net

Tras designación líder supremo, Irán pica misiles con destino a Israel | AlMomento.net

Tras designación líder supremo, Irán pica misiles con destino a Israel | AlMomento.net

Petróleo se dispara por encima de los US$100; caen las bolsas | AlMomento.net

Petróleo se dispara por encima de los US0; caen las bolsas | AlMomento.net

Kit de herramientas de primavera de 2026 de Fanttik: – Tendencias digitales

Kit de herramientas de primavera de 2026 de Fanttik: – Tendencias digitales

enfrentamiento con Irán sacude producción y envíos

enfrentamiento con Irán sacude producción y envíos

La paradoja de la tecnología profunda en Europa

La paradoja de la tecnología profunda en Europa