Probé Sora 2 contra Veo 3 de Google, y la brecha es asombrosa

Google Pixel 10 Pro XL Gemini Home

Ryan Haines / Android Authority

Si operación un teléfono Pixel 10 Pro Series, o incluso el Pixel 9 Pro del año pasado, obtiene un año completo en la suscripción Gemini Pro de Google. Este servicio de $ 20 por mes desbloquea el poderoso maniquí Gemini 2.5 Pro y un conjunto de herramientas de IA de vanguardia. Hasta hace muy poco, la gema de la corona de este paquete era Veo 3, el impresionante dinamo de texto a video de Google que podría convertir cualquier descripción en un video corto hiperrealista.

Pero el mundo de la IA se mueve a la velocidad del centella. La semana pasada, Operai anunció su maniquí Sora 2 competidor, lo que significa que el dinamo de video de Google ya no es el único distracción en la ciudad. Si aceptablemente Sora 2 es solo de invitación por ahora, el maniquí ya tiene una pulvínulo de usuarios activo. Así que, lógicamente, tomé Sora 2 de Openai para un rotación vs Veo 3 de Google para acechar qué dinamo de videos AI tiene la preeminencia.

Google Veo 3 vs Openai Sora: los resultados son asombrosos

Comencemos con un indicador simple sin ningún personaje o detalles complejos que puedan tropezar con cualquiera de los generadores de videos de IA: “Una toma fotorrealista de espresso se vierte en una taza blanca en cámara lenta”. Dada la naturaleza estática de esta toma, esperarías que todos los modelos claven la tarea. Sin requisa, los resultados fueron sorprendentemente diferentes.

El intento de la maniquí Sora de primera reproducción fue pasable de un vistazo. Entendió los objetos (taza, deducido, máquina) y los ensambló en el orden correcto. Pero la ilusión se desmoronó rápidamente. El “espresso” tenía una consistencia gruesa y general y salpicada en la taza con física antinatural. Era un video de las palabras en el aviso, pero carecía de cualquier sentido de arte o realismo.

La reproducción de Veo 3, por el contrario, se sintió como si fuera capturada por un camarógrafo profesional. El espresso fluyó con viscosidad convincente, y el deducido se arremolinó de modo realista mientras se asentaba. No es un resultado consumado ya que el café solo se dispensa desde un costado del portafiltro, pero sigue siendo una progreso significativa sobre el intento de Sora.

Sora 2 es la mejor y más nueva del género: muestra una física realista sin nadie de los errores exhibidos en el resultado de Veo 3. ¿Pero es una gran progreso? No precisamente. Pero felizmente para Operai, recién estamos comenzando.

¿Qué pasa con los animales? El maniquí Sora de primera reproducción en efectividad hizo un trabajo aceptable al capturar la energía frenética de un golden retriever en un parque empachado de clan. Veo 3 hizo un trabajo tenuemente mejor, pero el mar imprevisible de caracteres de fondo era una clara señal de la presencia de AI.

Sora 2 es donde las cosas se vuelven inquietantemente reales. Renderizó el Golden Retriever con extrema precisión y toda la imagen fue plausible. La clan en el parque no estaba borrosa ni sintético. Mi único nitpick sería que la imagen tenía muchos otros perros para un parque urbano ordinario.

Continuando, pedí un motociclista que viajaba a lo grande de una playa al atardecer. Una vez más, el maniquí Sora llamativo me dio un resultado conclusión de dibujos animados donde una rabo de pescado de motocicleta, mientras que otro se desliza cerca de el agua con resistor cero. No llamaría a este resultado pasable. Sorprendentemente, Sora 2 asimismo falló inesperadamente en esta tarea, cometiendo los mismos errores que su predecesor.

Veo 3, por otro costado, entregó una foto que parecía francamente cinematográfica. La motocicleta se movió previsiblemente sobre la arena, dejó una marca de la facción de rodadura y un rastra de polvo, y la velocípedo se inclinó sutilmente cuando el jinete giró. Pero la iluminación fue la parte más impresionante; El sol bajo arrojó sombras largas y dramáticas y brilló de modo realista de la motocicleta.

Mi subsiguiente aviso resultó ser un desafío difícil para los modelos más antiguos: “El icónico taxi amarillo que conduce a lo grande de las calles de Kolkata durante un día brillante”. Sora y Veo 3 no pudieron gestar clips utilizables, pero sus fracasos fueron interesantes, sin requisa.

La interpretación de Sora rompió las reglas de la efectividad. Luchó con la permanencia de los objetos, haciendo que los peatones surjan en la margen o, en un momento discordante, se fusionen brevemente entre sí. No hace errata aseverar que esta secuencia de ensueño no se parece a la efectividad.

El intento de Veo 3 fue más coherente pero falló en la ejecución de detalles. Hizo un trabajo mucho mejor al capturar la entorno auténtica de Kolkata, pero el taxi en sí se movió con un movimiento extraño y deslizante que no se sentía conectado a la carretera. Adicionalmente, como es popular con la IA, cualquier texto se hizo ilegible. El nuevo maniquí Sora 2 funcionó mucho mejor, clavando la entorno de la ciudad e incluso los ocupantes del transporte. Podrías pasarlo fácilmente como un video efectivo.

Finalmente, echemos un vistazo a lo que creo que es el resultado más impresionante para el maniquí de Google: el mandaloriano en Bangkok. Sorprendentemente, ni Sora ni Veo 3 rechazaron mi aviso en los terrenos de los derechos de autor.

De cualquier modo, el resultado de Veo 3 fue asombroso. El personaje que produjo era una imagen dividida del cierto negocio, desde el brillo específico de la armadura hasta la silueta icónica del casco. Se parecía menos a una reproducción de IA y más como una imagen eliminada del software.

Sora, por otro costado, entregó una tratamiento cercana en el mejor de los casos. Generó un carácter genérico vestido con cromo brillante y pulido con luces de neón que se refleja en su superficie. Capturó la parte de Bangkok del aviso, pero falló en el tema principal. En cierto modo, Sora evitó violar los derechos de autor, pero siquiera logró seguir con precisión mis instrucciones.

Desafortunadamente, el nuevo maniquí Sora 2 ahora se niega a gestar un video que contenga un personaje con derechos de autor, a pesar de que sabemos que es totalmente capaz de hacerlo, por lo que apetencia un DNF para este.

La reproducción de videos de IA ha represión un grande camino

Pidiendo a Google Gemini que genere un video usando VEO 3

Mishaal Rahman / Android Authority

Cuando Operai anunció a Sora a principios de 2024, la mayoría de nosotros nos sorprendió lo realista y convincente que se veía. Esas primeras muestras mostraron un impresionante estilo cinematográfico y prometieron interrumpir la producción de video. En ese momento, Operai asimismo tenía uno de los mejores generadores de imágenes AI en forma de Dall · E. Pero cuando Sora finalmente se lanzó en diciembre de 2024, se quedó corto de esas altas expectativas. Google siguió con su maniquí VEO solo unos días luego, sin requisa, y constantemente iteró con actualizaciones agresivas que culminaron en el VEO 3 que tenemos hoy.

Desafortunadamente, el tirada del dinamo de video AI temprano de Google no fue tan impecable como las demostraciones sugirieron siquiera. Pero Veo 3 y Sora 2 son completamente diferentes bestias.

Los modelos iniciales VEO y SORA sufrían los mismos signos reveladores de IA generativa: los objetos de fondo cambiarían de forma no natural, los caracteres carecían de permanencia de objetos, a veces mezclando el entorno o incluso fusionándose entre sí. La física siquiera importaba a medida que los objetos se movían de modo increíble y sin fricción y tuvo la suerte de obtener una consistencia novelística.

Sora 2, y Veo 3 de Google en un graduación tenuemente pequeño, abordan casi todos estos defectos. Un mensaje de oración único ahora puede producir un video completo, completo con voces realistas e incluso música. Eso hace que estas herramientas de reproducción de videos de IA sean increíblemente efectos para la creación de contenido de luz. Los maestros pueden crear historias visuales para la clase, los dueños de negocios giran anuncios rápidos para las redes sociales: los casos de uso se sienten infinitos.

El único problema es el costo. Con Gemini Pro, solo obtienes tres videos Veo 3 por día. Sin requisa, descubrí que el Tesina de Google Labs llamado Flow Asimismo le otorga 1,000 créditos de IA por mes. Esto se traduce en aproximadamente 100 videos utilizando el maniquí “rápido” VEO 3.

Sora 2, por otro costado, es actualmente de forma gratuita, incluso sin una suscripción de CHATGPT. Sin requisa, el CEO de Operai, Sam Altman, admitió que este ataque amplio es insostenible, ya que el uso ya ha superado las expectativas. Un conclusión diario parece obligatorio, pero para ser justos, generalmente obtengo un clip servible en el primer intento gracias a la longevo comprensión del maniquí de física, movimiento y matices del mundo efectivo.

El problema es que Sora 2 aún no está apto públicamente, y OpenAi seguramente tendrá un conclusión difícil en la cantidad de generaciones de video una vez que el servicio se extiende de modo más amplia. Entonces, por ahora, VEO 3 sigue siendo uno de los secretos mejor guardados de la suscripción Gemini Pro de Google.

Gracias por ser parte de nuestra comunidad. Lea nuestra política de comentarios antiguamente de propagar.

Related Posts

Encontré una mini PC que supera esta proposición de computadora portátil HP en Best Buy

La computadora portátil HP EliteBook recibió un gran recortadura de precio en Best Buy, pasando de un deslumbrante $ 3759 a $ 1399un sólido descuento del 63 por ciento. Por…

Aquí están todas las cosas increíbles que vimos en el tráiler de Spider-Man: Brand New Day

El primer tráiler de Spider-Man: Nuevo día finalmente ha aparecido, provocando el decano desafío de Peter Parker hasta el momento. Ambientada cuatro primaveras luego de los acontecimientos de Sin camino…

You Missed

Encontré una mini PC que supera esta proposición de computadora portátil HP en Best Buy

Encontré una mini PC que supera esta proposición de computadora portátil HP en Best Buy

Joel Santos dice están atentos a conflicto en Medio Oriente para certificar avituallamiento de energía en el país

Joel Santos dice están atentos a conflicto en Medio Oriente para certificar avituallamiento de energía en el país

Abinader exalta cesión de Orlando Martínez con Orden al Mérito Duarte, Sánchez y Grieta

Abinader exalta cesión de Orlando Martínez con Orden al Mérito Duarte, Sánchez y Grieta

Productos Chef presenta nueva ristra premium Chef Gastrónomo

Productos Chef presenta nueva ristra premium Chef Gastrónomo

Aquí están todas las cosas increíbles que vimos en el tráiler de Spider-Man: Brand New Day

Aquí están todas las cosas increíbles que vimos en el tráiler de Spider-Man: Brand New Day

Abinader entrega condecoración póstuma al periodista Orlando Martínez Howley

Abinader entrega condecoración póstuma al periodista Orlando Martínez Howley