¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora
Google Lanzó Gemini 2.5 Flash Image, un nuevo maniquí que muchos usuarios beta conocían como nanobanana, lo que le da a las empresas más opciones para proyectos creativos. Les permite cambiar el aspecto de las imágenes que necesitan rápidamente y con más control que los modelos anteriores ofrecidos.
El maniquí se integrará en la aplicación Gemini.
El maniquí, construido sobre Gemini 2.5 Flash, agrega más capacidades a la estampado de imágenes nativas en la aplicación Gemini. La imagen flash Gemini 2.5 mantiene las semejanzas de caracteres entre diferentes imágenes y tiene más consistencia al editar imágenes. Si un beneficiario carga una foto de su mascota y luego le pide al maniquí que cambie el fondo o agregue un sombrero a su perro, la imagen flash Gemini 2.5 lo hará sin alterar el tema de la imagen.
“Sabemos que al editar fotos de usted o personas que conoces proporcionadamente, las fallas sutiles son importantes, una representación que está” cercana pero no igual “no se siente proporcionadamente”, dijo Google en una publicación de blog escrita por Gemini Apps Generation Multimodal Generation Lead David Sharon y Google DeepMind Gemini Image Product Nicole Brichtova. “Es por eso que nuestra última modernización está diseñada para hacer fotos de sus amigos, familiares e incluso sus mascotas se parecen constantemente a sí mismas”.
AI Scaling alcanza sus límites
Los límites de potencia, el aumento de los costos del token y los retrasos de inferencia están remodelando Enterprise AI. Únase a nuestro salón exclusivo para descubrir cómo son los mejores equipos:
- Convertir la energía en una preeminencia estratégica
- Inmueble de inferencia válido para ganancias reales de rendimiento
- Desbloquear ROI competitivo con sistemas de IA sostenibles
Asegure su motivo para mantenerse a la vanguardia: https://bit.ly/4mwgngo
Una queja que las empresas y algunos usuarios individuales tenían es que cuando se incitan a las ediciones en imágenes generadas por IA, los ligeros ajustes alteran demasiado la foto. Por ejemplo, cualquiera puede instruir al maniquí para que mueva la posición de una persona en la imagen, y aunque el maniquí hace lo que se le dice, la cara de la persona se altera sutilmente.

Todas las imágenes generadas en Gemini incluirán la marca de agua Synthid de Google. El maniquí está arreglado para todos los usuarios pagados y gratuitos de la aplicación Gemini.
La especulación de que Google planea divulgar un nuevo maniquí de imagen funcionó rampante en las plataformas de redes sociales. Los usuarios de LM Arena vieron un nuevo maniquí misterioso llamado Nanobanana que siguió “instrucciones complejas y de varios pasos con una precisión impresionante”, como lo expresó la socia de Andressen Horowitz, Justine Moore.
La parentela pronto notó que el maniquí de Nanobanana parecía provenir de Google antiguamente de que varios evaluadores tempranos lo confirmaran. Aunque en ese momento, Google no confirmó lo que planeaba hacer con el maniquí en LM Arena.
Hasta esta semana, la especulación sobre cuándo saldría el maniquí continuó, lo cual es profético en cierto modo.
Gran parte de la emoción se produce como la lucha entre los proveedores de modelos para ofrecer imágenes y ediciones más capaces y realistas, mostrando cuán poderosos se han vuelto los modelos multimodales.
Sin requisa, Google todavía necesita batallar contra rivales como Qwen y su recientemente lanzazo Qwen-Image Edit y Opadaique agregó la estampado de imágenes de IA nativa a ChatGPT y todavía puso el maniquí a disposición de API.
Por supuesto, AdobeDurante mucho tiempo consideró uno de los líderes en el espacio de estampado de imágenes, agregó su maniquí insignia Firefly a Photoshop y sus otras plataformas de estampado de fotos.
Publicación de imágenes nativas
Gemini agregó la estampado de imágenes de IA nativas en Gemini en marzo, que ofreció a los usuarios gratuitos de la plataforma de chat.
Tolerar funciones de estampado de imágenes directamente a la plataforma de chat permitiría a las empresas arreglar imágenes o gráficos sin mover Windows.
Los usuarios pueden subir una foto a Gemini, luego decirle al maniquí qué cambios desean. Una vez que están satisfechos, las nuevas imágenes se pueden retornar a cargar a Géminis y convertirse en un video.
Por otra parte de añadir un disfraz o un cambio de ubicación, la imagen flash Gemini 2.5 puede combinar diferentes fotos, ofrece estampado de múltiples vueltas y mezclar estilos de una imagen a otra.





