QWEN-IMAGE EDIT le da a Photoshop una ejecución por su hacienda con ediciones de texto a imagen con IA que funcionan en segundos


¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora


Adobe Photoshop se encuentra entre las piezas de software más reconocibles en la vida creadas, utilizadas por más del 90% de los profesionales creativos del mundo, según Fotutorial.

Entonces el hecho de que un Nuevo maniquí de IA de código extenso QWEN-IMAGE EDITARpublicado ayer por el equipo de investigadores de IA del cíclope electrónico chino de Alibaba, IS ahora capaz de conseguir una gran cantidad de trabajos de publicación similar a Photoshop con entradas de texto solaes un logro sobresaliente.

Construido en el maniquí de Fundación QWEN-Image de 20 billones de parámetros arrojado a principios de este mes, QWen-Image-EDIT extiende las fortalezas únicas del sistema en la representación de texto para cubrir un amplio espectro de tareas de publicación, desde cambios sutiles hasta transformaciones semánticas más amplias.

Simplemente suba una imagen original: probé uno de mí mismo de La última conferencia de transformación anual de VentureBeat En San Francisco, y luego escriba instrucciones de lo que desea cambiar, y Qwen-Image-Edit devolverá una nueva imagen con las ediciones aplicadas.


AI Scaling alcanza sus límites

Los límites de potencia, el aumento de los costos del token y los retrasos de inferencia están remodelando Enterprise AI. Únase a nuestro salón exclusivo para descubrir cómo son los mejores equipos:

  • Convertir la energía en una superioridad estratégica
  • Bloque de inferencia apto para ganancias reales de rendimiento
  • Desbloquear ROI competitivo con sistemas de IA sostenibles

Asegure su circunstancia para mantenerse a la vanguardia: https://bit.ly/4mwgngo


Ejemplo de imagen de entrada:

QWEN-IMAGE EDIT le da a Photoshop una ejecución por su hacienda con ediciones de texto a imagen con IA que funcionan en segundos
Crédito de la foto: Michael O’Donnell Photography

Ejemplo de imagen de salida con el indicador: “Haz que el hombre use un esmoquin”.

El maniquí está adecuado ahora en varias plataformas, incluidas Chat de qwen, Cara abrazada, Modelscope, Giruby a través del Interfaz de programación de aplicaciones en la nimbo de Alibaba (API)este postrer que permite a cualquier desarrollador o empresa de terceros integrar este nuevo maniquí en sus propias aplicaciones y flujos de trabajo.

Creé mis ejemplos anteriores en Chat de qwensin incautación, el rival del equipo de Qwen para el CHATGPT de OpenAI, debe tenerse en cuenta para cualquier afortunado solicitante que las generaciones estén limitadas a aproximadamente 8 trabajos gratuitos (entrada/horizontes) por período de 12 horas antaño de reiniciar. Los usuarios de plazo pueden tener acercamiento a más trabajos.

Con el apoyo a las entradas inglesas y chinas, y un enfoque dual tanto en el significado semántico como en la fidelidad visual, el objetivo de Qwen-Image-edit tiene las barreras más bajas para la creación de contenido visual de fracción profesional.

Y regalado que el maniquí está adecuado como un código fuente extenso bajo una osadía Apache 2.0es seguro para las empresas tomar, descargar y configurar de forma gratuita en su propio hardware o nubes/máquinas virtuales, lo que podría provocar un gran economía de costos del software propietario como Photoshop.

Como Junyang Lin, un investigador del equipo de Qwen, escribió en X: “Puede eliminar un hilo de melena, una modificación de imagen muy delicada”.

El anuncio del equipo se hace eco de este sentimiento, presentando Qwen-Image-edit no como un sistema completamente nuevo, sino como una extensión natural de Qwen-Image que aplica su renderizado de texto único y su enfoque de doble codificación directamente para la publicación de tareas.

Las codificaciones duales permiten ediciones que preservan el estilo y el contenido de la imagen llamativo

QWEN-IMAGE-EDIT se plinto en la almohadilla establecida por Municipio de qwenque se introdujo a principios de este año como un maniquí a gran escalera especializado en engendramiento de imágenes y representación de texto.

El noticia técnico de Qwen-Image destacó su capacidad para manejar tareas complejas como representación de texto a nivel de párrafo, caracteres chinos e ingleses, y diseños de múltiples líneas con precisión.

El noticia asimismo enfatizó un mecanismo de codificación dualalimentando imágenes simultáneamente en Qwen2.5-VL para el control semántico y un autoencoder variacional (VAE) para detalles reconstructivos. Este enfoque permite que las ediciones que sigan siendo fieles tanto a la intención del aviso como al aspecto de la imagen llamativo.

Esas mismas opciones arquitectónicas sustentan QWEN-IMAGE-EDIT. Al exprimir las codificaciones duales, el maniquí puede ajustarse en dos niveles: ediciones semánticas que cambian el significado o estructura de una secuencia, y ediciones de apariencia que introducen o eliminan fundamentos mientras mantienen el resto puro.

Estampado semántica Incluye la creación de una nueva propiedad intelectual, objetos giratorios 90 o 180 grados para revelar diferentes vistas, o cambiar una entrada en otro estilo, como el arte inspirado en Studio Ghibli. Estas ediciones generalmente modifican muchos píxeles pero preservan la identidad subyacente de los objetos.

Aquí está Un ejemplo de publicación semántica Desde Shridhar Athinarayanan, un ingeniero de la plataforma de aplicaciones de IA Replicada, que utilizó una implementación o “inferencia” de Qwen para reskin una foto de Manhattan para parecerse a un conjunto de cachivache.

Apariencia Estampado Se centra en cambios locales precisos. En estos casos, la viejo parte de la imagen permanece sin cambios, mientras que los objetos específicos están alterados. Las demostraciones incluyen amplificar un título que genera un reflexivo en el agua, eliminar los mechones del melena callejero de un retrato y cambiar el color de una sola pagaré en una imagen de texto.

Un buen ejemplo de publicación de apariencia con Qwen-Image Edit proviene del cofundador y CEO de Respuestai, Thomas Hill, que publicó un flanco a flanco en x Mostrando a su esposa en su vestido de novia debajo de un curvatura y otro con el mismo curvatura cubierto de graffiti:

Combinado con la fuerza establecida de Qwen para representar el texto chino e inglés, el sistema centrado en la publicación se posiciona como una aparejo flexible para los creadores que necesitan imágenes generativas más que simples.

El control dual sobre el difusión semántico y la fidelidad de la apariencia significa que la misma aparejo puede satisfacer evacuación muy diferentes, desde el avance creativo de IP hasta el retoco de fotos de nivel de producción.

Adicionar o eliminar texto a las imágenes

Otra capacidad destacada es Estampado de texto bilingüe. QWEN-IMAGE-EDIT permite a los usuarios amplificar, eliminar o modificar el texto tanto en chino como en inglés mientras preservan la fuente, el tamaño y el estilo.

Esto se expande en la reputación de Qwen-Image por una representación de texto musculoso, particularmente en escenarios desafiantes como intrincados caracteres chinos.

En la destreza, esto permite una publicación precisa de carteles, letreros, camisetas o obras de arte de caligrafía donde los detalles de texto pequeños importan, como se ve en Otro ejemplo de replicar a continuación.

Una demostración implicó corregir errores en una habitación de caligrafía china generada a través de un proceso de publicación paso a paso encadenado.

Los usuarios podrían resaltar regiones incorrectas, instruir al sistema para que las arregle y luego refinar aún más los detalles hasta que se presentaran los caracteres correctos. Este enfoque iterativo muestra cómo el maniquí se puede aplicar a tareas de publicación de stop peligro donde la precisión es esencial.

Aplicaciones y casos de uso

El equipo de Qwen ha destacado una gradación de aplicaciones potenciales:

  • Diseño creativo y expansión de IPcomo difundir paquetes de emoji basados ​​en mascotas.
  • Creación de publicidad y contenidodonde se pueden personalizar los logotipos, la señalización y las imágenes pesadas de texto.
  • Avatares virtuales y artecon transferencia de estilo que respalda representaciones únicas de personajes.
  • Fotografía y uso personalincluyendo ajustes de fondo, cambios de ropa y exterminio de objetos.
  • Preservación culturaldemostrado mediante la corrección de obras de caligrafía clásica.

Al unir la publicación de espinilla fino con transformaciones creativas más amplias, la publicación de Qwen-Image atiende a profesionales que necesitan control sin dejar de ser accesibles para la experimentación casual.

Benchmarking y rendimiento

Según el equipo de Qwen, las evaluaciones en puntos de relato públicos indican que la EDIT QWEN-IMAGE entrega función de última engendramiento en publicación de imágenes.

Esto se deduce de las evaluaciones técnicas más amplias de la imagen QWEN, donde el maniquí almohadilla logró los resultados principales en las tareas generales de engendramiento de imágenes y de representación de texto.

Si aceptablemente las cifras de relato de publicación específicas no se detallaron en la lectura, QWen-Image en sí se ubicó en gran medida en evaluaciones independientes como AI Arena, donde los evaluadores humanos compararon los resultados entre modelos de diferentes proveedores.

Precios y disponibilidad de API

A través de Estudio de modelos de nimbo de Alibabalos desarrolladores pueden entrar a Qwen-Image-edit como API. El precio se establece en $ 0.045 por imagencon una cuota gratuita de 100 imágenes válidas por 180 días posteriormente de la activación.

El servicio está inicialmente adecuado en el Región de Singapurcon un periferia de tarifa de Cinco solicitudes por segundo y hasta Dos tareas concurrentes por cuenta.

Para usar la API, los desarrolladores deben obtener una tecla API de estudio maniquí y pueden gustar al maniquí a través de HTTP o a través del SDK Dashscope en Python o Java.

Las imágenes se pueden dirigir como URL o en formato Base64, con resoluciones compatibles que van desde 512 a 4,096 píxeles y tamaños de archivos de hasta 10 MB. Las imágenes de salida se alojan en el almacenamiento de objetos en la nimbo de Alibaba con enlaces válidos durante 24 horas, lo que requiere que los usuarios descarguen y guarden resultados de inmediato.

¿Qué sigue para Qwen?

Qwen posiciona la imagen edit como un remolqueD Borrar barreras para la creación de contenido visual. Al hacer que la publicación precisa y consistente con el estilo sea más accesible, el maniquí podría convenir aplicaciones de estudios de diseño a usuarios casuales que refinan proyectos personales.

El sistema asimismo señala una tendencia más amplia en el avance de la IA: ir más allá de la engendramiento de un solo propósito con destino a herramientas que integran la publicación, la corrección y el refinamiento.

Con flexibilidad semántica y precisión a nivel de apariencia, QWen-Image-Edit refleja este cambio, combinando las fortalezas generativas de los modelos grandes con la confiabilidad requerida para la publicación profesional.


Related Posts

Android ocultará la descarga de algunas aplicaciones detrás de un nuevo proceso de seguridad único

Google ha detallado cómo los usuarios podrán descargar aplicaciones de desarrolladores no verificados una vez que implemente su política más restrictiva cerca de la descarga de software en Android. La…

Polymarket continúa su asociación con un acuerdo con las Grandes Ligas de Béisbol

La plataforma de predicción Polymarket ha estado en una ola de asociaciones, una tendencia que continuó esta semana, con un nuevo acuerdo que involucra a las Grandes Ligas de Béisbol.…

You Missed

EE. UU. considera a Venezuela una amenaza último

EE. UU. considera a Venezuela una amenaza último

Vakeró publica foto de sus Premios Soberano en la basura y cuestiona el proceso

Vakeró publica foto de sus Premios Soberano en la basura y cuestiona el proceso

Android ocultará la descarga de algunas aplicaciones detrás de un nuevo proceso de seguridad único

Android ocultará la descarga de algunas aplicaciones detrás de un nuevo proceso de seguridad único

Gobierno reacciona adecuado y contento por estudio que atribuye a Abinader fortalecimiento de democracia en RD

Gobierno reacciona adecuado y contento por estudio que atribuye a Abinader fortalecimiento de democracia en RD

Asambleísta George Alvarez presenta carta para defender a las familias trabajadoras y certificar cuidado digno para personas con discapacidades del exposición

Asambleísta George Alvarez presenta carta para defender a las familias trabajadoras y certificar cuidado digno para personas con discapacidades del exposición

República Dominicana será sede del Congreso Internacional de Comunicación Política 2026

República Dominicana será sede del Congreso Internacional de Comunicación Política 2026