Black Forest Labs venablo Flux.2 (klein) de código amplio para difundir imágenes de IA en menos de un segundo

Black Forest Labs venablo Flux.2 (klein) de código amplio para difundir imágenes de IA en menos de un segundo

La startup alemana de IA Black Forest Labs (BFL), fundada por antiguos ingenieros de Stability AI, continúa desarrollando su conjunto de generadores de imágenes de IA de código amplio con el divulgación de FLUX.2 (pequeño)un nuevo par de modelos pequeños (uno amplio y otro no comercial) que enfatizan la velocidad y los menores requisitos de enumeración, y los modelos generan imágenes en menos de un segundo en una Nvidia GB200.

La serie (klein), publicada ayer, incluye dos recuentos de parámetros principales: 4 mil millones (4B) y 9 mil millones (9B).

Los pesos del maniquí están disponibles en abrazando la cara y codificar GitHub.

Mientras que los modelos más grandes de la grupo FLUX.2 ((max) y (pro)), lanzados en noviembre de 2025, persiguen los límites del fotorrealismo y "búsqueda de puesta a tierra" capacidades, (klein) está diseñado específicamente para hardware de consumo y flujos de trabajo de latencia crítica.

Una gran nueva para las empresas es que la lectura 4B está acondicionado bajo una deshonestidad Apache 2.0, lo que significa que ellos, o cualquier estructura o desarrollador, pueden usar los modelos (klein) para sus fines comerciales sin retribuir ni un centavo a BFL ni a ningún intermediario.

Sin retención, varias plataformas de creación de medios e imágenes de IA, incluidas Fal.ai han comenzado a ofrecerlo a un costo extremadamente bajo todavía a través de sus interfaces de programación de aplicaciones (API) y como una aparejo directa al afortunado. Ya ha recibido grandes elogios de los primeros usuarios por su velocidad. Lo que le yerro en calidad de imagen común, parece compensarlo con su capacidad de procreación rápida, deshonestidad abierta, asequibilidad y tamaño escaso, lo que beneficia a las empresas que desean ejecutar modelos de imágenes en su propio hardware o a un costo extremadamente bajo.

Entonces, ¿cómo lo hizo BFL y en qué puede beneficiarle? Continúe leyendo para obtener más información.

El "Frontera de Pareto" de latencia

La filosofía técnica detrás de (klein) es lo que la documentación de BFL describe como la definición del "frontera de pareto" para calidad contra latencia. En términos simples, han intentado exprimir la máxima fidelidad visual posible en un maniquí lo suficientemente pequeño como para ejecutarse en una PC de juegos doméstica sin un retraso trascendente.

Las métricas de rendimiento publicadas por la empresa muestran una imagen de un maniquí creado para la interactividad en zona de solo la procreación por lotes.

Según las cifras oficiales de Black Forest Labs, los modelos (klein) son capaces de difundir o editar imágenes en menos de 0,5 segundos en hardware nuevo.

Incluso en GPU de consumo estereotipado como RTX 3090 o 4070, el maniquí 4B está diseñado para coger cómodamente en aproximadamente 13 GB de VRAM.

Esta velocidad se logra mediante "destilación," un proceso donde un maniquí más noble y enredado "enseña" uno más pequeño y más competente para aproximar sus resultados en menos pasos. Las variantes destiladas (klein) requieren sólo cuatro pasos para difundir una imagen. Esto efectivamente convierte el proceso de procreación de una tarea de pausa para el café en una tarea casi instantánea, permitiendo lo que BFL describe en X (anteriormente Twitter) como "desarrollando ideas de 0 → 1" en tiempo efectivo.

Bajo el capó: construcción unificada

Históricamente, la procreación y estampación de imágenes a menudo han requerido diferentes canalizaciones o adaptadores complejos (como ControlNets). FLUX.2 (klein) intenta unificarlos.

La construcción admite de forma nativa conversión de texto a imagen, estampación de narración única y composición de referencias múltiples sin carencia de trocar modelos.

Según la documentación publicada en GitHub, los modelos admiten:

  • Impresión de referencias múltiples: Los usuarios pueden cargar hasta cuatro imágenes de narración (o diez en el patio de juegos) para gobernar el estilo o la estructura del resultado.

  • Control de color de código hexadecimal: Un problema frecuente para los diseñadores es conseguir "ese tono exacto de rojo." Los nuevos modelos aceptan códigos hexadecimales específicos en las indicaciones (por ejemplo, #800020) para forzar una reproducción cromática precisa.

  • Indicaciones estructuradas: El maniquí analiza entradas estructuradas tipo JSON para composiciones rigurosamente definidas, una característica claramente dirigida a la procreación programática y los canales empresariales.

La división de licencias: pesos abiertos contra código amplio

Para las empresas emergentes y los desarrolladores que se basan en la tecnología de BFL, es fundamental comprender el panorama de licencias de esta lectura. BFL ha recogido una organización dividida que separa "diletante/investigación" uso de "infraestructura comercial."

  1. FLUX.2 (pequeño) 4B: Publicado bajo Apache 2.0. Esta es una deshonestidad de software evadido permisiva que permite el uso, modificación y redistribución comercial. Si está creando una aplicación paga, una plataforma SaaS o un pasatiempo que integra la procreación de IA, puede usar el maniquí 4B sin regalías.

  2. FLUX.2 (pequeño) 9B y (desarrollador): Publicado bajo la deshonestidad no comercial FLUX. Estos pesos están abiertos para que investigadores y aficionados los descarguen y experimenten, pero no se pueden utilizar para aplicaciones comerciales sin un acuerdo por separado.

Esta distinción posiciona al maniquí 4B como un competidor directo de otros modelos de peso amplio como Stable Diffusion 3 Medium o SDXL, pero con una construcción más moderna y una deshonestidad permisiva que elimina la imprecisión legítimo para las startups.

Integración del ecosistema: ComfyUI y más allá

BFL es claramente consciente de que un maniquí es tan bueno como las herramientas que lo ejecutan. Coincidiendo con la caída del maniquí, el equipo lanzó plantillas de flujo de trabajo oficiales para cómodola interfaz basada en nodos que se ha convertido en el entorno de incremento integrado (IDE) estereotipado para los artistas de IA.

Los flujos de trabajo, específicamente image_flux2_klein_text_to_image.json y las variantes de estampación: permiten a los usuarios deslizar y soltar las nuevas capacidades en los canales existentes inmediatamente.

La reacción de la comunidad en las redes sociales se ha centrado en esta integración del flujo de trabajo y la velocidad. En una publicación en X, la cuenta oficial de Black Forest Labs destacó la capacidad del maniquí para "explorar rápidamente una estética específica," mostrando un video donde el estilo de una imagen cambiaba instantáneamente a medida que el afortunado revisaba las opciones.

Por qué es importante para los responsables de la toma de decisiones sobre IA empresarial

El divulgación de FLUX.2 (klein) señala una maduración en el mercado de la IA generativa, pasando de la escalón original de novedad a un período definido por la utilidad, la integración y la velocidad.

Para los ingenieros líderes de IA que constantemente hacen malabarismos con la carencia de equilibrar la velocidad con la calidad, este cambio es fundamental. Estos profesionales, que gestionan el ciclo de vida completo de los modelos, desde la preparación de los datos hasta la implementación, a menudo enfrentan el desafío diario de integrar herramientas en rápida proceso en los flujos de trabajo existentes.

La disponibilidad de un maniquí 4B destilado bajo una deshonestidad Apache 2.0 ofrece una posibilidad habilidad para quienes se centran en una implementación rápida y ajustes para obtener objetivos comerciales específicos, permitiéndoles evitar los cuellos de botella de latencia que normalmente afectan a la procreación de imágenes de suscripción fidelidad.

Para los ingenieros sénior de IA centrados en la orquestación y la automatización, las implicaciones son igualmente significativas. Estos expertos son responsables de crear canales de IA escalables y sostener la integridad del maniquí en diferentes entornos, a menudo mientras trabajan bajo estrictas restricciones presupuestarias.

La naturaleza liviana de la grupo (klein) aborda directamente el desafío de implementar sistemas eficientes con fortuna limitados. Al utilizar un maniquí que se adapta a la VRAM de nivel de consumidor, los especialistas en orquestación pueden diseñar canales de inferencia locales rentables que eviten los elevados costos operativos asociados con modelos propietarios masivos.

Incluso para el Director de Seguridad de TI, el avance alrededor de modelos abiertos, capaces y ejecutables localmente ofrece una clara preeminencia. Con la tarea de proteger a la estructura de las ciberamenazas y diligenciar las operaciones de seguridad con fortuna limitados, la dependencia de API externas para flujos de trabajo creativos sensibles puede ser una vulnerabilidad.

Un maniquí de suscripción calidad que se ejecuta localmente permite a los líderes de seguridad aprobar herramientas de inteligencia industrial que mantienen datos propietarios internamente del firewall corporativo, equilibrando las demandas operativas del negocio con las sólidas medidas de seguridad que deben sostener.

Related Posts

La incómoda verdad sobre los vehículos híbridos

Esto es El paso a espaldasun boletín semanal que analiza una historia esencial del mundo de la tecnología. Para obtener más información sobre la lucha de los vehículos eléctricos, siga…

EFF, Ubuntu y otras distribuciones discuten cómo reponer a las leyes de comprobación de vida

Sistema76 no es el único que critica las nuevas leyes de comprobación de vida. el blog 9to5Linux publicó una inspección “informal” a otras discusiones en varias comunidades de Linux. A…

You Missed

¿Efectivamente funcionaron las reformas de Leonel Fernández para combatir la corrupción en República Dominicana?

¿Efectivamente funcionaron las reformas de Leonel Fernández para combatir la corrupción en República Dominicana?

La incómoda verdad sobre los vehículos híbridos

La incómoda verdad sobre los vehículos híbridos

EFF, Ubuntu y otras distribuciones discuten cómo reponer a las leyes de comprobación de vida

EFF, Ubuntu y otras distribuciones discuten cómo reponer a las leyes de comprobación de vida

donde la belleza mueve la patrimonio y las mujeres encuentran apoyo

donde la belleza mueve la patrimonio y las mujeres encuentran apoyo

Voy a salir a romper hoy en presencia de Israel

Voy a salir a romper hoy en presencia de Israel

Anthropic identifica los trabajos que la IA tiene más probabilidades de reemplazar

Anthropic identifica los trabajos que la IA tiene más probabilidades de reemplazar