Más allá de la IA de un solo maniquí: cómo el diseño arquitectónico impulsa una orquestación confiable de múltiples agentes


Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo sobre la cobertura de IA líder de la industria. Obtenga más información


Estamos viendo a Ai transformarse rápidamente. Ya no se prostitución solo de construir un solo maniquí súper inteligente. El serio poder, y la emocionante frontera, radica en ganar que múltiples agentes de IA especializados trabajen juntos. Piense en ellos como un equipo de colegas expertos, cada uno con sus propias habilidades: uno analiza los datos, otro interactúa con los clientes, un tercero administra la abastecimiento, etc. Hacer que este equipo colabore sin problemas, según lo prevista por diversas discusiones de la industria y competente por plataformas modernas, es donde ocurre la ilusionismo.

Pero seamos realistas: coordinar un montón de agentes independientes, a veces extravagantes y duro. No es solo construir agentes individuales geniales; Es el bit medio enmarañado, la orquestación, lo que puede hacer o romper el sistema. Cuando tiene agentes que se basan entre sí, actúan de forma asincrónica y potencialmente fallando de forma independiente, no solo está construyendo software; Estás llevando a sitio una banda compleja. Aquí es donde entran los planos arquitectónicos sólidos. Necesitamos patrones diseñados para la confiabilidad y la escalera desde el principio.

El problema áspero de la colaboración del agente

¿Por qué orquestar sistemas de múltiples agentes es un desafío? Bueno, para asomar:

  1. Son independientes: A diferencia de las funciones que se llaman en un software, los agentes a menudo tienen sus propios bucles, metas y estados internos. No solo esperan pacientemente las instrucciones.
  2. La comunicación se complica: No es solo el agente un para murmurar con el agente B. Agent A podría transmitir información de información C y D, mientras que el Agente B está esperando una señal de E ayer de decirle poco.
  3. Necesitan tener un cerebro compartido (estado): ¿Cómo están todos de acuerdo en la “verdad” de lo que está sucediendo? Si el agente A actualiza un registro, ¿cómo lo sabe el agente b al respecto? seguramente y rápidamente? La información obsoleta o conflictiva es un perverso.
  4. El fracaso es fatal: Un agente se bloquea. Se pierde un mensaje. Un servicio forastero se convierte en tiempo de salida. Cuando se cae una parte del sistema, no desea que todo se detenga o, lo que es peor, haciendo lo incorrecto.
  5. La consistencia puede ser difícil: ¿Cómo se asegura de que un proceso arduo de varios pasos que involucra a varios agentes verdaderamente alcanza un estado final válido? Esto no es liviana cuando las operaciones se distribuyen y están asincrónicas.

En pocas palabras, la complejidad combinatoria explota a medida que agrega más agentes e interacciones. Sin un plan sólido, la depuración se convierte en una pesadilla, y el sistema se siente frágil.

Nominar su volumen de jugadas de orquestación

La forma en que decide que los agentes coordinan su trabajo es quizás la votación arquitectónica más fundamental. Aquí hay algunos marcos:

  • El conductor (jerárquico): Esto es como una banda sinfónica tradicional. Tiene un orquestador principal (el director) que dicta el flujo, dice a los agentes específicos (músicos) cuándo realizar su dormitorio y la une todo.
    • Esto permite: borrar flujos de trabajo, ejecución que es liviana de rastrear, control directo; Es más simple para sistemas más pequeños o menos dinámicos.
    • Tenga cuidado: el conductor puede convertirse en un cuello de botella o un solo punto de rotura. Este atmósfera es menos flexible si necesita que los agentes reaccionen dinámicamente o trabajen sin supervisión constante.
  • El conjunto de jazz (federado/descentralizado): Aquí, los agentes se coordinan más directamente entre sí según las señales o reglas compartidas, al igual que los músicos en una costado de jazz que improvisan basadas en señales entre sí y un tema popular. Puede tener medios compartidos o transmisiones de eventos, pero ningún cabecilla de mandato de Boss Central cada nota.
    • Esto permite: resiliencia (si un músico se detiene, el otro a menudo puede continuar), escalabilidad, adaptabilidad a las condiciones cambiantes, comportamientos más emergentes.
    • Qué considerar: puede ser más difícil entender el flujo común, la depuración es complicado (“¿Por qué ese agente hizo eso? entonces? “) Y certificar la consistencia completo requiere un diseño cuidadoso.

Muchos sistemas de agentes múltiples (MAS) del mundo vivo terminan siendo un híbrido, tal vez un orquestador de suspensión nivel prepara el atmósfera; luego grupos de agentes en el interior de esa estructura se coordinan decentricamente.

Manejo del cerebro colectivo (estado compartido) de los agentes de IA

Para que los agentes colaboren de forma efectiva, a menudo necesitan una visión compartida del mundo, o al menos las partes relevantes para su tarea. Este podría ser el estado contemporáneo de un pedido del cliente, una colchoneta de conocimiento compartida de la información del producto o el progreso colectivo con destino a una meta. Suministrar este “cerebro colectivo” consistente y accesible entre los agentes distribuidos es difícil.

Patrones arquitectónicos en los que nos apoyamos:

  • La Biblioteca Central (colchoneta de conocimiento centralizada): Un circunstancia único y acreditado (como una colchoneta de datos o un servicio de conocimiento dedicado) donde vive toda la información compartida. Los agentes revisan los libros (leen) y los devuelven (escriban).
    • Pro: fuente única de verdad, más liviana de hacer cumplir la consistencia.
    • Con: puede ser martillado con solicitudes, potencialmente ralentizando las cosas o convirtiéndose en un punto de estrangulamiento. Debe ser muy robusto y escalable.
  • Notas distribuidas (distinción distribuido): Los agentes mantienen copias locales de información frecuentemente necesaria para la velocidad, respaldadas por la Biblioteca Central.
    • Pro: lecturas más rápidas.
    • Con: ¿Cómo retener si su copia está actualizada? La invalidación y la consistencia del distinción se convierten en rompecabezas arquitectónicos significativos.
  • Actualizaciones de gritos (pase de mensajes): En circunstancia de que los agentes pregunten constantemente a la biblioteca, la biblioteca (u otros agentes) grita “¡Hola, esta información cambió!” a través de mensajes. Los agentes escuchan las actualizaciones que les importan y actualizan sus propias notas.
    • Pro: los agentes están desacoplados, lo cual es bueno para los patrones basados ​​en eventos.
    • Con: Estabilizar que todos reciban el mensaje y lo maneje correctamente agrega complejidad. ¿Qué pasa si se pierde un mensaje?

La votación correcta depende de cuán crítica sea la consistencia actualizada hasta el segundo, en comparación con la cantidad de rendimiento que necesita.

Construir para cuándo sale mal (manejo de errores y recuperación)

No es si un agente rotura, es cuándo. Su edificio necesita anticipar esto.

Pensar en:

  • Watchdogs (supervisión): Esto significa tener componentes cuyo trabajo es simplemente observar a otros agentes. Si un agente se calla o comienza a ejecutar raro, el perro cuidador puede intentar reiniciarlo o alertar al sistema.
  • Vuelva a intentarlo, pero sea inteligente (reintentos e idempotencia): Si la actividad de un agente rotura, a menudo debería retornar a intentarlo. Pero esto solo funciona si la actividad es ideMpotent. Eso significa que hacerlo cinco veces tiene exactamente el mismo resultado que hacerlo una vez (como establecer un valía, no incrementarlo). Si las acciones no son ideempotentes, los reintentos pueden causar caos.
  • Integridad de los desorden (compensación): Si el agente A hizo poco con éxito, pero el agente B (un paso posterior en el proceso) falló, es posible que deba “deshacer” el trabajo del agente A. Patrones como las sagas ayudan a coordinar estos flujos de trabajo compensables de múltiples pasos.
  • Sabiendo dónde estaba (estado de flujo de trabajo): Suministrar un registro persistente del proceso común ayuda. Si el sistema cae a parte del flujo del trabajo, puede retomar desde el postrero buen paso conocido en circunstancia de comenzar de nuevo.
  • Construcción de firewalls (circuitos y mamparos): Estos patrones evitan que una rotura en un agente o servicio se sobrecargue o se bloquee a otros, que contiene el daño.

Comprobar de que el trabajo se haga correctamente (ejecución de tareas consistente)

Incluso con la confiabilidad del agente individual, necesita confianza en que toda la tarea de colaboración termina correctamente.

Considerar:

  • Operaciones atómicas: Si correctamente las transacciones ácidas verdaderas son difíciles con los agentes distribuidos, puede diseñar flujos de trabajo para comportarse lo más atómicamente posible utilizando patrones como las sagas.
  • El volumen de registro sin cambios (avituallamiento de eventos): Registre cada actividad significativa y cambio de estado como un evento en un registro inmutable. Esto le brinda una historia perfecta, facilita la reconstrucción del estado y es excelente para la auditoría y la depuración.
  • De acuerdo en la ingenuidad (consenso): Para las decisiones críticas, es posible que necesite agentes que acuerden ayer de continuar. Esto puede implicar mecanismos de votación simples o algoritmos de consenso distribuidos más complejos si la confianza o la coordinación son particularmente desafiantes.
  • Demostración del trabajo (nervio): Cree pasos en su flujo de trabajo para validar la salida o estado posteriormente de que un agente complete su tarea. Si poco parece mal, active un proceso de reconciliación o corrección.

La mejor edificio necesita la colchoneta correcta.

  • La oficina de correos (colas de mensajes/corredores como Kafka o Rabbitmq): Esto es absolutamente esencial para los agentes de desacoplamiento. Envían mensajes a la rabo; Los agentes interesados ​​en esos mensajes los recogen. Esto permite una comunicación asincrónica, maneja los picos de tráfico y es esencia para los sistemas distribuidos resilientes.
  • El fichero compartido (tiendas de conocimiento/bases de datos): Aquí es donde vive su estado compartido. Elija el tipo correcto (Relacional, NoSQL, Graph) basado en su estructura de datos y patrones de comunicación. Esto debe ser un rendimiento y en gran medida apto.
  • La máquina de rayos X (plataformas de observabilidad): Registros, métricas, rastreo: los necesitas. La depuración de sistemas distribuidos es notoriamente difícil. Poder ver exactamente lo que cada agente estaba haciendo, cuándo y cómo interactuaban no es negociable.
  • El directorio (Registro de agentes): ¿Cómo se encuentran los agentes o descubren los servicios que necesitan? Un registro central ayuda a diligenciar esta complejidad.
  • El patio de recreo (contenedorización y orquestación como Kubernetes): Así es como verdaderamente implementa, administra y escalera todas esas instancias de agentes individuales de forma confiable.

¿Cómo chatan los agentes? (Opciones de protocolo de comunicación)

La forma en que los agentes hablan impacta todo, desde el rendimiento hasta lo estrechamente acoplados que están.

  • Su llamamiento telefónica en serie (REST/HTTP): Esto es simple, funciona en todas partes y es bueno para una solicitud/respuesta básica. Pero puede sentirse un poco hablador y puede ser menos capaz para estructuras de datos de suspensión prominencia o complejas.
  • La conferencia telefónica estructurada (GRPC): Esto utiliza formatos de datos eficientes, admite diferentes tipos de llamadas, incluida la transmisión y es de tipo seguro. Es excelente para el rendimiento, pero requiere delimitar contratos de servicio.
  • El tablón de anuncios (colas de mensajes: protocolos como AMQP, MQTT): Los agentes publican mensajes a temas; Otros agentes se suscriben a temas que les importan. Esto es asincrónico, en gran medida escalable y completamente desacopla los remitentes de los receptores.
  • Semirrecta directa (RPC – menos popular): Los agentes llaman a las funciones directamente sobre otros agentes. Esto es rápido, pero crea un articulación muy concorde: el agente necesita retener exactamente a quién llaman y a dónde están.

Elija el protocolo que se ajuste al patrón de interacción. ¿Es una solicitud directa? ¿Un evento de transmisión? Un flujo de datos?

Poniendo todo yuxtapuesto

Construir sistemas confiables y escalables múltiples no se prostitución de encontrar una bala mágica; Se prostitución de tomar decisiones arquitectónicas inteligentes basadas en sus evacuación específicas. ¿Te inclinarás más jerárquico para el control o la federada para la resiliencia? ¿Cómo gestionará ese estado compartido crucial? ¿Cuál es su plan para cuándo (no si) un agente cae? ¿Qué piezas de infraestructura no son negociables?

Es arduo, sí, pero al centrarse en estos planos arquitectónicos: orquestando interacciones, diligenciar el conocimiento compartido, planificar el fracaso, certificar la consistencia y la construcción de una colchoneta de infraestructura sólida: puede domar la complejidad y construir los sistemas robustos e inteligentes que impulsarán la próxima ola de la empresa AI.

Nikhil Gupta es el líder/regente de productos de mandato de productos de IA en Atlassiano.


Related Posts

Resultados de la averiguación semanal: el Galaxy S25 Edge necesitaba una hilera más holgado, un precio más bajo para tener éxito

El Samsung Galaxy S25 Edge podría ser el heraldo de una nueva tendencia en los teléfonos inteligentes de entrada abanico, un enfoque en un diseño delgado y presuroso. Sin bloqueo,…

3 películas de obra para ver en el Día de los Caídos

Solicitud Day es más que una excusa para salir de la parrilla. Incluso es un día diseñado para honrar a los que hemos perdido en combate, un importante sello distintivo…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Acusan al actor “Lupin” de favor amenazado a un agente de un tren por el dogal de su perro

Acusan al actor “Lupin” de favor amenazado a un agente de un tren por el dogal de su perro

Resultados de la averiguación semanal: el Galaxy S25 Edge necesitaba una hilera más holgado, un precio más bajo para tener éxito

Resultados de la averiguación semanal: el Galaxy S25 Edge necesitaba una hilera más holgado, un precio más bajo para tener éxito

¿Sabías que el Himno a las Madres lo escribió una mujer?

¿Sabías que el Himno a las Madres lo escribió una mujer?

las claves de la semana en un vistazo rápido

las claves de la semana en un vistazo rápido

“la cohesión regional exige medios más justos e inclusivos”

“la cohesión regional exige medios más justos e inclusivos”

ASDN lleva La Alcaldía en el Suburbio al sector La Esperanza

ASDN lleva La Alcaldía en el Suburbio al sector La Esperanza