OpenAI revela detalles técnicos sobre cómo funciona su agente de codificación de IA

OpenAI revela detalles técnicos sobre cómo funciona su agente de codificación de IA

Vale la pena señalar que los dos AbiertoAI y antrópico abran sus clientes CLI de codificación en GitHub, lo que permite a los desarrolladores examinar la implementación directamente, mientras que no hacen lo mismo con ChatGPT o la interfaz web de Claude.

Una observación oficial al interior del circuito.

La publicación de Bolin se centra en lo que él flama “el onda del agente”, que es la deducción central que orquestina las interacciones entre el becario, el maniquí de IA y las herramientas de software que el maniquí invoca para realizar el trabajo de codificación.

Como escribimos en diciembre, en el centro de cada agente de IA hay un ciclo que se repite. El agente recibe información del becario y prepara un mensaje de texto para el maniquí. Luego, el maniquí genera una respuesta, que produce una respuesta final para el becario o solicita una señal a una aparejo (como ejecutar un comando de shell o observar un archivo). Si el maniquí solicita una señal a la aparejo, el agente la ejecuta, agrega el resultado al mensaje llamativo y consulta el maniquí nuevamente. Este proceso se repite hasta que el maniquí deja de solicitar herramientas y en su ocasión genera un mensaje de asistente para el becario.

Ese proceso de onda tiene que comenzar en alguna parte, y la publicación de Bolin revela cómo Codex construye el mensaje original enviado a la API de Respuestas de OpenAI, que maneja la inferencia del maniquí. El mensaje se construye a partir de varios componentes, cada uno con una función asignada que determina su prioridad: sistema, desarrollador, becario o asistente.

El campo de instrucciones proviene de un archivo de configuración especificado por el becario o de instrucciones básicas incluidas con la CLI. El campo de herramientas define qué funciones puede chillar el maniquí, incluidos comandos de shell, herramientas de planificación, capacidades de búsqueda web y cualquier aparejo personalizada proporcionada a través de los servidores del Protocolo de contexto del maniquí (MCP). El campo de entrada contiene una serie de principios que describen los permisos de la zona de pruebas, instrucciones opcionales para el desarrollador, contexto del entorno como el directorio de trabajo flagrante y, finalmente, el mensaje existente del becario.

Related Posts

Android 17, ahora con aún más burbujas

Bienvenidos al episodio 91 de Pixelated, un podcast de 9to5Google. Esta semana, con Abner y Damien en el MWC, Will invita a Andrew Romero a unirse a él en un…

Apple todavía tiene más de una docena de productos en ampliación para 2026, esto es lo que viene

Apple acaba de concluir una semana muy emocionante de anuncios, comenzando con el iPhone 17e y terminando con macbook neo. Si correctamente obtuvimos 7 productos nuevos esta semana, todavía hay…

You Missed

Haití enfrenta incertidumbre antaño de su regreso al Mundial 2026

Haití enfrenta incertidumbre antaño de su regreso al Mundial 2026

Sameji vence Pueblo Nuevo en la final baloncesto de Santiago | AlMomento.net

Sameji vence Pueblo Nuevo en la final baloncesto de Santiago | AlMomento.net

Android 17, ahora con aún más burbujas

Android 17, ahora con aún más burbujas

“Hemos obligado formalmente al Gobierno de Venezuela” – Remolacha

“Hemos obligado formalmente al Gobierno de Venezuela” – Remolacha

Apple todavía tiene más de una docena de productos en ampliación para 2026, esto es lo que viene

Apple todavía tiene más de una docena de productos en ampliación para 2026, esto es lo que viene

Corte adolescente en República Dominicana: 1,217 a enero 2026

Corte adolescente en República Dominicana: 1,217 a enero 2026