Las empresas de inteligencia sintético quieren que dejes de chatear con bots y comiences a administrarlos

Las empresas de inteligencia sintético quieren que dejes de chatear con bots y comiences a administrarlos

A pesar de la exageración acerca de que estos agentes sean compañeros de trabajo, según nuestra experiencia, estos agentes tienden a trabajar mejor si se los considera herramientas que amplifican las habilidades existentes, no como los compañeros de trabajo autónomos que implica el idioma de marketing. Pueden producir borradores impresionantes rápidamente pero aún requieren una corrección humana constante del rumbo.

El tiro de Frontier se produjo tan pronto como tres días luego de que OpenAI lanzara una nueva aplicación de escritorio macOS para Codex, su útil de codificación de IA, que los ejecutivos de OpenAI describieron como un “centro de comando para agentes”. La aplicación Codex permite a los desarrolladores ejecutar múltiples subprocesos de agentes en paralelo, cada uno de los cuales trabaja en una copia aislada de una saco de código a través de árboles de trabajo de Git.

OpenAI todavía lanzó el jueves GPT-5.3-Codex, un nuevo maniquí de IA que impulsa la aplicación Codex. OpenAI afirma que el equipo del Codex utilizó las primeras versiones de GPT-5.3-Codex para depurar la ejecución de entrenamiento del maniquí, resolver su implementación y diagnosticar los resultados de las pruebas, similar a lo que OpenAI le dijo a Ars Technica en una entrevista en diciembre.

“Nuestro equipo quedó impresionado por lo mucho que Codex pudo acelerar su propio progreso”, escribió la compañía. En Terminal-Bench 2.0, el punto de narración de codificación agente, GPT-5.3-Codex obtuvo una puntuación del 77,3%, lo que supera al recién resuelto Opus 4.6 de Anthropic en aproximadamente 12 puntos porcentuales.

El hilo conductor de todos estos productos es un cambio en el rol del heredero. En ocupación de simplemente escribir un mensaje y esperar una única respuesta, el desarrollador o trabajador del conocimiento se vuelve más como un supervisor, distribuyendo tareas, monitoreando el progreso e interviniendo cuando un agente necesita dirección.

Según esta visión, los desarrolladores y los trabajadores del conocimiento se convierten efectivamente en mandos intermedios de la IA. Es afirmar, no escribir el código ni hacer el prospección ellos mismos, sino delegar tareas, revisar los resultados y esperar que los agentes debajo de ellos no rompan las cosas silenciosamente. Aún se debate ampliamente si eso sucederá (o si efectivamente es una buena idea).

Related Posts

La nueva función de seguridad de Samsung reinicia tu teléfono luego de 72 horas de inactividad

Samsung ha complemento una nueva función de seguridad a los teléfonos Galaxy que puede reiniciar su dispositivo si no se utiliza durante demasiado tiempo. La función indicación Reinicio de inactividad…

La utensilio de equipo rojo de IA de código rajado utilizada por las empresas Fortune 500 ahora es parte de OpenAI

La adquisición de Promptfoo, que cuenta con más de 125.000 desarrolladores y más de 30 empresas Fortune 500 entre sus usuarios, es el movimiento más directo de OpenAI hasta ahora…

You Missed

Capotillo camina por la nación y exalta a Duarte, Sánchez y Melladura

Capotillo camina por la nación y exalta a Duarte, Sánchez y Melladura

La nueva función de seguridad de Samsung reinicia tu teléfono luego de 72 horas de inactividad

La nueva función de seguridad de Samsung reinicia tu teléfono luego de 72 horas de inactividad

Condena de 15 abriles de prisión por red de comercio sexual

Condena de 15 abriles de prisión por red de comercio sexual

G7 apelaría a las reservas para estabilizar costohidrocarburos | AlMomento.net

G7 apelaría a las reservas para estabilizar costohidrocarburos | AlMomento.net

Colección RAAS celebra sus 23 primaveras

Colección RAAS celebra sus 23 primaveras

Le mochan la luz a consistorio y casa de alcaldesa por conexión ilegal – Remolacha

Le mochan la luz a consistorio y casa de alcaldesa por conexión ilegal – Remolacha