Por qué la mayoría de los pilotos de codificación de IA empresarial tienen un rendimiento inferior (Pista: no es el maniquí)

Por qué la mayoría de los pilotos de codificación de IA empresarial tienen un rendimiento inferior (Pista: no es el maniquí)

La coexistentes de IA en la ingeniería de software ha ido mucho más allá del autocompletado. La frontera emergente es la codificación agente: sistemas de inteligencia químico capaces de planificar cambios, ejecutarlos en múltiples pasos e iterar en función de la feedback. Sin requisa, a pesar del entusiasmo en torno a los “agentes de IA que codifican”, la mayoría de las implementaciones empresariales tienen un rendimiento inferior. El creador limitante ya no es el maniquí. Es contexto: La estructura, la historia y la intención que rodean el código que se está cambiando. En otras palabras, las empresas se enfrentan ahora a un problema de diseño de sistemas: todavía no han diseñado el entorno en el que operan estos agentes.

El paso de la público a la agencia

El año pasado se vio una rápida proceso de herramientas de codificación de público a flujos de trabajo agentes. La investigación ha comenzado a formalizar lo que significa el comportamiento de agencia en la destreza: la capacidad de razonar a lo holgado del diseño, las pruebas, la ejecución y la empuje en división de gestar fragmentos aislados. Trabajo como remuestreo de entusiasmo dinámica muestra que permitir que los agentes se ramifiquen, reconsideren y revisen sus propias decisiones mejoría significativamente los resultados en bases de código grandes e interdependientes. A nivel de plataforma, proveedores como GitHub ahora están creando entornos de orquestación de agentes dedicados, como Agente copiloto y sede del agentepara respaldar la colaboración de múltiples agentes internamente de canales empresariales reales.

Pero los primeros resultados de campo son una advertencia. Cuando las organizaciones introducen herramientas agentes sin asaltar el flujo de trabajo y el entorno, la productividad puede disminuir. Un estudio de control accidental de este año mostró que los desarrolladores que utilizaron la público de IA en flujos de trabajo sin cambios completaron las tareas más lentamente, en gran parte correcto a la demostración, el retrabajo y la confusión en torno a la intención. La escarmiento es sencilla: la autonomía sin orquestación rara vez produce eficiencia.

Por qué la ingeniería de contexto es el serio desbloqueo

En cada despliegue fallido que he observado, el fracaso se debió al contexto. Cuando los agentes carecen de una comprensión estructurada de una pulvínulo de código, específicamente de sus módulos relevantes, esquema de dependencia, arnés de prueba, convenciones arquitectónicas e historial de cambios. A menudo generan resultados que parecen correctos pero que están desconectados de la existencia. Demasiada información abruma al agente; muy poco lo obliga a adivinar. El objetivo no es fomentar al maniquí con más tokens. El objetivo es determinar qué debe ser visible para el agente, cuándo y de qué forma.

Los equipos que ven avances significativos tratan el contexto como una superficie de ingeniería. Crean herramientas para capturar, compactar y versionar la memoria de trabajo del agente: lo que persiste en los turnos, lo que se descarta, lo que se resume y lo que está vinculado en división de integrado. Diseñan pasos de deliberación en división de sesiones de estímulo. Hacen de la explicación un artefacto de primera clase, poco revisable, comprobable y de propiedad, no un historial de chat transitorio. Este cambio se alinea con una tendencia más amplia que algunos investigadores describen como “las especificaciones se convierten en la nueva fuente de verdad”.

El flujo de trabajo debe cambiar pegado con las herramientas

Pero el contexto por sí solo no es suficiente. Las empresas deben rediseñar los flujos de trabajo en torno a estos agentes. Como Mensaje McKinsey 2025 “Un año de IA agente” Como se señaló, las ganancias de productividad no surgen de la incorporación de IA a los procesos existentes, sino de repensar el proceso en sí. Cuando los equipos simplemente colocan a un agente en un flujo de trabajo inalterado, se genera fricción: los ingenieros dedican más tiempo a compulsar el código escrito por IA del que habrían dedicado a escribirlo ellos mismos. Los agentes solo pueden amplificar lo que ya está estructurado: bases de código modulares proporcionadamente probadas con propiedad y documentación claras. Sin esos fundamentos, la autonomía se convierte en caos.

La seguridad y la gobernanza incluso exigen un cambio de mentalidad. El código generado por IA introduce nuevas formas de peligro: dependencias no examinadas, violaciones sutiles de osadía y módulos no documentados que escapan a la revisión por pares. Los equipos maduros están comenzando a integrar la actividad de agentes directamente en sus canales de CI/CD, tratando a los agentes como contribuyentes autónomos cuyo trabajo debe producirse el mismo prospección petrificado, registro de auditoría y puertas de aprobación que cualquier desarrollador humano. La propia documentación de GitHub destaca esta trayectoria, posicionando a los agentes Copilot no como reemplazos de ingenieros sino como participantes orquestados en flujos de trabajo seguros y revisables. El objetivo no es permitir que una IA “escriba todo”, sino avalar que cuando actúe, lo haga internamente de barreras de seguridad definidas.

En qué deberían centrarse ahora los responsables de la toma de decisiones empresariales

Para los líderes técnicos, el camino a seguir comienza con la preparación y no con la exageración. Los monolitos con pruebas escasas rara vez producen ganancias netas; Los agentes prosperan donde las pruebas tienen autoridad y pueden impulsar un refinamiento iterativo. Este es exactamente el rizo antrópico pide agentes codificadores. Pilotos en dominios de capacidad condicionado (coexistentes de pruebas, modernización heredada, refactores aislados); Trate cada implementación como un experimentación con métricas explícitas (tasa de escape de defectos, tiempo del ciclo de relaciones públicas, tasa de fallas de cambios, hallazgos de seguridad quemados). A medida que aumenta su uso, trate a los agentes como infraestructura de datos: cada plan, instantánea de contexto, registro de acciones y ejecución de prueba son datos que se componen en una memoria de búsqueda de intenciones de ingeniería y una delantera competitiva duradera.

En el fondo, la codificación agente es menos un problema de herramientas que un problema de datos. Cada instantánea del contexto, iteración de prueba y revisión de código se convierte en una forma de datos estructurados que deben almacenarse, indexarse ​​y reutilizarse. A medida que estos agentes proliferan, las empresas se encontrarán administrando una capa de datos completamente nueva: una que captura no sólo lo que se creó, sino incluso cómo se razonó. Este cambio convierte los registros de ingeniería en un esquema de conocimiento de intención, toma de decisiones y empuje. Con el tiempo, las organizaciones que puedan apañarse y reproducir esta memoria contextual superarán a aquellas que todavía tratan el código como texto petrificado.

El próximo año probablemente determinará si la codificación agente se convierte en una piedra angular del incremento empresarial o en otra promesa inflada. La diferencia dependerá de la ingeniería contextual: la inteligencia con la que los equipos diseñan el sustrato informativo en el que confían sus agentes. Los ganadores serán aquellos que vean la autonomía no como hechicería, sino como una extensión del diseño disciplinado de sistemas: flujos de trabajo claros, feedback mensurable y gobernanza rigurosa.

En pocas palabras

Las plataformas están convergiendo en la orquestación y las barreras de seguridad, y la investigación sigue mejorando el control del contexto en el momento de la inferencia. Los ganadores durante los próximos 12 a 24 meses no serán los equipos con el maniquí más bonito; ellos serán los que diseñen el contexto como un activo y traten el flujo de trabajo como el producto. Haga eso y la autonomía se agravará. Sáltelo y la nalgas de revisión lo hará.

Contexto + agente = apalancamiento. Sáltate la primera fracción y el resto se derrumba.

Dhyey Mavani está acelerando la IA generativa en LinkedIn.

Lea más de nuestro escritores invitados. ¡O considere cursar una publicación propia! Vea nuestro pautas aquí.

Related Posts

Conexiones del NYT de hoy: sugerencias y respuestas de la estampado deportiva del 8 de marzo #531

Buscando el más fresco ¿Respuestas habituales de Connections? Haga clic aquí para obtener las sugerencias de Connections de hoy, así como nuestras respuestas y sugerencias diarias para los mini crucigramas,…

El jerarca de robótica de OpenAI dimite tras acuerdo con el Área de Defensa

OpenAI necesitará encontrar un nuevo jerarca de robótica. Caitlin Kalinowski, ahora ex jefa de robótica de OpenAI, publicado en X que renunciaba a su cargo, al tiempo que criticaba la…

You Missed

Conexiones del NYT de hoy: sugerencias y respuestas de la estampado deportiva del 8 de marzo #531

Conexiones del NYT de hoy: sugerencias y respuestas de la estampado deportiva del 8 de marzo #531

Karl-Anthony Towns: 19 puntos, 17 rebotes en vencimiento de Knicks | AlMomento.net

Karl-Anthony Towns: 19 puntos, 17 rebotes en vencimiento de Knicks | AlMomento.net

Cuando la memoria no necesita campaña: Peña Gómez vuelve a ser tendencia

Cuando la memoria no necesita campaña: Peña Gómez vuelve a ser tendencia

El jerarca de robótica de OpenAI dimite tras acuerdo con el Área de Defensa

El jerarca de robótica de OpenAI dimite tras acuerdo con el Área de Defensa

Trump reconoce formalmente al gobierno de Venezuela

Trump reconoce formalmente al gobierno de Venezuela

Una hoja de ruta para la IA, si cualquiera quiere escuchar

Una hoja de ruta para la IA, si cualquiera quiere escuchar