
OpenAI ha valiente oficialmente GPT-5.2, y las reacciones de los primeros evaluadores, entre los cuales OpenAI sembró el maniquí varios días ayer del emanación divulgado, en algunos casos hace semanas, pintan una imagen de dos tonos: es un brinco monumental en dirección a el razonamiento y la codificación profundos y autónomos, pero potencialmente decepcionante. "incremental" Aggiornamento para conversadores casuales.
Luego de los períodos de entrada temprano y el emanación más amplio de hoy, los ejecutivos, desarrolladores y analistas han recurrido a X (anteriormente Twitter) y a los blogs de la empresa para compartir los primeros resultados de sus pruebas.
Aquí hay un extracto de las primeras reacciones al posterior maniquí insignia de OpenAI.
"La IA como analista serio"
El elogio más robusto para GPT-5.2 se centra en su capacidad para manejar "problemas difíciles" que requieren más tiempo para pensar.
Matt Shumer, director ejecutor de HyperWriteAI, no se anduvo con rodeos su reseñallamando a GPT-5.2 Pro "El mejor maniquí del mundo."
Shumer destacó la tenacidad del maniquí, señalando que "piensa durante **más de una hora** en problemas difíciles. Y logra tareas que ningún otro maniquí puede realizar."
Este sentimiento fue cliché por Allie K. Milleremprendedor de inteligencia sintético y ex ejecutor de AWS. Miller describió el maniquí como un paso en dirección a "La IA como analista serio" en oportunidad de un "compañero abierto."
"El pensamiento y la resolución de problemas se sienten notablemente más fuertes," Miller escribió en X. "Da explicaciones mucho más profundas de las que estoy acostumbrado a ver. En un momento, textualmente escribió código para mejorar su propio OCR en medio de una tarea."
Ganancias empresariales: Box informa claros saltos en el rendimiento
Para el sector empresarial, la aggiornamento parece ser aún más significativa.
Aaron Levie, director ejecutor de Box, revelado en X que su empresa ha estado probando GPT-5.2 en entrada temprano. Levie informó que el maniquí realiza "7 puntos mejor que GPT-5.1" en sus pruebas de razonamiento ampliado, que se aproximan al trabajo de conocimiento del mundo efectivo en servicios financieros y ciencias de la vida.
"El maniquí incluso realizó la mayoría de las tareas mucho más rápido que GPT-5.1 y GPT-5." Levie señaló y confirmó que Box AI implementará la integración GPT-5.2 en breve.
Rutuja Rajwade, directora senior de marketing de productos de Box, amplió esto en una publicación de blog de la empresacitando mejoras específicas de latencia.
"Cuna compleja" Las tareas se redujeron de 46 segundos en GPT-5 a solo 12 segundos con GPT-5.2.
Rajwade incluso notó un brinco en las capacidades de razonamiento para la erguido de Medios y Entretenimiento, pasando del 76% de precisión en GPT-5.1 al 81% en el nuevo maniquí.
A "brinco serio" para codificación y simulación
Los desarrolladores encuentran GPT-5.2 particularmente potente para "un solo disparo" Procreación de estructuras de código complejas.
Pietro Schirano, director genérico de magicpathai, compartió un vídeo del maniquí construyendo un motor de gráficos 3D completo en un solo archivo con controles interactivos. "Es un gran avance en razonamiento arduo, matemáticas, codificación y simulaciones." Schirano publicó. "El ritmo del progreso es irreal."
SDe modo similar, Ethan Mollick, profesor de la Wharton School of Business de la Universidad de Pensilvania y escritor y becario progresista de LLM e IA desde hace mucho tiempo, demostró la capacidad del maniquí para crear un sombreador visualmente arduo—una ciudad neogótica infinita en un océano tormentoso—a través de un solo mensaje.
La Era Agentic: Autonomía de prolongado plazo
Quizás el cambio más utilitario sea la capacidad del maniquí para permanecer concentrado durante horas sin perder el hilo.
Dan Shipper, director ejecutor del boletín informativo sobre pruebas de inteligencia sintético Everyinformó que el maniquí realizó con éxito un exploración de pérdidas y ganancias (P&L) que requirió que funcionara de forma autónoma durante dos horas. "Hizo un exploración de pérdidas y ganancias donde funcionó durante 2 horas y me dio excelentes resultados." El remitente escribió.
Sin confiscación, Shipper incluso señaló que para las tareas diarias, la aggiornamento parece "mayoritariamente incremental."
En un artículo para cadaKatie Parrott escribió que, si acertadamente GPT-5.2 sobresale en el seguimiento de instrucciones, es "menos ingenioso" que competidores como Claude Opus 4.5 en ciertos contextos, como deducir la ubicación de un becario a partir de datos de correo electrónico.
Las desventajas: velocidad y rigidez
A pesar de la capacidad de razonamiento, el "observar" del maniquí ha generado críticas.
Shumer destacó una importante "penalización de velocidad" cuando se utiliza el modo Pensamiento del maniquí. "En mi experiencia, el modo Pensamiento es muy tranquilo para la mayoría de las preguntas." Shumer escribió en su reseña profunda. "Casi nunca uso Instant."
Allie Miller incluso señaló problemas con el comportamiento predeterminado del maniquí. "La desventaja es el tono y el formato," ella notó. "La voz predeterminada se sintió un poco más rígida y el comportamiento de distancia/deducción es extremo: una pregunta simple convertida en 58 viñetas y puntos numerados."
El veredicto
La reacción original sugiere que GPT-5.2 es una utensilio optimizada para usuarios avanzados, desarrolladores y agentes empresariales en oportunidad de un chat informal. Como resumió Shumer en su reseña: "Para investigaciones profundas, razonamientos complejos y tareas que se benefician de una consejo cuidadosa, GPT-5.2 Pro es la mejor opción adecuado en este momento."
Sin confiscación, para los usuarios que buscan escritura creativa o respuestas rápidas y fluidas, modelos como Claude Opus 4.5 siguen siendo fuertes competidores. "Mi maniquí preferido sigue siendo el Claude Opus 4.5," Miller admitió, "pero mi arduo trabajo ChatGPT recibirá un buen impulso incremental."






