Primeras impresiones de GPT-5.2: una aggiornamento poderosa, especialmente para tareas y flujos de trabajo comerciales

Primeras impresiones de GPT-5.2: una aggiornamento poderosa, especialmente para tareas y flujos de trabajo comerciales

OpenAI ha valiente oficialmente GPT-5.2, y las reacciones de los primeros evaluadores, entre los cuales OpenAI sembró el maniquí varios días ayer del emanación divulgado, en algunos casos hace semanas, pintan una imagen de dos tonos: es un brinco monumental en dirección a el razonamiento y la codificación profundos y autónomos, pero potencialmente decepcionante. "incremental" Aggiornamento para conversadores casuales.

Luego de los períodos de entrada temprano y el emanación más amplio de hoy, los ejecutivos, desarrolladores y analistas han recurrido a X (anteriormente Twitter) y a los blogs de la empresa para compartir los primeros resultados de sus pruebas.

Aquí hay un extracto de las primeras reacciones al posterior maniquí insignia de OpenAI.

"La IA como analista serio"

El elogio más robusto para GPT-5.2 se centra en su capacidad para manejar "problemas difíciles" que requieren más tiempo para pensar.

Matt Shumer, director ejecutor de HyperWriteAI, no se anduvo con rodeos su reseñallamando a GPT-5.2 Pro "El mejor maniquí del mundo."

Shumer destacó la tenacidad del maniquí, señalando que "piensa durante **más de una hora** en problemas difíciles. Y logra tareas que ningún otro maniquí puede realizar."

Este sentimiento fue cliché por Allie K. Milleremprendedor de inteligencia sintético y ex ejecutor de AWS. Miller describió el maniquí como un paso en dirección a "La IA como analista serio" en oportunidad de un "compañero abierto."

"El pensamiento y la resolución de problemas se sienten notablemente más fuertes," Miller escribió en X. "Da explicaciones mucho más profundas de las que estoy acostumbrado a ver. En un momento, textualmente escribió código para mejorar su propio OCR en medio de una tarea."

Ganancias empresariales: Box informa claros saltos en el rendimiento

Para el sector empresarial, la aggiornamento parece ser aún más significativa.

Aaron Levie, director ejecutor de Box, revelado en X que su empresa ha estado probando GPT-5.2 en entrada temprano. Levie informó que el maniquí realiza "7 puntos mejor que GPT-5.1" en sus pruebas de razonamiento ampliado, que se aproximan al trabajo de conocimiento del mundo efectivo en servicios financieros y ciencias de la vida.

"El maniquí incluso realizó la mayoría de las tareas mucho más rápido que GPT-5.1 y GPT-5." Levie señaló y confirmó que Box AI implementará la integración GPT-5.2 en breve.

Rutuja Rajwade, directora senior de marketing de productos de Box, amplió esto en una publicación de blog de la empresacitando mejoras específicas de latencia.

"Cuna compleja" Las tareas se redujeron de 46 segundos en GPT-5 a solo 12 segundos con GPT-5.2.

Rajwade incluso notó un brinco en las capacidades de razonamiento para la erguido de Medios y Entretenimiento, pasando del 76% de precisión en GPT-5.1 al 81% en el nuevo maniquí.

A "brinco serio" para codificación y simulación

Los desarrolladores encuentran GPT-5.2 particularmente potente para "un solo disparo" Procreación de estructuras de código complejas.

Pietro Schirano, director genérico de magicpathai, compartió un vídeo del maniquí construyendo un motor de gráficos 3D completo en un solo archivo con controles interactivos. "Es un gran avance en razonamiento arduo, matemáticas, codificación y simulaciones." Schirano publicó. "El ritmo del progreso es irreal."

SDe modo similar, Ethan Mollick, profesor de la Wharton School of Business de la Universidad de Pensilvania y escritor y becario progresista de LLM e IA desde hace mucho tiempo, demostró la capacidad del maniquí para crear un sombreador visualmente arduo—una ciudad neogótica infinita en un océano tormentoso—a través de un solo mensaje.

La Era Agentic: Autonomía de prolongado plazo

Quizás el cambio más utilitario sea la capacidad del maniquí para permanecer concentrado durante horas sin perder el hilo.

Dan Shipper, director ejecutor del boletín informativo sobre pruebas de inteligencia sintético Everyinformó que el maniquí realizó con éxito un exploración de pérdidas y ganancias (P&L) que requirió que funcionara de forma autónoma durante dos horas. "Hizo un exploración de pérdidas y ganancias donde funcionó durante 2 horas y me dio excelentes resultados." El remitente escribió.

Sin confiscación, Shipper incluso señaló que para las tareas diarias, la aggiornamento parece "mayoritariamente incremental."

En un artículo para cadaKatie Parrott escribió que, si acertadamente GPT-5.2 sobresale en el seguimiento de instrucciones, es "menos ingenioso" que competidores como Claude Opus 4.5 en ciertos contextos, como deducir la ubicación de un becario a partir de datos de correo electrónico.

Las desventajas: velocidad y rigidez

A pesar de la capacidad de razonamiento, el "observar" del maniquí ha generado críticas.

Shumer destacó una importante "penalización de velocidad" cuando se utiliza el modo Pensamiento del maniquí. "En mi experiencia, el modo Pensamiento es muy tranquilo para la mayoría de las preguntas." Shumer escribió en su reseña profunda. "Casi nunca uso Instant."

Allie Miller incluso señaló problemas con el comportamiento predeterminado del maniquí. "La desventaja es el tono y el formato," ella notó. "La voz predeterminada se sintió un poco más rígida y el comportamiento de distancia/deducción es extremo: una pregunta simple convertida en 58 viñetas y puntos numerados."

El veredicto

La reacción original sugiere que GPT-5.2 es una utensilio optimizada para usuarios avanzados, desarrolladores y agentes empresariales en oportunidad de un chat informal. Como resumió Shumer en su reseña: "Para investigaciones profundas, razonamientos complejos y tareas que se benefician de una consejo cuidadosa, GPT-5.2 Pro es la mejor opción adecuado en este momento."

Sin confiscación, para los usuarios que buscan escritura creativa o respuestas rápidas y fluidas, modelos como Claude Opus 4.5 siguen siendo fuertes competidores. "Mi maniquí preferido sigue siendo el Claude Opus 4.5," Miller admitió, "pero mi arduo trabajo ChatGPT recibirá un buen impulso incremental."

Related Posts

9to5Mac Overtime 062: MacBook Neo permite que el iPad sea un iPad

Jeff es el presidente de producción de contenidos de vídeo de 9to5. Inicialmente se unió a 9to5Mac en 2016, produciendo videos, tutoriales, instructivos, tutoriales escritos y reseñas. Se enorgullece de…

Valve cambia la vencimiento de divulgación de Steam Machine a este ‘año’, segundo cambio a medida que se profundiza la crisis de escasez y memoria impulsada por la IA: los anuncios oficiales pasaron de “principios de 2026” a “la primera centro de 2026” y a “este año”

Valve anunció su Steam Machine de segunda coexistentes a finales de 2025, y los jugadores y entusiastas esperaban con ansias la presentación de la consola PC. Desafortunadamente, el mundo impasible…

You Missed

República Dominicana aplasta a Nicaragua con tres jonrones en el Clásico Mundial 2026

República Dominicana aplasta a Nicaragua con tres jonrones en el Clásico Mundial 2026

CDP condena agresiones contra periodistas cubrían caso en SDE | AlMomento.net

CDP condena agresiones contra periodistas cubrían caso en SDE | AlMomento.net

Gran final del convivio de mini baloncesto del Club San Vicente será este sábado

Gran final del convivio de mini baloncesto del Club San Vicente será este sábado

Ribera del Jaya y Hoyeros del Santa Ana salen airosos en el Torneo de Baloncesto Barrial 2026

Ribera del Jaya y Hoyeros del Santa Ana salen airosos en el Torneo de Baloncesto Barrial 2026

9to5Mac Overtime 062: MacBook Neo permite que el iPad sea un iPad

9to5Mac Overtime 062: MacBook Neo permite que el iPad sea un iPad

Anuncian que la energía eléctrica se cortará hasta en un 63% de la isla de Cuba este sábado

Anuncian que la energía eléctrica se cortará hasta en un 63% de la isla de Cuba este sábado