¿Quieres ideas más inteligentes en tu bandeja de entrada? Regístrese en nuestros boletines semanales para obtener solo lo que importa a los líderes de IA, datos y seguridad empresariales. Suscríbete ahora
Actualizado el viernes 8 de agosto, 5:21 PM ET: Poco luego de la publicación de esta publicación, el cofundador y CEO de Operai, Sam Altman, anunció que la compañía restauraría el golpe a GPT-4O y otros modelos antiguos para usuarios seleccionados, admitiendo que el divulgación de GPT-5 era “más saciado de baches de lo que esperábamos”.
El divulgación del nuevo maniquí de OpenAi, GPT-5, es en un manifestación rocoso por aseverar lo menos.
Incluso Los errores de perdón en los gráficos y demostraciones de voz Durante el ayer Presentación en vivo del nuevo maniquí (en existencia cuatro modelos separados y un modo de “pensamiento” que se puede contratar para tres de ellos), un El número de informes de usuarios ha surgido desde que la lectura de GPT-5 lo muestra mal Al resolver problemas relativamente simples que preceden a los modelos OpenAI, y rivales de los laboratorios de IA competidores, responda correctamente.
Por ejemplo, irrefutable de datos Colin Fraser publicó capturas de pantalla demostración GPT-5 Configurar una prueba matemática incorrecta (si 8.888 repetir es igual a 9, por supuesto, no).
AI Scaling alcanza sus límites
Los límites de potencia, el aumento de los costos del token y los retrasos de inferencia están remodelando Enterprise AI. Únase a nuestro salón exclusivo para descubrir cómo son los mejores equipos:
- Convertir la energía en una preeminencia estratégica
- Construcción de inferencia valioso para ganancias reales de rendimiento
- Desbloquear ROI competitivo con sistemas de IA sostenibles
Asegure su ocasión para mantenerse a la vanguardia: https://bit.ly/4mwgngo
Asimismo falló en una aritmética de álgebra simple problema que los estudiantes de primaria probablemente podrían clavar, 5.9 = x + 5.11.
Usando GPT-5 para dictaminar las propias cuadros de presentación erróneos de OpenAi siquiera dio respuestas aperos o correctas.
Asimismo falló en Este problema de palabra matemática más complicada a continuación (que, para ser justos, perplejo a este humano al principio …Aunque el Ai de Elon Musk’s Grok 4 lo respondió correctamente. Para una pista, piense en el hecho de que las piedras de banderas en este caso no pueden dividirse en porciones más pequeñas. Deben permanecer en tacto como 80 unidades separadas, por lo que no hay mitades ni cuartos).
El maniquí 4O más antiguo realizado mejor para mi en al menos uno de estos problemas matemáticos. Desafortunadamente, Operai está despreciando lentamente esos modelos más antiguos, incluido el antiguo GPT-4O predeterminado y el poderoso maniquí de razonamiento O3 – Para los usuarios de ChatGPT, aunque continuarán estando disponibles en la interfaz de programación de aplicaciones (API) para los desarrolladores en el futuro previsible.
No tan bueno para codificar como indican puntos de relato
Aunque los puntos de relato internos de OpenAI y algunos de terceros externos han demostrado GPT-5 para pasar a todos los demás modelos en la codificación, Parece que en el uso del mundo verdadero, el recientemente actualizado de Anthrope, Claude Opus 4.1, parece hacer un mejor trabajo en “un tiro único” ciertas tareases aseverar, completar la aplicación o la compilación del software deseada del usufructuario según sus especificaciones. Ver Un ejemplo a continuación del desarrollador Justin Sun publicado en X :
Adicionalmente, AREport de la firma de seguridad SPLX Descubrió que la capa de seguridad interna de OpenAI dejaba las brechas importantes en áreas como la fila empresarial y la vulnerabilidad para impulsar la inyección y los ataques lógicos ofuscados.
Mientras que circunstancial, la demostración de la temperatura sobre cómo se está llevando al maniquí con los primeros usuarios de IA parece indicar una recibo fría.
El influencer de IA y el ex Googler Bilawal Sidhu publicó una investigación en x solicitar un “demostración de ambientes” de sus seguidores y la colchoneta de usuarios en normal, y hasta ahora, con 172 votos en el La respuesta abrumadora es “un poco media”.
Y como el Seudónimo de fugas de IA y cuenta de parte escribió, “El consenso abrumador sobre GPT-5 de X y el Reddit AMA es abrumadoramente película”.
Tibor Blaho, ingeniero principal de AIPRM y un popular cartel de filtraciones de IA y parte en X, resumió los muchos problemas con el Chatgpt-5 despliegue en una excelente publicacióndestacando que una de las nuevas características de marquesina -Un “enrutador” necesario en ChatGPT que elige un modo de pensar o no pensar para el maniquí GPT-5 subyacente dependiendo de la dificultad de la consulta-se ha convertido en una de las principales quejas, Cubo que el maniquí parecía predeterminado al modo no pensativo para muchos usuarios.
Competencia esperando en las alas
Así, el El sentimiento en torno a ChatGPT-5 está allí de ser internacionalmente positivo, destacando un problema importante para Openai A medida que se enfrenta a la creciente competencia de los principales rivales estadounidenses como Google y Anthrope, y una creciente serie de características de proposición de LLM de código franco, suelto y potentes que ofrecen que muchos modelos estadounidenses carecen.
Tomar el Alibaba Qwen Equipo de investigadores de IA, OMS Preciso hoy actualizó su maniquí Qwen 3 de parada rendimiento para tener 1 millón de tokens contexto – Dar a los usuarios la capacidad de cambiar casi 4 veces tanta información con el maniquí en una sola interacción de retroceso como que ofrece GPT-5.
Cubo el otro gran divulgación de Openai esta semana, el de los nuevos modelos de código franco de código franco, además recibió una recibo mixta de los primeros usuarios, las cosas no están buscando la compañía de IA dedicada número uno por parte de los usuarios en este momento (700 millones de usuarios activos semanales de ChatGPT a partir de este mes).
De hecho, esto además se ejemplifica por Usuarios del mercado de apuestas Polymarket Decidiendo abrumadoramente luego del divulgación de GPT-5 que Google probablemente tendría el mejor maniquí de IA para fines de este mes, agosto de 2025.
A otros usuarios avanzados les gusta Otheride AI Cofundador y CEO Matt Shumerque recibió golpe temprano a GPT-5 y blogueó al respecto favorablemente en una reseña aquí, Opinado que las vistas cambiarían a medida que más personas descubrieran las mejores formas de usar el nuevo maniquí y ajustaron sus enfoques de integración.:
Si correctamente todavía son los primeros días para GPT-5, y el sentimiento podría cambiar drásticamente a medida que más usuarios lo tengan en sus manos y lo prueben para diferentes tareas, las Las primeras indicaciones no se parecen a este es un divulgación de “jonrón” para OpenAi De la misma forma que los lanzamientos previos como GPT-4, o incluso los nuevos 4O y O3, fueron. Y ese es un indicador preocupante para una empresa que acaba de recibir otra ronda de fondossin incautación, sigue siendo no rentable conveniente a sus altos costos de investigación y ampliación.






