Anthropic presenta el maniquí Opus 4.5 más financiero, potente y efectivo

Anthropic presenta el maniquí Opus 4.5 más financiero, potente y efectivo

Antrópico hoy emprendedor Obra 4.5su maniquí fronterizo insignia, y trae mejoras en el rendimiento de la codificación, así como algunas mejoras en la experiencia del legatario que lo hacen más competitivo en caudillo con los últimos modelos fronterizos de OpenAI.

Quizás el cambio más destacado para la mayoría de los usuarios es que en las experiencias de aplicaciones para el consumidor (web, móviles y de escritorio), Claude será menos propenso a interrumpir abruptamente las conversaciones porque han durado demasiado. La restablecimiento de la memoria en el interior de una sola conversación se aplica no sólo a Opus 4.5, sino a cualquier maniquí contemporáneo de Claude en las aplicaciones.

Los usuarios que experimentaron finales abruptos (a pesar de que les quedaba espacio en su sesión y presupuestos de uso semanales) estaban alcanzando una ventana de contexto difícil (200.000 tokens). Mientras que algunas implementaciones de modelos de jerga grandes simplemente comienzan a recortar mensajes anteriores del contexto cuando una conversación pasa el mayor en la ventana, Claude simplemente finaliza la conversación en ocupación de permitir que el legatario experimente una conversación cada vez más incoherente donde el maniquí comenzaría a olvidar cosas según su caducidad.

Ahora, Claude pasará por un proceso detrás de número para resumir los puntos secreto de las partes anteriores de la conversación, intentando descartar lo que considera superfluo y manteniendo lo importante.

Los desarrolladores que llaman a la API de Anthropic pueden servirse los mismos principios mediante la gobierno y la compactación del contexto.

Rendimiento del Opus 4.5

Opus 4.5 es el primer maniquí que supera una puntuación de precisión del 80 por ciento, específicamente, el 80,9 por ciento en el punto de remisión SWE-Bench Verified, superando por poco al GPT-5.1-Codex-Max recientemente emprendedor de OpenAI (77,9 por ciento) y al Gemini 3 Pro de Google (76,2 por ciento). El maniquí funciona particularmente admisiblemente en los puntos de remisión de codificación agente y uso de herramientas agente, pero aún está por detrás de GPT-5.1 en razonamiento visual (MMMU).

Related Posts

La prevención contra el sarampión aumentó un 291% entre los adultos de Nuevo México durante el brote

En enero de 2025, estalló un brote de sarampión en el extremo occidental de Texas y pronto se extendió a Nuevo México y otros estados. El brote común se convertiría…

La comunidad estadounidense de OnePlus se ha convertido en una ciudad sombra, dicen los usuarios

Ryan Haines / Autoridad de Android TL;DR Los usuarios de OnePlus en los EE. UU. informan que la aplicación y la plataforma comunitaria no funcionan desde la semana pasada. Los…

You Missed

Fondos de inversión crecen 32 % en 2025 en Rep. Dominicana | AlMomento.net

Fondos de inversión crecen 32 % en 2025 en Rep. Dominicana | AlMomento.net

Policías rescatan a perrito que cayó al mar en el Malecón (video) – Remolacha

Policías rescatan a perrito que cayó al mar en el Malecón (video) – Remolacha

La prevención contra el sarampión aumentó un 291% entre los adultos de Nuevo México durante el brote

La prevención contra el sarampión aumentó un 291% entre los adultos de Nuevo México durante el brote

Aumento en la gasolina podría compendiar su consumo en la ciudadanía

Aumento en la gasolina podría compendiar su consumo en la ciudadanía

La comunidad estadounidense de OnePlus se ha convertido en una ciudad sombra, dicen los usuarios

La comunidad estadounidense de OnePlus se ha convertido en una ciudad sombra, dicen los usuarios

Inicia toque de queda en cuatro provincias en Ecuador

Inicia toque de queda en cuatro provincias en Ecuador