El nuevo maniquí Gemini Pro de Google tiene puntuaciones récord en las pruebas comparativas, otra vez

El jueves, Google libertino la interpretación más nueva de Gemini Pro, su potente LLM. El maniquí, 3.1, está actualmente apto como audiencia previa y pronto se lanzará en genérico, dijo la compañía.

El nuevo maniquí de Google puede ser uno de los LLM más poderosos hasta el momento. Los espectadores han notado que Gemini 3.1 Pro parece ser un gran paso delante con respecto a su predecesor, Gemini 3, que, tras su divulgación en noviembre, ya se consideraba una utensilio de inteligencia sintético de gran capacidad.

El jueves, Google igualmente compartió estadísticas de puntos de relato independientes, como uno llamado Humanity’s Last Exam, que mostraban un desempeño significativamente mejor que su interpretación precedente.

Gemini 3.1 Pro igualmente fue elogiado por Brendan Foody, director ejecutor de la startup de IA Mercor, cuyo sistema de evaluación comparativa, APEX, está diseñado para determinar qué tan admisiblemente los nuevos modelos de IA realizan tareas profesionales reales. “Gemini 3.1 Pro está ahora en la cima de la clasificación de APEX-Agents”, dijo Foody en una publicación en las redes socialesy agregó que los impresionantes resultados del maniquí muestran “con qué presteza los agentes están mejorando en el trabajo del conocimiento positivo”.

El divulgación se produce como Las guerras de modelos de IA se están calentandoy las empresas de tecnología continúan lanzando LLM cada vez más potentes diseñados para el trabajo de agencia y el razonamiento de varios pasos. Otros nombres importantes, incluidos OpenAI y Anthropic, igualmente han osado recientemente nuevos modelos.

Evento tecnológico

Boston, Massachusetts
|
9 de junio de 2026

Related Posts

La incómoda verdad sobre los vehículos híbridos

Esto es El paso a espaldasun boletín semanal que analiza una historia esencial del mundo de la tecnología. Para obtener más información sobre la lucha de los vehículos eléctricos, siga…

EFF, Ubuntu y otras distribuciones discuten cómo reponer a las leyes de comprobación de vida

Sistema76 no es el único que critica las nuevas leyes de comprobación de vida. el blog 9to5Linux publicó una inspección “informal” a otras discusiones en varias comunidades de Linux. A…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

¿Efectivamente funcionaron las reformas de Leonel Fernández para combatir la corrupción en República Dominicana?

¿Efectivamente funcionaron las reformas de Leonel Fernández para combatir la corrupción en República Dominicana?

La incómoda verdad sobre los vehículos híbridos

La incómoda verdad sobre los vehículos híbridos

EFF, Ubuntu y otras distribuciones discuten cómo reponer a las leyes de comprobación de vida

EFF, Ubuntu y otras distribuciones discuten cómo reponer a las leyes de comprobación de vida

donde la belleza mueve la patrimonio y las mujeres encuentran apoyo

donde la belleza mueve la patrimonio y las mujeres encuentran apoyo

Voy a salir a romper hoy en presencia de Israel

Voy a salir a romper hoy en presencia de Israel

Anthropic identifica los trabajos que la IA tiene más probabilidades de reemplazar

Anthropic identifica los trabajos que la IA tiene más probabilidades de reemplazar