
Durante los últimos tres meses, el Gemini 3 Pro de Google se ha mantenido como uno de los modelos fronterizos más capaces disponibles. Pero en el vertiginoso mundo de la IA, tres meses es toda una vida, y los competidores no se han quedado quietos.
Hoy temprano, Google lanzó Géminis 3.1 Prouna puesta al día que trae una innovación secreto al maniquí de poder de heroína de batalla de la compañía: tres niveles de pensamiento ajustable que efectivamente lo convierten en una traducción liviana del sistema de razonamiento especializado Deep Think de Google.
El dispersión marca la primera vez que Google emite un "punto uno" puesta al día a un maniquí Gemini, lo que indica un cambio en la logística de dispersión de la compañía desde lanzamientos periódicos de la traducción completa a actualizaciones incrementales más frecuentes. Lo que es más importante para los equipos de IA empresarial que evalúan su conjunto de modelos, el nuevo sistema de pensamiento de tres niveles de 3.1 Pro (bajo, medio y stop) brinda a los desarrolladores y líderes de TI un maniquí único que puede subir su esfuerzo de razonamiento dinámicamente, desde respuestas rápidas para consultas rutinarias hasta sesiones de razonamiento profundo de varios minutos para problemas complejos.
El maniquí se está implementando ahora en traducción preliminar en la API de Gemini a través de Estudio de IA de GoogleGemini CLI, la plataforma de explicación agente de Google Antigravity, Vertex AI, Gemini Enterprise, Android Studio, la aplicación Gemini para consumidores y NotebookLM.
El meta ‘Deep Think Mini’: razonamiento ajustable según demanda
La característica más importante de Gemini 3.1 Pro no es un único número de relato: es la comienzo de un sistema de niveles de pensamiento de tres niveles que brinda a los usuarios un control detallado sobre cuánto esfuerzo computacional invierte el maniquí en cada respuesta.
Gemini 3 Pro ofrecía sólo dos modos de pensamiento: bajo y stop. El nuevo 3.1 Pro agrega una configuración media (similar a la incorporación inicial) y, de modo crítica, revisa lo que "stop" medio. Cuando se establece en stop, 3.1 Pro se comporta como un "traducción mini de Gemini Deep Think" – el maniquí de razonamiento especializado de la empresa que fue actualizado la semana pasada.
Las implicaciones para la implementación empresarial podrían ser significativas. En punto de enrutar solicitudes a diferentes modelos especializados en función de la complejidad de la tarea (un patrón global pero operativamente gravoso), las organizaciones ahora pueden usar un único punto final de maniquí y ajustar la profundidad del razonamiento según la tarea en cuestión. El epítome de documentos de rutina puede ejecutarse con un pensamiento bajo con tiempos de respuesta rápidos, mientras que las tareas analíticas complejas pueden despuntar a un pensamiento stop para un razonamiento de calibre Deep Think.
Rendimiento de relato: más del doble de razonamiento que 3 Pro
Los puntos de relato publicados por Google cuentan una historia de mejoras dramáticas, particularmente en áreas asociadas con el razonamiento y la capacidad de agencia.
En ARCO-AGI-2un punto de relato que evalúa la capacidad de un maniquí para resolver nuevos patrones de razonamiento universal, obtuvo una puntuación de 3.1 Pro 77,1% — más del doble del 31,1% rematado por Gemini 3 Pro y sustancialmente por delante de Sonnet 4.6 (58,3%) y Opus 4.6 (68,8%) de Anthropic. Este resultado todavía eclipsa al GPT-5.2 de OpenAI (52,9%).
Las ganancias se extienden a todos los ámbitos. En El final examen de la humanidadun punto de relato de razonamiento normativo riguroso, 3.1 Pro logró un 44,4% sin herramientas, frente al 37,5% de 3 Pro y por delante de Claude Sonnet 4.6 (33,2%) y Opus 4.6 (40,0%). En Diamante GPQAuna evaluación de conocimientos científicos, 3.1 Pro alcanzó el 94,3%, superando a todos los competidores enumerados.
Donde los resultados se vuelven particularmente relevantes para los equipos de IA empresarial es en los puntos de relato agentes: las evaluaciones que miden qué tan perfectamente se desempeñan los modelos cuando se les dan herramientas y tareas de varios pasos, el tipo de trabajo que define cada vez más las implementaciones de IA de producción.
En Terminal-Tira 2.0que evalúa la codificación de terminales agentes, 3.1 Pro obtuvo una puntuación del 68,5% en comparación con el 56,9% de su predecesor. En Atlas de MCPun punto de relato que mide flujos de trabajo de varios pasos utilizando el protocolo de contexto maniquí, 3.1 Pro alcanzó el 69,2%, una mejoría de 15 puntos sobre el 54,1% de 3 Pro y casi 10 puntos por delante de Claude y GPT-5.2. y en NavegarCompque prueba la capacidad de búsqueda web agente, 3.1 Pro logró un 85,9%, superando el 59,2% de 3 Pro.
Por qué Google eligió una traducción ‘0.1’ y qué indica
La valor sobre las versiones es en sí misma digna de mención. Los lanzamientos anteriores de Gemini siguieron un patrón de vistas previas fechadas: varias vistas previas 2.5, por ejemplo, antaño de alcanzar la disponibilidad universal. La referéndum de designar esta puesta al día como 3.1 en punto de otra tino previa de 3 Pro sugiere que Google considera que las mejoras son lo suficientemente sustanciales como para documentar un incremento de traducción, mientras que la "punto uno" El ajuste establece expectativas de que se comercio de una transformación, no de una revolución.
La publicación del blog de Google afirma que 3.1 Pro se pedestal directamente en las lecciones de la serie Gemini Deep Think, incorporando técnicas de versiones anteriores y más recientes. Los puntos de relato sugieren firmemente que el estudios por refuerzo ha desempeñado un papel central en las ganancias, particularmente en tareas como ARC-AGI-2, puntos de relato de codificación y evaluaciones agentes, exactamente los dominios donde los entornos de capacitación basados en RL pueden proporcionar señales de retribución claras.
El maniquí se asta en traducción preliminar en punto de como un dispersión de disponibilidad universal, y Google afirma que continuará realizando avances en áreas como los flujos de trabajo agentes antaño de suceder a GA completo.
Implicaciones competitivas para su pila de IA empresarial
Para los tomadores de decisiones de TI que evalúan proveedores de modelos de vanguardia, el dispersión de Gemini 3.1 Pro no sólo debe hacerles repensar qué modelos nominar sino todavía cómo adaptarse a un ritmo de cambio tan rápido para sus propios productos y servicios.
La pregunta ahora es si este dispersión provocará una respuesta de la competencia. El dispersión flamante de Gemini 3 Pro en noviembre pasado desató una ola de lanzamientos de modelos en ecosistemas tanto propietarios como abiertos.
Con 3.1 Pro recuperando el liderazgo de relato en varias categorías críticas, la presión recae sobre Anthropic, OpenAI y la comunidad de peso descubierto para que respondan, y en el panorama coetáneo de la IA, esa respuesta probablemente se mida en semanas, no en meses.
Disponibilidad
Gemini 3.1 Pro ya está arreglado en traducción preliminar a través de API de Géminis en Google AI Studio, Gemini CLI, Google Antigravity y Android Studio para desarrolladores. Los clientes empresariales pueden entrar a él a través de IA de vértice y Empresa Géminis. Los consumidores con los planes Google AI Pro y Exaltado pueden entrar a él a través de la aplicación Gemini y NotebookLM.






