
El fabricante chino de automóviles y productos electrónicos Xiaomi sorprendió hoy a la comunidad mundial de IA con el tiro de MiMo-V2-Proun nuevo maniquí elemental de 1 billón de parámetros con puntos de narración que se acercan a los de los gigantes de la IA de EE. UU. OpenAI y Anthropic, pero a en torno a de una séptima o sexta parte del costo cuando se accede a través de una API patentada y, lo que es más importante, envía menos de 256.000 tokens de información de un costado a otro.
Dirigido por Fuli Luo, un curtido del disruptivo plan DeepSeek R1, el tiro representa lo que Luo caracteriza como un "emboscada silenciosa" en la frontera entero. Adicionalmente, Luo declaró en un X publicación que la compañía planea aclarar una reforma de maniquí de esta última interpretación, " cuando los modelos son lo suficientemente estables como para merecerlo."
Al centrarse en el "espacio de influencia" de inteligencia: tener lugar de la reproducción de códigos al funcionamiento autónomo de las tecnologías digitales. "garras"—Xiaomi está intentando saltarse por completo el dechado conversacional.
Antaño de esta incursión en la frontera de la IA, Xiaomi, con sede en Beijing, se estableció como un gigante de "El internet de las cosas" y hardware de consumo.
Conjuntamente obligado como el tercer maduro fabricante de teléfonos inteligentes del mundo, Xiaomi pasó los primeros abriles de la división de 2020 ejecutando una entrada de suspensión peligro en el sector automotriz. Sus vehículos eléctricos (EV), como el SU7 y el SUV YU7 resuelto recientemente, han convertido a la empresa en una potencia integrada verticalmente capaz de fusionar hardware, software y, ahora, razonamiento renovador.
Este pedigrí en ingeniería del mundo físico informa la obra de MiMo-V2-Pro; está construido para ser el "cerebro" de sistemas complejos, ya sea que esos sistemas administren cadenas de suministro globales o naveguen por los intrincados andamios de un agente de codificación autónomo.
Tecnología: la obra de la agencia
El desafío central de la "Era del agente" es proseguir un razonamiento de reincorporación fidelidad sobre extensiones masivas de datos sin incurrir en un costo prohibitivo. "impuesto de inteligencia" en latencia o costo. MiMo-V2-Pro aborda esto a través de una obra dispersa: si aceptablemente alberga 1T de parámetros totales, solo 42B están activos durante cualquier paso en torno a delante, lo que lo hace aproximadamente tres veces el tamaño de su predecesor, MiMo-V2-Flash.
La eficiencia del maniquí se cimiento en un mecanismo evolucionado de Atención Híbrida. Los transformadores unificado normalmente enfrentan un aumento cuadrático en los requisitos de computación a medida que crece el contexto; MiMo-V2-Pro utiliza una relación híbrida de 7:1 (aumentada de 5:1 en la interpretación Flash) para ejecutar su enorme ventana de contexto de 1 millón de tokens. Esta referéndum arquitectónica permite que el maniquí mantenga una profunda "memoria" de tareas de larga duración sin la degradación del rendimiento que suele observarse en los modelos de vanguardia.
La vinculación: piense en el maniquí no como un estudiante que lee un ejemplar página por página, sino como un investigador habituado en una enorme biblioteca. La relación 7:1 permite que el maniquí "desnatar" 85% de los datos para el contexto mientras se aplica atención de reincorporación densidad al 15% más relevante para la tarea en cuestión.
Esto se combina con una capa ligera de predicción de múltiples tokens (MTP), que permite al maniquí anticipar y ocasionar múltiples tokens simultáneamente, lo que reduce drásticamente la latencia requerida para el "pensamiento" fases de los flujos de trabajo agentes. Según Luo, estas decisiones estructurales se tomaron con meses de prelación, específicamente para proporcionar una "superioridad estructural" por la inesperada velocidad a la que la industria giró en torno a los agentes.
Producto y evaluación comparativa: una demostración de la ingenuidad por parte de terceros
Los datos internos de Xiaomi pintan una imagen de un maniquí que sobresale en "mundo vivo" tareas sobre puntos de narración sintéticos. En GDPval-AA, un punto de narración que mide el rendimiento en tareas laborales agentes del mundo vivo, MiMo-V2-Pro logró un Elo de 1426, colocándolo por delante de sus principales pares chinos como GLM-5 (1406) y Kimi K2.5 (1283).
Si aceptablemente todavía está a la trasera de Oeste "esfuerzo mayor" Modelos como Claude Sonnet 4.6 (1633) en Elo crudo, representa el rendimiento más suspensión registrado para un maniquí de origen chino en esta categoría.
La ordenamiento de evaluación comparativa de terceros El estudio químico verificó estas afirmaciones.colocando a MiMo-V2-Pro en el puesto 10 en su índice de inteligencia entero con una puntuación de 49. Esto lo coloca en el mismo nivel que GPT-5.2 Codex y por delante de Grok 4.20 Beta. Estos resultados sugieren que Xiaomi ha construido con éxito un maniquí capaz de realizar el razonamiento de suspensión nivel necesario para las tareas de ingeniería y producción.
Las métricas secreto de Sintético Analysis destacan un brinco significativo con respecto a la interpretación aludido de peso libre, MiMo-V2-Flash (que obtuvo una puntuación de 41):
-
Tasa de alucinaciones: El maniquí Pro redujo las tasas de alucinaciones al 30%, una gran mejoría con respecto al 48% del maniquí Flash.
-
Índice de omnisciencia: Obtuvo un +5, colocándolo por delante de GLM-5 (+2) y Kimi K2.5 (-8).
-
Eficiencia del token: Para ejecutar todo el índice de inteligencia, MiMo-V2-Pro requirió solo 77 millones de tokens de salida, significativamente menos que GLM-5 (109 millones) o Kimi K2.5 (89 millones), lo que indica un proceso de razonamiento más conciso y válido.
Los propios gráficos de Xiaomi enfatizan aún más su "Agente Normal" y "Agente codificador" capacidades. En ClawEval, un punto de narración para andamios agentes, el maniquí obtuvo una puntuación de 61,5, acercándose al rendimiento de Claude Opus 4.6 (66,3) y superando significativamente a GPT-5.2 (50,0). En entornos específicos de codificación como Terminal-Bench 2.0, logró un 86,7, lo que sugiere una reincorporación confiabilidad al ejecutar comandos en un entorno de terminal en vivo.
Cómo las empresas deberían evaluar el uso de MiMo-V2-Pro
Para las personas descritas en las organizaciones de IA contemporáneas, desde infraestructura hasta seguridad, MiMo-V2-Pro representa un cambio de dechado en el "Precio-Calidad" curva.
Los responsables de la toma de decisiones en materia de infraestructura considerarán que MiMo-V2-Pro es un candidato convincente para la frontera de Pareto entre inteligencia y costo. Sintético Analysis informó que ejecutar su índice costó solo $348 para MiMo-V2-Pro, en comparación con $2304 para GPT-5.2 y $2486 para Claude Opus 4.6.
Para las organizaciones que administran clústeres o adquisiciones de GPU, la capacidad de obtener a las 10 principales inteligencias globales a aproximadamente una séptima parte del costo de las empresas tradicionales occidentales es un poderoso incentivo para las pruebas a escalera de producción.
Los tomadores de decisiones de datos pueden disfrutar la ventana de contexto de 1M para arquitecturas listas para RAG, lo que les permite alentar bases de código empresariales o conjuntos de documentación completos en un solo mensaje sin la fragmentación requerida por modelos de contexto más pequeños.
Quien toma decisiones sobre sistemas/orquestación debe evaluar MiMo-V2-Pro como principal "cerebro" para la coordinación de múltiples agentes. Adecuado a que el maniquí está optimizado para OpenClaw y Claude Code, puede manejar la planificación a dadivoso plazo y el uso preciso de herramientas sin la constante intervención humana que afecta a los modelos anteriores.
Su reincorporación clasificación en GDPval-AA sugiere que es particularmente adecuado para el flujo de trabajo y la capa de orquestación necesarios para subir la IA en toda la empresa. Permite la creación de sistemas que pueden ir más allá de la simple automatización en torno a la resolución de problemas complejos de varios pasos.
Sin bloqueo, quienes toman decisiones en materia de seguridad deben efectuar con cautela. el muy "agente" La naturaleza que hace que el maniquí sea poderoso (su capacidad para usar terminales y manipular archivos) aumenta el radio de superficie para la inyección rápida y el camino no competente al maniquí.
Si aceptablemente su depreciación tasa de alucinaciones (30%) es una superioridad defensiva, la errata de mancuerna públicas (a diferencia de la interpretación Flash) significa que los equipos de seguridad internos no pueden realizar estudio profundos. "nivel de maniquí" A veces se requieren auditorías para implementaciones en extremo sensibles. Cualquier implementación empresarial debe ir acompañada de protocolos sólidos de seguimiento y auditabilidad.
Precios, disponibilidad y el camino a seguir
Xiaomi ha fijado el precio de MiMo-V2-Pro para dominar el mercado de desarrolladores. El precio está escalonado según el uso del contexto, con tarifas competitivas para el almacenamiento en gusto para respaldar tareas de razonamiento de reincorporación frecuencia.
-
MiMo-V2-Pro (hasta 256K): 1 dólar por 1 millón de tokens de entrada y 3 dólares por 1 millón de tokens de salida
-
MiMo-V2-Pro (256K-1M): $2 por 1 millón de tokens de entrada y $6 por 1 millón de tokens de salida
-
Lección de gusto: $0,20 por 1 millón de tokens para el nivel inferior y $0,40 para el nivel superior
-
Escritura en gusto: Temporalmente de balde ($0)
Así es como se compara con otros modelos fronterizos líderes en todo el mundo:
|
Maniquí |
Aporte |
Producción |
Costo Total |
Fuente |
|
Grok 4.1 Rápido |
$0.20 |
$0.50 |
$0.70 |
|
|
Minimax M2.7 |
$0.30 |
$1.20 |
$1.50 |
|
|
Géminis 3 Destello |
$0.50 |
$3.00 |
$3.50 |
|
|
Kimi-K2.5 |
$0.60 |
$3.00 |
$3.60 |
|
|
MiMo-V2-Pro (≤256K) |
$1.00 |
$3.00 |
$4.00 |
|
|
GLM-5-Turbo |
$0.96 |
$3.20 |
$4.16 |
|
|
GLM-5 |
$1.00 |
$3.20 |
$4.20 |
|
|
Claude Haiku 4.5 |
$1.00 |
$5.00 |
$6.00 |
|
|
Qwen3-Max |
$1.20 |
$6.00 |
$7.20 |
|
|
Géminis 3 Pro |
$2.00 |
$12.00 |
$14.00 |
|
|
GPT-5.2 |
$1.75 |
$14.00 |
$15.75 |
|
|
GPT-5.4 |
$2.50 |
$15.00 |
$17.50 |
|
|
Soneto de Claudio 4.5 |
$3.00 |
$15.00 |
$18.00 |
|
|
Cerrar Trabajo 4.6 |
$5.00 |
$25.00 |
$30.00 |
|
|
GPT-5.4 Pro |
$30.00 |
$180.00 |
$210.00 |
Este posicionamiento agresivo está diseñado para fomentar los flujos de aplicaciones de reincorporación intensidad que definen la próxima reproducción de software. Actualmente, el maniquí está arreglado nada más a través de la API propia de Xiaomi, sin soporte presente para imágenes o entrada multimodal, una omisión sobresaliente en una era de "omni" modelos, aunque Xiaomi ha mostrado un MiMo-V2-Omni separado para esas deyección.
El "Cazador Alfa" El período en OpenRouter demostró que el mercado tiene un gran apetito por esta combinación específica de eficiencia y razonamiento. La filosofía de Fuli Luo: que la velocidad de la investigación está impulsada por una "aprecio propio por el mundo para el que estás construyendo"— ha hexaedro como resultado un maniquí que ocupa el segundo circunscripción en China y el octavo a nivel mundial según los índices de inteligencia establecidos.
Si sigue siendo un "tranquilo" colocar o convertirse en la colchoneta para una realineación entero del poder de la IA depende de qué tan rápido los desarrolladores adopten el "espacio de influencia" sobre el "ventana de chat". Por ahora, Xiaomi ha movido la meta: la cuestión ya no es sólo "¿Puede dialogar?" pero "¿Puede efectuar?"






