Un nuevo maniquí de IA chino afirma aventajar a GPT-5 y Sonnet 4.5, y es de balde

redmoongettyimages-1313254535 — Artur Debat/Momento vía Getty Images

Siga ZDNET: Agréganos como fuente preferida en Google.

Conclusiones secreto de ZDNET

Moonshot lanzó el jueves su nuevo maniquí Kimi K2 Thinking.
Afirma aventajar a GPT-5 y Sonnet 4.5 en algunos puntos de narración.
La IA de código rajado plantea un desafío a los modelos patentados estadounidenses.

La carrera armamentista mundial de IA permanece en constante cambio, esta vez gracias a la aparición de un nuevo maniquí del prometedor laboratorio chino de IA Moonshot.

Encima: ¿Por qué el código rajado puede no sobrevivir al auge de la IA generativa?

El jueves, la empresa con sede en Beijing animado Kimi K2 Pensandoun maniquí de razonamiento que, según dice, supera al GPT-5 de OpenAI y al Claude Sonnet 4.5 de Anthropic en puntos de narración secreto, incluido Humanity’s Last Exam, BrowseComp (que prueba la capacidad de los agentes de IA para extraer información en orientación difícil de encontrar a través de navegadores web) y Seal-0 (que evalúa las capacidades de razonamiento). Kimi K2 Thinking además mostró capacidades de codificación comparables a GPT-5 y Sonnet 4.5, pero no notablemente más impresionantes.

captura de pantalla-2025-11-07-at-10-39-37-am.png

“Al razonar mientras se utiliza activamente un conjunto diverso de herramientas, K2 Thinking es capaz de planificar, razonar, ejecutar y adaptarse a través de cientos de pasos para atracar algunos de los problemas académicos y analíticos más desafiantes”, escribió Moonshot en su sitio web.

Lo que ofrece Kimi K2

Kimi K2 Thinking es un maniquí de mezcla de expertos (MoE) que combina planificación a grande plazo, razonamiento adaptativo y el uso de herramientas en orientación (como navegadores), “generando y refinando continuamente hipótesis, verificando evidencia, razonamiento y construyendo respuestas coherentes”, escribió la compañía. “Este razonamiento entrelazado le permite descomponer problemas ambiguos y abiertos en subtareas claras y procesables”. Fue entrenado con rodeando de 1 billón de parámetros y se puede conseguir a él en abrazando la cara.

Encima: La mejor IA gratuita para codificar en 2025: ahora solo 3 pasan el corte

Fundamentalmente, Kimi K2 Thinking, que se podio en la Algunos modelos K2 animado en julio, es de código rajado, lo que significa que los desarrolladores pueden conseguir y desarrollar el código subyacente y sus pesos de forma gratuita. Léelo de nuevo: un maniquí que (según Moonshot) tiene capacidades agentes más avanzadas que los modelos fronterizos de OpenAI y Anthropic es sin cargo. Moonshot además dijo que entrenar costó menos de 5 millones de dólares (4,6 millones de dólares para ser exactos, según CNBC — una cantidad extremadamente pequeña en comparación con los miles de millones que han utilizado los laboratorios de IA más destacados de EE. UU.

Si se verifica externamente, las implicaciones de esto podrían ser enormes, o reventar como lo hizo el pánico inducido por DeepSeek en enero de 2025.

Consideraciones para las empresas

En primer espacio, está el costado comercial de las cosas. Desde la aparición de ChatGPT hace poco menos de tres abriles, los propietarios de empresas han sido bombardeados con presión para incorporar nuevas herramientas de inteligencia fabricado, especialmente agentes, que los desarrolladores de tecnología han comercializado como impulsores de la productividad y asistentes virtuales. Eso a menudo significaba fertilizar por ofertas de nivel empresarial, como ChatGPT for Enterprise de OpenAI.

(Divulgación: Ziff Davis, la empresa matriz de ZDNET, presentó una demanda en abril de 2025 contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis al entrenar y actuar sus sistemas de IA).

Hasta ahora, el argumento de cesión normal en Silicon Valley ha sido que vale la pena fertilizar por herramientas patentadas de IA de un desarrollador líder, ya que, parafraseando lo que se ha convertido en un popular tropo de marketing, incluso si la IA no te deja sin negocio, es casi seguro que otra empresa que usa IA lo hará (sin importar el hecho de que la gran mayoría de las empresas que usan IA no han conocido ningún retorno de la inversión mensurable).

Encima: a medida que OpenAI llega a 1 millón de clientes empresariales, ¿podría finalmente estar cambiando la tendencia del retorno de la inversión en IA?

Al igual que el R1 de DeepSeek, la aparición del nuevo maniquí de Moonshot pone en duda toda la razonamiento de ese argumento de cesión. De repente, las empresas tienen a su disposición un maniquí de IA sin cargo que supuestamente es mejor para realizar tareas de agente críticas que los mejores modelos propietarios disponibles.

Por supuesto, es muy poco probable que legiones de empresas arrojen al bebé de la IA con el agua del baño y cancelen inmediatamente sus suscripciones empresariales a OpenAI o Anthropic solo porque la última firma china de moda afirma tener construido un maniquí más reformista. Pero ciertamente llamará la atención y hará que la multitud se pregunte nuevamente: tal vez el maniquí patentado de IA basado en suscripción que les han vendido no sea el único camino del futuro.

De hecho, ya está sucediendo: a algunas empresas estadounidenses les gusta Airbnb ahora preferir Las herramientas de inteligencia fabricado de las empresas chinas superan a las de sus homólogos estadounidenses, citando tanto su mejor rendimiento en algunas tareas críticas como su pequeño costo. Por supuesto, algunos expertos han expresado su preocupación de que los modelos de código rajado, especialmente los de origen extranjero, representen un peligro de seguridad adicional; Varias agencias estadounidenses y otros países prohibieron rápidamente DeepSeek.

Enfrentamiento de IA: Estados Unidos contra China

Si la aparición del R1 en enero fue el “momento Sputnik” de ese país, entonces el inicio del jueves del maniquí Kimi K2 de Moonshot es el alunizaje de la industria china de la inteligencia fabricado (colección de palabras).

Encima: los agentes de IA son tan buenos como los datos que reciben, y eso es un gran problema para las empresas.

Los formuladores de políticas y los expertos en tecnología estadounidenses comúnmente han enmarcado esa carrera como ideológica, con la “IA estadounidense” por un costado supuestamente encapsulando los ideales de la democracia espléndido occidental y la “IA china” por el otro, representando el control centralizado sobre el flujo y la censura de la información.

Si acertadamente es cierto que algunos modelos de IA construidos por laboratorios chinos exhiben sesgos y censuran información que parece alinearse con las políticas oficiales del Partido Comunista Chino, es importante tener en cuenta que todos los sistemas de IA, independientemente de dónde se encuentren sus empresas matrices, vienen con algún tipo de sesgo; La tecnología que utilice reflejará hasta cierto punto la visión del mundo de las personas que la construyeron y el sesgo incrustado en los datos utilizados para entrenarla.

En cualquier caso, las preocupaciones ideológicas pueden suceder a un segundo plano frente a las financieras si el rendimiento del nuevo maniquí Kimi se mantiene a la cumbre de las impresionantes métricas del sitio web de Moonshot. Ningún inversor puede suceder por parada ese mísero precio de 4,6 millones de dólares.

Encima: he estado probando los mejores navegadores con IA; estos son los que verdaderamente me impresionaron

Aquí en Estados Unidos, mientras a las empresas y a los consumidores individuales se les ha vendido la idea de que vale la pena fertilizar por un maniquí propietario de primer nivel, a los inversionistas se les ha vendido la historia de que para construir esas herramientas, las empresas necesitan comprar enormes sumas de pasta, hasta decenas de miles de millones de dólares, a pesar de que muchas de esas empresas aún no son rentables.

Hasta ahora ha estado funcionando. Los principales laboratorios de inteligencia fabricado de EE. UU., como OpenAI y Anthropic, ahora están valorados en cientos de miles de millones, y su compra en infraestructura y computación necesarios para construir modelos cada vez más avanzados ha aumentado día a día. Pero han ido creciendo los temores en torno a la perspectiva de una burbuja de IA: la posibilidad de que un gran segmento de nuestra capital completo haya quedado indisolublemente mezclado a un producto central que, al final, podría no ser capaz de originar ganancias y que podría derrumbar todo el castillo de juego, como lo hizo el uso generalizado de derivados titulizados en el mercado inmobiliario en 2008.

Encima: Gartner abandonó sus tendencias tecnológicas para 2026, y no todo es IA: aquí está la relación

Sólo el tiempo dirá si verdaderamente vivimos internamente de una burbuja de IA. Pero una cosa es segura: la repentina aparición de una utensilio gratuita que supera a los modelos líderes de OpenAI y Anthropic hará que a muchos inversores en tecnología se les llenen los luceros de lágrimas y se pregunten si deberían situar por un heroína diferente.

DeUltimoMinuto

Or check our Popular Categories...

DeUltimoMinuto

Or check our Popular Categories...

Un nuevo maniquí de IA chino afirma aventajar a GPT-5 y Sonnet 4.5, y es de balde

Conclusiones secreto de ZDNET

Lo que ofrece Kimi K2

Consideraciones para las empresas

Enfrentamiento de IA: Estados Unidos contra China

ztevenreal

Related Posts

La mejor serie de ciencia ficción de Netflix no es flamante de Netflix

La IA de Kagi Translate argumenta a la pregunta “¿Qué diría la cachonda Margaret Thatcher?”

You Missed

CONADIS realizará marcha de inclusión social en San Francisco de Macorís este 21 de marzo

La mejor serie de ciencia ficción de Netflix no es flamante de Netflix

ONU: Conflicto Oriente Medio impacta en los países «frágiles» | AlMomento.net

Karol G sigue sumando éxitos en la música y en la moda

Ingresos de las AFP aumentaron a RD$11,562 millones en 2025 y las utilidades a RD$5.9 millones, según documentación

Delcy Rodríguez destituye a Padrino López tras más de una lapso como ministro de Defensa en Venezuela