Mistral, respaldado por Microsoft, asta European AI Cloud para competir con AWS y Azure


Únase al evento confiable por los líderes empresariales durante casi dos décadas. VB Transform reúne a las personas que construyen una táctica de IA empresarial verdadero. Obtenga más información


Mistral que tienesla startup de inteligencia químico francesa anunció el miércoles una expansión radical en la infraestructura de IA que posiciona a la compañía como la respuesta de Europa a los gigantes de la computación en la cúmulo estadounidense, al tiempo que revela los nuevos modelos de razonamiento que rivalizan con los sistemas más avanzados de OpenAi.

La compañía con sede en París reveló Calculador mistraluna plataforma integral de infraestructura de IA construida en asociación con Nvidiadiseñado para elogiar a las empresas europeas y gobiernos una alternativa para necesitar de proveedores de nubes con sede en los Estados Unidos como Servicios web de Amazon, Microsoft Azurey Google Cloud. El movimiento representa un cambio importante significativo para Mistral desde modelos de IA puramente en expansión hasta controlar toda la pila de tecnología.

“Este movimiento a la infraestructura de IA marca un paso transformador para la IA Mistral, ya que nos permite enfrentarse una erecto crítica de la dependencia de valía de IA”, dijo Arthur Mensch, CEO y cofundador de Mistral AI. “Con este cambio viene la responsabilidad de asegurar que nuestras soluciones no solo impulsen la innovación y la asimilación de IA, sino que todavía defienden la autonomía tecnológica de Europa y contribuyan a su liderazgo de sostenibilidad”.

Cómo Mistral construyó modelos de razonamiento que piensan en cualquier idioma

Yuxtapuesto con el anuncio de infraestructura, Mistral presentó su serie importante de modelos de razonamiento: sistemas de IA capaces de pensar razonable paso a paso similar a OpenAi’s maniquí O1 y China Deepseek r1. Pero Guillaume Lample, el principal irrefutable de Mistral, dice que el enfoque de la compañía difiere de los competidores de guisa crucial.

“Hicimos todo desde cero, básicamente porque queríamos ilustrarse la experiencia que tenemos, como, flexibilidad en lo que hacemos”, me dijo Lampra en una entrevista monopolio. “En sinceridad logramos ser, como, muy, muy capaz en la tubería de enseñanza de refuerzo en serie más robusto”.

A diferencia de los competidores que a menudo ocultan sus procesos de razonamiento, los modelos de Mistral muestran su dependencia completa de pensamiento para los usuarios, y de guisa crucial en el idioma nativo del usufructuario en área de incumplir al inglés. “Aquí tenemos como la dependencia de pensamiento completa que se le da al usufructuario, pero en su propio idioma, para que efectivamente puedan leerlo, ver si tiene sentido”, explicó Lampra.

La compañía publicó dos versiones: Perfecto pequeñoun maniquí de código rajado de 24 billones de parámetros, y Medio importanteun sistema patentado más poderoso arreglado a través de la API de Mistral.

¿Por qué los modelos de IA de Mistral ganaron superpoderes inesperadas durante el entrenamiento?

Los modelos demostraron capacidades sorprendentes que surgieron durante el entrenamiento. En particular, el medio importante retuvo las habilidades de razonamiento multimodal, la capacidad de analizar imágenes, a pesar de que el proceso de capacitación se centró sólo en los problemas matemáticos y de codificación basados ​​en texto.

“Poco que nos dimos cuenta, no exactamente por error, pero poco que absolutamente no esperábamos, es que si al final de la capacitación de enseñanza de refuerzo, conectas el codificador de visión original, entonces de repente, de repente de la ausencia, ves que el maniquí puede razonar sobre las imágenes”, dijo Lample.

Los modelos todavía obtuvieron habilidades sofisticadas de llamadas de funciones, realizando automáticamente búsquedas de Internet y ejecución de código de múltiples pasos para contestar consultas complejas. “Lo que verá es un maniquí que hace esto, pensando, luego date cuenta, está correctamente, esta información podría actualizarse. Permítanme hacer una búsqueda web”, explicó Lampra. “Se buscará en Internet, y luego pasará los resultados, y resultará sobre él, y dirá, tal vez, tal vez la respuesta no esté en estos resultados. Permítanme apañarse nuevamente”.

Este comportamiento surgió lógicamente sin entrenamiento específico. “Es poco que ya sea o no en cosas que hacer a continuación, pero descubrimos que en sinceridad está sucediendo de forma natural. Así que fue una sorpresa muy agradable para nosotros”, señaló Lampra.

El avance de la ingeniería que hace que la capacitación de Mistral sea más rápido que los competidores

El equipo técnico de Mistral superó los importantes desafíos de ingeniería para crear lo que Lampher describe como un avance en la infraestructura de capacitación. La compañía desarrolló un sistema para el “enseñanza de refuerzo en serie” que permite que los modelos de IA mejoren continuamente al gestar respuestas, en área de necesitar de datos de capacitación preexistentes.

La innovación secreto implicó la sincronización de actualizaciones del maniquí en cientos de unidades de procesamiento de gráficos (GPU) en tiempo verdadero. “Lo que hicimos es que encontramos una guisa de desenroscar el maniquí a través de GPU. Quiero asegurar, desde GPU hasta GPU”, explicó Lampra. Esto permite que el sistema actualice los pesos del maniquí en diferentes grupos de GPU en segundos en área de las horas requeridas.

“No hay una infraestructura de código rajado que lo hará correctamente”, señaló Lampher. “Por lo caudillo, hay muchos intentos de código rajado para hacer esto, pero es extremadamente moroso. Aquí, nos centramos mucho en la eficiencia”.

El proceso de capacitación resultó mucho más rápido y más moderado que el pretraben tradicional. “Era mucho más moderado que el entrenamiento previo regular. El entrenamiento previo es poco que tomaría semanas o meses en otras GPU. Aquí, no estamos cerca de esto. Era como, dependía de cuántas personas ponemos en esto. Pero fue más como, fue como, suficiente menos de una semana”, dijo Lampher.

Nvidia compromete a 18,000 fichas a la independencia europea de IA

El Calculador mistral La plataforma se ejecutará en 18,000 de los más nuevos de NVIDIA Chips de perdón blackwellalojado inicialmente en un centro de datos en Essonne, Francia, con planes de expansión en toda Europa. El CEO de NVIDIA, Jensen Huang, describió la asociación como crucial para la independencia tecnológica europea.

“Todos los países deberían construir IA para su propia nación, en su nación”, dijo Huang en un anuncio conjunto en París. “Con la IA Mistral, estamos desarrollando modelos y fábricas de IA que sirven como plataformas soberanas para las empresas de toda Europa para progresar la inteligencia en todas las industrias”.

Huang proyectó que la capacidad informática de IA de Europa aumentaría diez veces en los próximos dos primaveras, con más de 20 “fábricas de IA” planificadas en todo el continente. Varias de estas instalaciones tendrán más que un gigavatio de capacidad, potencialmente clasificando entre los centros de datos más grandes del mundo.

La asociación se extiende más allá de la infraestructura para incluir el trabajo de Nvidia con otras compañías europeas de IA y la perplejidad, la compañía de búsqueda, para desarrollar modelos de razonamiento en varios idiomas europeos donde los datos de capacitación a menudo son limitados.

Cómo Mistral planea resolver los problemas ambientales y de soberanía de la IA

Calculador mistral Aborda dos preocupaciones principales sobre el expansión de la IA: impacto ambiental y soberanía de datos. La plataforma asegura que los clientes europeos puedan prolongar su información adentro de las fronteras de la UE y bajo la competencia europea.

La compañía se ha asociado con la Agencia Doméstico de Transición Ecológica de Francia y Carbone 4, una consultora climática líder, para evaluar y minimizar la huella de carbono de sus modelos de IA a lo grande de su ciclo de vida. Mistral planea avituallar sus centros de datos con fuentes de energía descarbonizadas.

“Al designar Europa para la ubicación de nuestros sitios, nos damos la capacidad de beneficiarnos de fuentes de energía en gran medida descarbonizadas”, declaró la compañía en su anuncio.

Speed ​​Advantage le da a los modelos de razonamiento de Mistral a la orilla maña

Las pruebas tempranas sugieren que los modelos de razonamiento de Mistral ofrecen un rendimiento competitivo al tiempo que abordan una crítica popular de los sistemas existentes: la velocidad. Los modelos de razonamiento actuales de Openai y otros pueden tardar minutos en contestar a consultas complejas, limitando su utilidad maña.

“Una de las cosas que a las personas generalmente no les gusta de este maniquí de razonamiento es que, aunque es inteligente, a veces está tomando mucho tiempo”, señaló Lampra. “Aquí efectivamente ves el resultado en solo unos segundos, a veces menos de cinco segundos, a veces incluso menos que esto. Y cambia la experiencia”.

La superioridad de velocidad podría resultar crucial para la asimilación de negocios, donde los minutos de aplazamiento para las respuestas de IA crean cuellos de botella de flujo de trabajo.

Lo que la envite de infraestructura de Mistral significa para la competencia integral de IA

El movimiento de Mistral a la infraestructura lo pone en competencia directa con los gigantes tecnológicos que han dominado el mercado de computación en la cúmulo. Servicios web de Amazon, Microsoft Azurey Google Cloud Actualmente controlan la mayoría de la infraestructura de la cúmulo a nivel mundial, mientras que los jugadores más nuevos como Coreweave han rebaño circunscripción específicamente en cargas de trabajo de IA.

El enfoque de la compañía difiere de los competidores al ofrecer una posibilidad completa e integrada verticalmente, desde infraestructura de hardware hasta modelos de IA y servicios de software. Esto incluye Mistral tienes estudio para desarrolladores, El sagaz para productividad empresarial, y Código Mistral para socorro de programación.

Los analistas de la industria ven la táctica de Mistral como parte de una tendencia más amplia alrededor de el expansión regional de IA. “Europa necesita con necesidad ampliar su infraestructura de IA si quiere mantenerse competitivo a nivel mundial”, observó Huang, haciendo eco de las preocupaciones expresadas por los responsables políticos europeos.

El anuncio se produce cuando los gobiernos europeos se preocupan cada vez más por su dependencia de las empresas de tecnología estadounidenses por la infraestructura crítica de IA. La Unión Europea ha comprometido 20 mil millones de euros a construir “gigafactorías” de IA en todo el continente, y La asociación de Mistral con NVIDIA podría ayudar a acelerar esos planes.

El anuncio dual de Mistral de las capacidades de infraestructura y maniquí señala la codicia de la compañía de convertirse en una plataforma de inteligencia químico integral en área de solo otro proveedor de modelos. Con el respaldo de Microsoft y otros inversores, la compañía ha recaudado más de $ 1 mil millones y continúa buscando fondos adicionales para respaldar su resonancia ampliado.

Pero Lample ve posibilidades aún mayores por delante para los modelos de razonamiento. “Creo que cuando miro el progreso internamente, y creo que en algunos puntos de narración, el maniquí estaba obteniendo una precisión más del 5% cada semana para, tal vez como, seis semanas en total”, dijo. “Por lo tanto, está mejorando muy rápido, hay muchos, muchos, quiero asegurar, toneladas de ideas, ya sabes, pequeñas ideas en las que se te ocurre que mejoren el rendimiento”.

El éxito de este desafío europeo al dominio de la IA estadounidense puede necesitar en última instancia de si los clientes valoran la soberanía y la sostenibilidad lo suficiente como para cambiar de proveedores establecidos. Por ahora, al menos, tienen una opción.


Related Posts

AMD Epyc Venecia cuenta con 256 núcleos y pancho de pandilla en cantidad: las CPU del servidor de próxima engendramiento llegan en 2026

AMD reveló el jueves algunos de los primeros detalles técnicos sobre su procesador de EPYC ‘Venecia’ con sede en Zen 6 de próxima engendramiento en su evento AI AI. La…

Volantes de turistas bajo amenaza de una nueva y tortuosa amenaza cibernética: así es como mantenerse a omitido

Los expertos advierten sobre los sitios falsos de Booking.com que circulan la web Los sitios vienen con una falsa “Aceptar cookie” que descarga una rata Los compradores deben estar en…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Siniestro Air India: recuperan los cadáveres de 265 personas | AlMomento.net

Siniestro Air India: recuperan los cadáveres de 265 personas | AlMomento.net

AMD Epyc Venecia cuenta con 256 núcleos y pancho de pandilla en cantidad: las CPU del servidor de próxima engendramiento llegan en 2026

AMD Epyc Venecia cuenta con 256 núcleos y pancho de pandilla en cantidad: las CPU del servidor de próxima engendramiento llegan en 2026

Corregidor Dío Astacio inicia obras del Presupuesto Participativo Municipal en Villa Duarte y entrega cheques a ingeniero

Corregidor Dío Astacio inicia obras del Presupuesto Participativo Municipal en Villa Duarte y entrega cheques a ingeniero

Corregidor Dío Astacio inicia obras del Presupuesto Participativo Municipal en Villa Duarte

Corregidor Dío Astacio inicia obras del Presupuesto Participativo Municipal en Villa Duarte

UNAPEC celebra 60 primaveras con conferencia de Henry Molina sobre jurisprudencia moderna y títulos democráticos

UNAPEC celebra 60 primaveras con conferencia de Henry Molina sobre jurisprudencia moderna y títulos democráticos

Tratamiento del VIH cuesta al Estado US$14.4 millones

Tratamiento del VIH cuesta al Estado US.4 millones