Los investigadores de Microsoft desarrollan un maniquí de IA hipereficiente que puede ejecutarse en CPU

Microsoft ha introducido BITNET B1.58 2B4T, el maniquí de IA de 1 bits a decano escalera hasta la época con 2 mil millones de parámetros y el capacidad de ejecutar eficientemente en las CPU. Es Abiertamente apto bajo una deshonestidad MIT. Informes de TechCrunch: Los investigadores de Microsoft dicen que BITNET B1.58 2B4T es la primera bitnet con 2 mil millones de parámetros, “parámetros” en gran medida correspondiente de “pesos”. Entrenado en un conjunto de datos de 4 billones de tokens, equivalente a aproximadamente 33 millones de libros, mediante una estimación, BITNET B1.58 2B4T supera a los modelos tradicionales de tamaños similares, afirman los investigadores.

BITNET B1.58 2B4T no barre el pavimento con modelos rivales de 2 mil millones de parámetros, para ser claros, pero aparentemente se mantiene suyo. Según las pruebas de los investigadores, el maniquí supera a Meta’s Fogosidad 3.2 1B, Gemma 3 1B de Google y el QWEN 2.5 1.5B de Alibaba en puntos de narración, incluidas GSM8K (una colección de problemas matemáticos a nivel de escuela primaria) y PIQA (que prueba las habilidades de razonamiento de los fortuna comunes físicos). Quizás de forma más impresionante, Bitnet B1.58 2B4T es más rápido que otros modelos de su tamaño, en algunos casos, el doble de la velocidad, mientras se usa una fracción de la memoria.

Sin confiscación, hay una trampa. Conseguir ese rendimiento requiere usar el ámbito personalizado de Microsoft, bitnet.cpp, que solo funciona con cierto hardware en este momento. Escaso de la letanía de chips compatibles están las GPU, que dominan el paisaje de infraestructura de IA.

Related Posts

Spotlight de aplicaciones independientes: ‘Ping Pong Club’ trae tenis de mesa realista a Apple Vision Pro

Bienvenido a la aplicación de aplicaciones indie. Esta es una serie semanal 9TO5MAC donde mostramos las últimas aplicaciones en el mundo de las aplicaciones independientes. Si eres un desarrollador y…

La nueva técnica de refrigeración de chips es 7 veces más efectiva que los enfoques en serie

Un equipo de investigación de la Universidad de Tokio ha ideado una nueva decisión de refrigeración que utiliza las fases cambiantes del agua para que sea más eficaz para eliminar…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Dirigente sostiene PLD traza el camino de regreso al poder | AlMomento.net

Dirigente sostiene PLD traza el camino de regreso al poder | AlMomento.net

Spotlight de aplicaciones independientes: ‘Ping Pong Club’ trae tenis de mesa realista a Apple Vision Pro

Spotlight de aplicaciones independientes: ‘Ping Pong Club’ trae tenis de mesa realista a Apple Vision Pro

Punta Cana se defiende con realidades | AlMomento.net

Punta Cana se defiende con realidades | AlMomento.net

Experta afirma RD debe precisar posición para negociar con EE.UU. y mitigar el impacto de aranceles

Experta afirma RD debe precisar posición para negociar con EE.UU. y mitigar el impacto de aranceles

La nueva técnica de refrigeración de chips es 7 veces más efectiva que los enfoques en serie

La nueva técnica de refrigeración de chips es 7 veces más efectiva que los enfoques en serie

prohíben uso de playas y deportes acuáticos en estas provincias

prohíben uso de playas y deportes acuáticos en estas provincias