
Microsoft ha introducido BITNET B1.58 2B4T, el maniquí de IA de 1 bits a decano escalera hasta la época con 2 mil millones de parámetros y el capacidad de ejecutar eficientemente en las CPU. Es Abiertamente apto bajo una deshonestidad MIT. Informes de TechCrunch: Los investigadores de Microsoft dicen que BITNET B1.58 2B4T es la primera bitnet con 2 mil millones de parámetros, “parámetros” en gran medida correspondiente de “pesos”. Entrenado en un conjunto de datos de 4 billones de tokens, equivalente a aproximadamente 33 millones de libros, mediante una estimación, BITNET B1.58 2B4T supera a los modelos tradicionales de tamaños similares, afirman los investigadores.
BITNET B1.58 2B4T no barre el pavimento con modelos rivales de 2 mil millones de parámetros, para ser claros, pero aparentemente se mantiene suyo. Según las pruebas de los investigadores, el maniquí supera a Meta’s Fogosidad 3.2 1B, Gemma 3 1B de Google y el QWEN 2.5 1.5B de Alibaba en puntos de narración, incluidas GSM8K (una colección de problemas matemáticos a nivel de escuela primaria) y PIQA (que prueba las habilidades de razonamiento de los fortuna comunes físicos). Quizás de forma más impresionante, Bitnet B1.58 2B4T es más rápido que otros modelos de su tamaño, en algunos casos, el doble de la velocidad, mientras se usa una fracción de la memoria.
Sin confiscación, hay una trampa. Conseguir ese rendimiento requiere usar el ámbito personalizado de Microsoft, bitnet.cpp, que solo funciona con cierto hardware en este momento. Escaso de la letanía de chips compatibles están las GPU, que dominan el paisaje de infraestructura de IA.