La startup coreana de IA Motif revela cuatro grandes lecciones para la formación de LLM empresariales

Hemos escuchado (y escrito, aquí en VentureBeat) mucho sobre la carrera generativa de IA entre EE. UU. y China, ya que esos han sido los países con los grupos más…

GAM apunta a la “podredumbre del contexto”: una edificio de memoria de agente dual que supera a los LLM de contexto prolongado

A pesar de todo su poder sobrehumano, los modelos de IA actuales adolecen de un defecto sorprendentemente humano: olvidan. Dale a un asistente de IA una conversación extensa, una tarea…

Por qué la IA observable es la capa SRE que yerro que las empresas necesitan para sus LLM confiables

A medida que los sistemas de IA entran en producción, la confiabilidad y la gobernanza no pueden necesitar de ilusiones. Así es como la observabilidad convierte los grandes modelos de…

Más allá de las matemáticas y la codificación: el nuevo situación RL ayuda a capacitar a los agentes LLM para tareas complejas del mundo verdadero

Investigadores de la Universidad de Ciencia y Tecnología de China han desarrollado un nuevo situación de formación por refuerzo (RL) que ayuda a entrenar modelos de verbo grandes (LLM) para…

Meta prohíbe los chatbots LLM de terceros en WhatsApp

WhatsApp anunció próximos cambios en sus términos de servicio, que prohibirán a los usuarios utilizar chatbots que no sean Meta AI. Esto significa que ya no se permitirá ningún chatbot…

Un estudio de Apple muestra que los LLM pueden retener lo que estás haciendo a partir de datos de audio

Los investigadores de Apple han publicado un estudio que analiza cómo los LLM pueden analizar datos de audio y movimiento para obtener una mejor descripción común de las actividades del…

El nuevo producto AI Infra de ScaleOps reduce los costos de GPU para los LLM empresariales autohospedados en un 50% para los primeros usuarios

Operaciones de escalera ha ampliado su plataforma de administración de medios en la montón con un nuevo producto dirigido a empresas que operan modelos de lenguajes grandes (LLM) autohospedados y…

“Estamos en una burbuja de LLM”, dice el director ejecutor de Hugging Face, pero no en una de IA

En cambio, imagina que el resultado final será “una multiplicidad de modelos más personalizados, especializados y que resolverán diferentes problemas”. Por supuesto, es importante tener en cuenta que su empresa…

Los investigadores de IA ‘incorporaron’ un LLM en un autómata y comenzaron a canalizar a Robin Williams

Los investigadores de IA en Laboratorios Andón (las personas que le dieron a Anthropic Claude una máquina expendedora de oficina para que la manejara y se desató la hilaridad) publicaron…

Los investigadores de Nvidia desbloquean una formación LLM de 4 bits que coincide con el rendimiento de 8 bits

Investigadores de Nvidia han desarrollado un enfoque novedoso para entrenar modelos de jerigonza extenso (LLM) en formato cuantificado de 4 bits manteniendo su estabilidad y precisión al nivel de modelos…