SurrealDB 3.0 quiere reemplazar su pila RAG de cinco bases de datos por una

SurrealDB 3.0 quiere reemplazar su pila RAG de cinco bases de datos por una

La creación de sistemas de gestación aumentada de recuperación (RAG) para agentes de IA a menudo implica el uso de múltiples capas y tecnologías para datos estructurados, vectores e información gráfica. En los últimos meses además ha quedado cada vez más claro que los sistemas de IA agentes necesitan memoria, a veces denominada memoria contextual, para funcionar de forma eficaz.

La complejidad y sincronización de tener diferentes capas de datos para habilitar el contexto pueden difundir problemas de rendimiento y precisión. Es un desafío que SurrealDB sondeo resolver.

SurrealDB lanzó el martes la interpretación 3.0 de su saco de datos homónima pegado con una extensión Serie A de 23 millones de dólares, lo que eleva la financiación total a 44 millones de dólares. La empresa había acogido un enfoque arquitectónico diferente al de las bases de datos relacionales como PostgreSQL, bases de datos vectoriales nativas como Pinecone o una saco de datos de gráficos como Neo4j. El equipo de ingeniería de OpenAI detalló recientemente cómo amplió Postgres a 800 millones de usuarios utilizando réplicas de leída, un enfoque que funciona para cargas de trabajo con mucha leída. SurrealDB adopta un enfoque diferente: almacena la memoria del agente, la dialéctica empresarial y los datos multimodales directamente en el interior de la saco de datos. En motivo de sincronizarse entre múltiples sistemas, la búsqueda vectorial, el itinerario de gráficos y las consultas relacionales se ejecutan de forma transaccional en un único motor nativo de Rust que mantiene la coherencia.

"La multitud ejecuta DuckDB, Postgres, Snowflake, Neo4j, Quadrant o Pinecone todos juntos y luego se preguntan por qué no pueden obtener una buena precisión en sus agentes." dijo a VentureBeat el director ejecutante y cofundador Tobie Morgan Hitchcock. "Es porque tienen que destinar cinco consultas diferentes a cinco bases de datos diferentes que solo tienen el conocimiento o el contexto con el que tratan."

La edificación ha resonado entre los desarrolladores, con 2,3 millones de descargas y 31.000 estrellas de GitHub hasta la data para la saco de datos. Según Hitchcock, las implementaciones existentes abarcan dispositivos de vanguardia en automóviles y sistemas de defensa, motores de recomendación de productos para los principales minoristas de Nueva York y tecnologías de publicación de anuncios de Android.

Memoria de IA agente integrada en la saco de datos

SurrealDB almacena la memoria del agente como relaciones gráficas y metadatos semánticos directamente en la saco de datos, no en el código de la aplicación ni en capas de almacenamiento en gusto externas.

El sistema de complementos Surrealism en SurrealDB 3.0 permite a los desarrolladores detallar cómo los agentes construyen y consultan esta memoria; la dialéctica se ejecuta en el interior de la saco de datos con garantías transaccionales en motivo de en middleware.

Esto es lo que eso significa en la praxis: cuando un agente interactúa con datos, crea gráficos de contexto que vinculan entidades, decisiones y conocimiento del dominio como registros de bases de datos. Estas relaciones se pueden consultar a través de la misma interfaz SurrealQL utilizada para la búsqueda de vectores y datos estructurados. Un agente que pregunta sobre un problema de un cliente puede atravesar conexiones gráficas con incidentes pasados ​​relacionados, extraer incrustaciones de vectores de casos similares y unirse con datos estructurados del cliente, todo en una sola consulta transaccional.

"La multitud ya no quiere juntar sólo los datos más recientes," dijo Hitchcock. "Quieren juntar todos esos datos. Quieren analizar y hacer que la IA comprenda y analice todos los datos de una estructura durante los últimos dos primaveras, porque eso informa a su maniquí, a su agente de IA, sobre el contexto, la historia y, por lo tanto, puede ofrecer mejores resultados."

En qué se diferencia la edificación de SurrealDB de las pilas RAG tradicionales

Los sistemas RAG tradicionales consultan bases de datos según los tipos de datos. Los desarrolladores escriben consultas separadas para búsqueda de similitud de vectores, itinerario de gráficos y uniones relacionales, y luego combinan los resultados en el código de la aplicación. Esto crea retrasos en la sincronización a medida que las consultas van de ida y envés entre sistemas.

Por el contrario, Hitchcock explicó que SurrealDB almacena datos como documentos codificados en binario con relaciones gráficas incrustadas directamente pegado a ellos. Una sola consulta a través de SurrealQL puede recorrer relaciones de gráficos, realizar búsquedas de similitud de vectores y unir registros estructurados sin salir de la saco de datos.

Esa edificación además afecta cómo funciona la coherencia a escalera: cada nodo mantiene la coherencia transaccional, incluso a una escalera de más de 50 nodos, dijo Hitchcock. Cuando un agente escribe un nuevo contexto en el nodo A, una consulta en el nodo B ve inmediatamente esa modernización. Sin almacenamiento en gusto ni réplicas de leída.

"En muchos de nuestros casos de uso, en muchas de nuestras implementaciones, los datos se actualizan constantemente y las relaciones, el contexto, la comprensión semántica o las conexiones gráficas entre esos datos deben actualizarse constantemente." dijo. "Entonces no hay almacenamiento en gusto. No hay réplicas de leída. En SurrealDB, todo es transaccional."

Qué significa esto para la TI empresarial

"Es importante asegurar que SurrealDB no es la mejor saco de datos para cada tarea. Me encantaría asegurar que lo somos, pero no lo es. Y no puedes serlo" dijo Hitchcock. "Si solo necesita un prospección de petabytes de datos y nunca actualiza esos datos, entonces lo mejor será optar por el almacenamiento de objetos o una saco de datos en columnas. Si solo se manejo de búsqueda de vectores, entonces puede utilizar una saco de datos de vectores como Quadrant o Pinecone, y eso será suficiente."

El punto de inflexión llega cuando se necesitan varios tipos de datos juntos. El beneficio práctico se muestra en los cronogramas de incremento. Lo que solía sobrellevar meses construir con orquestación de bases de datos múltiples ahora puede lanzarse en días, dijo Hitchcock.

Related Posts

Alpine Eagle está ampliando la producción de contradrones

El sistema aerotransportado Sentinel de la startup de Munich ha sido probado en Ucrania y adjunto con las fuerzas estadounidenses y británicas, ahora está planeando una instalación de producción de…

Probé una carcasa PCIe M.2 para almacenamiento de datos y rápidamente mejoró mi flujo de trabajo

Caja PCIe HyperDrive Next USB4 M.2 Conclusiones secreto de ZDNET El gobierno HyperDrive Next USB4 M.2 PCIe es un adminículo de $ 200 que le permite usar SSD NVMe para…

You Missed

Reincorporación subvención de dominicanos a Feria Inmobiliaria Banreservas en el Suspensión Manhattan

Reincorporación subvención de dominicanos a Feria Inmobiliaria Banreservas en el Suspensión Manhattan

Alpine Eagle está ampliando la producción de contradrones

Alpine Eagle está ampliando la producción de contradrones

Probé una carcasa PCIe M.2 para almacenamiento de datos y rápidamente mejoró mi flujo de trabajo

Probé una carcasa PCIe M.2 para almacenamiento de datos y rápidamente mejoró mi flujo de trabajo

Se reconfigura atlas político de RD: PRM se consolida en tres elecciones y FP en dos

Se reconfigura atlas político de RD: PRM se consolida en tres elecciones y FP en dos

EU: Leslie Grace, de frustrada superheroína a sino | AlMomento.net

EU: Leslie Grace, de frustrada superheroína a sino | AlMomento.net

El brent se dispara más del 10 % y roza los 120 dólares por barril

El brent se dispara más del 10 % y roza los 120 dólares por barril