
A estas cielo, las empresas comprenden que la recuperación de gestación aumentada (RAG) permite que las aplicaciones y los agentes encuentren la mejor y más sólida información para realizar consultas. Sin bloqueo, las configuraciones típicas de RAG podrían ser un desafío de ingeniería y igualmente exhiben rasgos indeseables.
Para ayudar a resolver esto, Google lanzó la útil de búsqueda de archivos en la API de Gemini, un sistema RAG totalmente administrado “que resúmenes allá el tubo de recuperación”. File Search elimina gran parte de las herramientas y la compendio de aplicaciones involucradas en la configuración de canalizaciones RAG, por lo que los ingenieros no necesitan unir cosas como soluciones de almacenamiento y creadores integrados.
Esta útil compite directamente con los productos RAG empresariales de Despejado AI, AWS y microsoftque igualmente tienen como objetivo simplificar la bloque RAG. Google, sin bloqueo, afirma que su propuesta requiere menos orquestación y es más independiente.
“File Search proporciona una forma simple, integrada y escalable de conectar a Gemini con sus datos, brindando respuestas más precisas, relevantes y verificables”, dijo Google en una publicación de blog.
Las empresas pueden conseguir a algunas funciones de la búsqueda de archivos, como el almacenamiento y la gestación de incrustaciones, de forma gratuita en el momento de la consulta. Los usuarios comenzarán a respaldar por las incrustaciones cuando estos archivos se indexen a una tasa fija de 0,15 dólares por millón de tokens.
El maniquí Gemini Embedding de Google, que finalmente se convirtió en el maniquí de incrustación superior en el punto de relato de incrustación masiva de texto, potencia la búsqueda de archivos.
Búsqueda de archivos y experiencias integradas
Google dijo que File Search funciona “manejando las complejidades de RAG por usted”.
File Search gestiona el almacenamiento de archivos, las estrategias de fragmentación y las incrustaciones. Los desarrolladores pueden invocar la búsqueda de archivos interiormente de la API generateContent existente, lo que según Google hace que la útil sea más posible de adoptar.
File Search utiliza la búsqueda vectorial para “comprender el significado y el contexto de la consulta de un beneficiario”. Idealmente, encontrará la información relevante para contestar una consulta en los documentos, incluso si el mensaje contiene palabras inexactas.
La función tiene citas integradas que apuntan a las partes específicas de un documento que utilizó para producir respuestas y igualmente admite una variedad de formatos de archivo. Estos incluyen PDF, Docx, txt, JSON y “muchos tipos de archivos de lenguajes de programación comunes," Google dice.
Experimentación RAG continua
Es posible que las empresas ya hayan comenzado a construir un canal RAG mientras sientan las bases para que sus agentes de IA en realidad aprovechen los datos correctos y tomen decisiones informadas.
Correcto a que RAG representa una parte esencia de cómo las empresas mantienen la precisión y aprovechan los conocimientos sobre su negocio, las organizaciones deben tener rápidamente visibilidad de este proceso. RAG puede ser una molestia para la ingeniería porque orquestar varias herramientas juntas puede resultar complicado.
La creación de canales RAG “tradicionales” significa que las organizaciones deben ensamblar y ajustar un software de exploración e ingesta de archivos, incluida la fragmentación, la gestación de incrustaciones y las actualizaciones. Luego deben contratar una cojín de datos vectorial como Piñadetermine su dialéctica de recuperación y ajuste todo interiormente de la ventana de contexto de un maniquí. Por otra parte, si lo desean, pueden añadir citas de fuentes.
File Search tiene como objetivo simplificar todo eso, aunque las plataformas de la competencia ofrecen características similares. OpenAI API de asistentes permite a los desarrolladores utilizar una función de búsqueda de archivos, guiando a un agente a documentos relevantes para obtener respuestas. Bedrock de AWS presentado un servicio ventilado de automatización de datos en diciembre.
Si proporcionadamente File Search es similar a estas otras plataformas, la propuesta de Google abstrae todos, en sitio de solo algunos, nociones de la creación del proceso RAG.
Phaser Studio, el creador de la plataforma de gestación de juegos basada en IA Beam, dijo en el blog de Google que utilizó File Search para examinar su biblioteca de 3.000 archivos.
“La búsqueda de archivos nos permite encontrar instantáneamente el material correcto, ya sea un fragmento de código para patrones de viñetas, plantillas de mercancías o breviario arquitectónica de nuestro corpus ‘cerebro’ de Phaser”, afirmó el CTO de Phaser, Richard Davey. “El resultado son ideas que antiguamente tomaban días crear prototipos, ahora se pueden ejecutar en minutos”.
Desde el anuncio, varios usuarios expresaron interés en utilizar la función.







