Para esquilar la IA agente, Notion derribó su pila tecnológica y comenzó de nuevo

Para esquilar la IA agente, Notion derribó su pila tecnológica y comenzó de nuevo

Muchas organizaciones dudarían en revisar su pila tecnológica y emprender desde cero. No Conocimiento. Para la traducción 3.0 de su software de productividad (lanzazo en septiembre), la empresa no dudó en reedificar desde cero; Reconocieron que, de hecho, era necesario respaldar la IA agente a escalera empresarial. Mientras que los flujos de trabajo tradicionales impulsados ​​por IA implican instrucciones explícitas paso a paso basadas en un estudios de pocas tomas, los agentes de IA impulsados ​​por modelos de razonamiento avanzados reflexionan sobre la definición de herramientas, pueden identificar y comprender qué herramientas tienen a su disposición y planificar los próximos pasos. “En superficie de intentar adaptarnos a lo que estábamos construyendo, queríamos exprimir las fortalezas de los modelos de razonamiento”, dijo a VentureBeat Sarah Sachs, jefa de modelado de IA de Notion. “Hemos reconstruido una nueva edificio porque los flujos de trabajo son diferentes a los de los agentes”.

Reorquestación para que los modelos puedan funcionar de forma autónoma

Notion ha sido recogido por el 94% de las empresas Forbes AI 50, tiene 100 millones de usuarios en total y cuenta entre sus clientes con OpenAI, Cursor, Figma, Ramp y Vercel. En un panorama de IA en rápida crecimiento, la empresa identificó la escazes de ir más allá de flujos de trabajo más simples basados ​​en tareas con destino a sistemas de razonamiento orientados a objetivos que permitan a los agentes aspirar, organizar y ejecutar herramientas de forma autónoma en entornos conectados.

Muy rápidamente, los modelos de razonamiento se han vuelto “mucho mejores” a la hora de cultivarse a utilizar herramientas y seguir instrucciones de dependencia de pensamiento (CoT), señaló Sachs. Esto les permite ser “mucho más independientes” y tomar múltiples decisiones internamente de un flujo de trabajo agente. “Reconstruimos nuestro sistema de inteligencia fabricado para exprimir eso," ella dijo. Desde una perspectiva de ingeniería, esto significó reemplazar los rígidos flujos basados ​​en indicaciones con un maniquí de orquestación unificado, explicó Sachs. Este maniquí central está respaldado por subagentes modulares que buscan en Notion y la web, consultan y agregan bases de datos y editan contenido. Cada agente utiliza herramientas contextualmente; por ejemplo, pueden animarse si averiguar en Notion o en otra plataforma como Slack. El maniquí realizará búsquedas sucesivas hasta encontrar la información relevante. Luego puede, por ejemplo, convertir notas en propuestas, crear mensajes de seguimiento, realizar un seguimiento de las tareas y detectar y realizar actualizaciones en las bases de conocimiento. En Notion 2.0, el equipo se centró en que la IA realizara tareas específicas, lo que les exigía “pensar exhaustivamente” sobre cómo impulsar el maniquí, señaló Sachs. Sin confiscación, con la traducción 3.0, los usuarios pueden asignar tareas a los agentes, y los agentes pueden verdaderamente tomar medidas y realizar múltiples tareas al mismo tiempo. “Lo reorquestamos para que fuera autoseleccionable en las herramientas, en superficie de unos pocos disparos, lo que indica explícitamente cómo atravesar todos estos escenarios diferentes”, explicó Sachs. El objetivo es certificar que todo interactúe con la IA y que “cualquier cosa que usted pueda hacer, su agente de Notion pueda hacerlo”.

Bifurcarse para aislar las alucinaciones.

La filosofía de Notion de “mejor, más rápido y más de poco valor” impulsa un ciclo de iteración continua que equilibra la latencia y la precisión mediante incorporaciones de vectores ajustadas y optimización de búsqueda elástica. El equipo de Sachs emplea un entorno de evaluación riguroso que combina pruebas deterministas, optimización vernácula, datos anotados por humanos y LLM como sentenciador, con puntuación basada en modelos que identifica discrepancias e inexactitudes. “Al bifurcar la evaluación, podemos identificar de dónde vienen los problemas y eso nos ayuda a aislar alucinaciones innecesarias”, explicó Sachs. Adicionalmente, simplificar la edificio misma significa que es más hacedero realizar cambios a medida que evolucionan los modelos y las técnicas. “Optimizamos la latencia y el pensamiento paralelo tanto como sea posible”, lo que conduce a una “precisión mucho veterano”, señaló Sachs. Los modelos se basan en datos de la web y del espacio de trabajo conectado de Notion. En última instancia, informó Sachs, la inversión en la reconstrucción de su edificio ya ha proporcionado a Notion retornos en términos de capacidad y una tasa de cambio más rápida. Y añadió: “Estamos totalmente abiertos a reconstruirlo de nuevo, cuando se produzca el próximo avance, si es necesario”.

Comprender la latencia contextual

Al crear y ajustar modelos, es importante comprender que la latencia es subjetiva: la IA debe proporcionar la información más relevante, no necesariamente la veterano, a costa de la velocidad. “Te sorprenderías de las diferentes formas en que los clientes están dispuestos a esperar las cosas y no esperarlas”, dijo Sachs. Es un tentativa interesante: ¿qué tan flemático se puede ir antaño de que la concurrencia abandone el maniquí? Con la búsqueda puramente de navegación, por ejemplo, es posible que los usuarios no sean tan pacientes; Quieren respuestas casi inmediatas. “Si preguntas: ‘¿Cuánto son dos más dos’, no querrás esperar a que tu agente esté buscando en todas partes en Slack y JIRA”, señaló Sachs. Pero cuanto más tiempo se le dé, más completo puede ser un agente de razonamiento. Por ejemplo, Notion puede realizar 20 minutos de trabajo autónomo en cientos de sitios web, archivos y otros materiales. En estos casos, los usuarios están más dispuestos a esperar, explicó Sachs; permiten que el maniquí se ejecute en segundo plano mientras ellos se ocupan de otras tareas. “Es una cuestión de producto”, dijo Sachs. “¿Cómo establecemos las expectativas del beneficiario respecto de la interfaz de beneficiario? ¿Cómo determinamos las expectativas del beneficiario sobre la latencia?”

Notion es su veterano beneficiario

Notion comprende la importancia de utilizar su propio producto; de hecho, sus empleados se encuentran entre sus mayores usuarios avanzados. Sachs explicó que los equipos tienen zonas de pruebas activas que generan datos de capacitación y evaluación, así como un ciclo de feedback de los usuarios “verdaderamente activo”. Los usuarios no tienen reparos en opinar lo que creen que debería mejorarse o las características que les gustaría ver. Sachs enfatizó que cuando un beneficiario rechaza una interacción, le está dando explícitamente permiso a un anotador humano para analizar esa interacción de una forma que lo anonimice tanto como sea posible. “Utilizamos nuestra propia útil como empresa todo el día, todos los días, por lo que obtenemos ciclos de feedback muy rápidos”, afirmó Sachs. “Verdaderamente estamos probando nuestro propio producto”. Dicho esto, lo que están construyendo es su propio producto, señaló Sachs, por lo que entienden que pueden tener anteojos protectoras en lo que respecta a calidad y funcionalidad. Para equilibrar esto, Notion ha confiado "muy experimentado en IA" socios de diseño a quienes se les otorga paso temprano a nuevas capacidades y brindan comentarios importantes. Sachs enfatizó que esto es tan importante como la creación de prototipos internos. “Nuestro objetivo es cotejar al medio expedito, creo que se obtiene una feedback mucho más rica”, dijo Sachs. “Porque al final del día, si solo miramos cómo Notion usa Notion, verdaderamente no estamos brindando la mejor experiencia a nuestros clientes”. Igual de importante es que las pruebas internas continuas permiten a los equipos evaluar las progresiones y cerciorarse de que los modelos no retrocedan (cuando la precisión y el rendimiento se degradan con el tiempo). "Todo lo que estás haciendo se mantiene fiel," explicó Sachs. "Sabes que tu latencia está internamente de los límites."

Muchas empresas cometen el error de centrarse demasiado en Evans retroactivos; esto les dificulta entender cómo o dónde están mejorando, señaló Sachs. Notion considera las evaluaciones como una "prueba de fuego" de ampliación y progresión prospectiva y evaluaciones de observabilidad y prueba de regresión. “Creo que un gran error que cometen muchas empresas es combinar los dos”, dijo Sachs. “Los utilizamos para uno y otro propósitos; pensamos en ellos de forma muy diferente”.

Conclusiones del delirio de Notion

Para las empresas, Notion puede servir como maniquí sobre cómo poner en funcionamiento de forma responsable y dinámica la IA agente en un espacio de trabajo empresarial conectado y calificado. Conclusiones de Sach para otros líderes tecnológicos:

  • No tenga miedo de reedificar cuando cambien las capacidades fundamentales; Notion rediseñó completamente su edificio para alinearse con modelos basados ​​en el razonamiento.

  • Trate la latencia como poco contextual: optimice por caso de uso, en superficie de hacerlo mundialmente.

  • Conecte todos los resultados a datos empresariales seleccionados y confiables para certificar la precisión y la confianza. Ella aconsejó: “Esté dispuesto a tomar decisiones difíciles. Esté dispuesto a situarse en la cima de la frontera, por así decirlo, en lo que está desarrollando para crear el mejor producto posible para sus clientes”.

Related Posts

Los proveedores de servicios en la nubarrón piden al regulador de la UE que restablezca el software de socios de VMware

“En enero de 2026, Broadcom señaló la terminación de su software VMware Cloud Service Provider en Europa”, dijo CIPSE en un comunicado. Esta audacia personal eliminó a casi una pequeña…

La fuga de OnePlus Watch 4 promete un cronómetro inteligente diseñado para durar

Joe Maring / Autoridad de Android TL;DR El OnePlus Watch 4 podría cambiar la clasificación IP68 normalizado de su predecesor por una certificación IP69. A pesar de la rumoreada prosperidad…

You Missed

Los proveedores de servicios en la nubarrón piden al regulador de la UE que restablezca el software de socios de VMware

Los proveedores de servicios en la nubarrón piden al regulador de la UE que restablezca el software de socios de VMware

Arresto domiciliario del coronel Pacheco por corrupción administrativa

Arresto domiciliario del coronel Pacheco por corrupción administrativa

PLD ve escandaloso anuencia de monitoreo por RD$433 millones | AlMomento.net

PLD ve escandaloso anuencia de monitoreo por RD3 millones | AlMomento.net

Los Ángeles cambia el Día de César Chávez, y crea Día de los Trabajadores Agrícolas

Los Ángeles cambia el Día de César Chávez, y crea Día de los Trabajadores Agrícolas

EE. UU. descarta invasión a Cuba, pero se declara dinámico en presencia de crisis y migración

EE. UU. descarta invasión a Cuba, pero se declara dinámico en presencia de crisis y migración

La fuga de OnePlus Watch 4 promete un cronómetro inteligente diseñado para durar

La fuga de OnePlus Watch 4 promete un cronómetro inteligente diseñado para durar