Enseñanza por imitación visual: Guidde entrena a agentes de IA con ‘videos expertos’ humanos en circunscripción de documentación

Enseñanza por imitación visual: Guidde entrena a agentes de IA con ‘videos expertos’ humanos en circunscripción de documentación

Durante abriles, el "última milla" El proceso de transformación digital ha estado plagado de archivos PDF olvidados y manuales de formación ignorados.

Las organizaciones gastan millones en software sofisticado como SAP o Salesforce, sólo para que los empleados tengan dificultades con la navegación básica. Ahora, cuando llega la era de la IA agente, las empresas se enfrentan a un arsenal de doble filo: deben enseñar a los empleados humanos a colaborar con la IA y, al mismo tiempo, enseñar a los agentes de IA a navegar por las interfaces laberínticas de la empresa moderna.

Una idea que parece estar ganando impulso entre las empresas que utilizan la IA: utilizar grabaciones de pantalla y tutoriales/tutoriales de alguno que realiza una tarea empresarial (ya sea crear un nuevo ticket o procesar una hechura) y entrenar a la IA para replicar el flujo en función de la captura de pantalla. Esta misma semana, una startup indicación Standard Intelligence se volvió virulento en X mostrando una demostración original de una interpretación abierta de esto para el mundo físico y digital.

Pero la verdad es que ya hay actores que abordan este problema directamente para la propia empresa: un ejemplo concreto, Guiadouna startup israelí nacida durante los abriles centrados en los videos de la pandemia de COVID-19, anunció hoy una Serie B con exceso de suscripción de $ 50 millones Ronda de financiación liderada por PSG Equity para enfrentarse exactamente esta crisis de infraestructura del conocimiento.

En circunscripción de proporcionarle a un agente un manual en formato PDF inmóvil, Guidde proporciona información de inscripción fidelidad. "Vídeo sobre la verdad fundamental"—un rico flujo de datos capturados de expertos humanos reales mientras navegan por software confuso.

La inversión señala un cambio en la forma en que la industria tecnológica ve la documentación, no como un subproducto inmóvil del trabajo, sino como la telemetría crítica necesaria para capacitar a la próxima vivientes de agentes digitales autónomos.

Tecnología: de la captura de vídeo a los modelos del mundo

En esencia, Guidde es una plataforma de asimilación digital de IA (ADAP). Sin requisa, su avance tecnológico radica en lo que sucede detrás de ámbito durante una reproducción.

Guidde no se limita a memorizar píxeles; captura cada clic, desplazamiento e interacción subyacente con la página HTML—las pausas sutiles, las profundidades de desplazamiento específicas y las correcciones que hace un humano cuando un sistema se retrasa. Esta telemetría transforma el vídeo sin procesar en un conjunto de entrenamiento de Visión-Lengua-Argumento (VLA).

Mientras tanto, Magic Redaction de la plataforma oculta automáticamente datos confidenciales como contraseñas o números de tarjetas de crédito durante la captura, lo que garantiza que los materiales permanezcan seguros y alineados con HIPAA.

"Cada vez que haces clic en un gema, arrastras y sueltas, te desplazas, escribes, recopilamos la interacción… todo, lo limpiamos, no hay información privada," explicó el cofundador y director ejecutante de Guidde, Yoav Einav, en una entrevista monopolio con VentureBeat.

Debajo del capó, la plataforma captura los metadatos subyacentes y los cambios DOM (maniquí de objetos de documento) sincronizados con los cuadros de video. El diferenciador es la telemetría escondida debajo de la superficie.

Estos ricos metadatos crean una "maniquí del mundo digital" de software empresarial. Y como cada empresa utiliza su propia combinación única de aplicaciones y procesos, Guidde está creando un foso de datos que permite a los agentes empresariales razonar a través de UI heredadas con la misma conciencia espacial que un ser humano, asegurando que la automatización efectivamente funcione en un entorno de producción en circunscripción de solo una demostración de laboratorio.

Para un humano, es un tutorial. Para un agente de IA, es un atlas de inscripción fidelidad de la interfaz. Esto permite a los agentes "ver" y razonar a través de interfaces de afortunado complejas como lo hacen los humanos, resolviendo los "última milla" de automatización donde los agentes anteriormente fallaban conveniente a la errata de una empresa específica y un contexto de uso in situ.

En cierto sentido, Guidde está construyendo una "coche autónomo" como un Waymo para uso de computadora.

Producto: tres pilares de Guidd-ance

La plataforma ha evolucionado en dirección a tres productos distintos diseñados para esquilar con la seso de una ordenamiento:

  1. Lazarillo Crear: El motor para que los expertos en la materia conviertan los flujos de trabajo en documentación en minutos.

  2. Transmisión timonel: un motor de recomendaciones personalizado (a menudo comparado con Netflix) que ofrece respuestas internamente de las herramientas que la multitud efectivamente usa. Sabe quién es el afortunado y en qué área se encuentra para mostrar contenido relevante exactamente cuando sea necesario.

  3. Lazarillo Descubrir: El recién audaz "agente" pilar. Al igual que Waze mapea las carreteras observando a los conductores, Discover mapea las rutas del software siguiendo cómo trabajan los empleados. Entiende el flujo de trabajo, crea el contenido y lo actualiza automáticamente cuando cambia la interfaz de afortunado.

Entrenar a los humanos sobre cómo usar la IA, y la IA usando humanos

El aspecto menos obvio del crecimiento de Guidde es su doble propósito. "Somos la única plataforma que capacita tanto a humanos como a agentes," afirmó Einav.

A medida que las empresas implementan herramientas de inteligencia sintético como Microsoft 365 Copilot o agentes de ServiceNow, se encuentran con una brecha de competencia. Uno de los clientes más importantes de Guidde reveló que pagaba más de 1 millón de dólares al año por una sofisticada útil de inteligencia sintético, pero "nadie sabe usarlos porque sí les gustaba un entrenamiento de 30 minutos y ya está." Guidede cierra esta brecha proporcionando "del tamaño de un embocadura" Videotutoriales en el flujo de trabajo.

Al mismo tiempo, estos vídeos entrenan a los propios agentes de IA. Los modelos básicos como Gemini o GPT-4 a menudo alucinan cuando se les asignan flujos de trabajo empresariales específicos porque no estaban capacitados en aspectos internos mucho específicos. "flujos de trabajo básicos" que se encuentran en los sistemas de empresas privadas. Guidede proporciona la "punto de partida," el "metadatos," y el "Coordenadas x, y del gema." que un agente necesita para completar una acto sin quedarse atascado.

La preeminencia multimodal

Para apoyar este nivel de precisión, Guidde emplea una infraestructura multimodal. El sistema no se cimiento en un único maniquí; en cambio, utiliza un "flota" de modelos que se evalúan entre sí.

  • Google Géminis: Generalmente se utiliza para tareas visuales como analizar archivos PDF o PowerPoint.

  • Claude antrópico: Explotado para escribir la trama y los guiones narrativos.

  • Bucles de feedback: Cuando un afortunado edita un vídeo, esos datos se devuelven al maniquí para evitar que se produzcan los mismos errores en futuras capturas.

Este enfoque permite a Guidde reemplazar una pila heredada de seis o siete herramientas desconectadas (Loom para captura, Adobe Premiere para tirada, 11Labs para conversión de texto a voz y Synthesia para avatares) con una única plataforma nativa de IA. "Básicamente empacamos todo para usted," Einav dice: "y automatiza todo el proceso en almohadilla a los lineamientos de tu marca."

Historia del origen del primer vídeo

La creación de Guidde radica en una frustración accesible para cualquier líder de producto. Antaño de fundar la empresa, Einav y el cofundador Dan Sahar pasaron abriles dominando el tráfico de vídeo en Qwilt, una empresa que fundaron en 2010 para analizar cómo la multitud veía Netflix y Disney+.

Cuando llegó la COVID-19, vieron una gran oportunidad de aplicar esa experiencia en vídeo al circunscripción de trabajo. Observaron que los videos breves explicativos podían aumentar las conversiones de cuentas gratuitas a pagas en un 30%, pero la fricción al crearlos era insostenible.

En una entrevista, Einav recordó la "trabajo tedioso" del antiguo mundo: "Mi equipo en Israel estaba creando el contenido, alguno en los EE. UU. con acento estadounidense estaba haciendo la narración, alguno en el equipo de marketing escribiría el línea… y alguno en el equipo de autorización haría la tirada." Este flujo de trabajo fragmentado significaba que producir un solo vídeo tardaba entre dos y tres semanas. "Y luego, dos semanas luego, el producto cambia y hay que rehacerlo desde cero." añadió Einav.

Guidde fue construido para colapsar este ciclo en segundos. Al automatizar el "Captura mágica" de un flujo de trabajo, la plataforma genera instantáneamente un línea narrativo estructurado y una voz en off profesional de IA. Esto elimina el cuello de botella de la tirada, transformando a los expertos en la materia en "potencias de entrenamiento."

Licencias e impacto en el mercado

La estructura de precios de Guidde refleja su transición de una empresa de servicios públicos a una cámara central de la infraestructura empresarial:

  • Gratuitamente: $0 (Hasta 25 videos, soporte para aplicaciones web).

  • Pro: $18/creador/mes (vídeos ilimitados, kits de marca).

  • Negocio: $39/creador/mes (texto a voz ilimitado, examen).

  • Empresa: Precios personalizados (traducción a varios idiomas, SSO, Magic Redaction).

El impacto de la plataforma ya es visible en las cifras: un Reducción del 41 % en el tiempo de creación de vídeos y 34% menos tickets de soporte entrantes.

Para clientes como Emerson, esto se traduce en una creación de guías entre un 40% y un 60% más rápida. Los equipos de soporte, en particular, están descubriendo que pueden descargar el 80% de su prominencia de tickets con agentes, pero solo si esos agentes tienen el contenido que sea útil.

"El agente sin el contenido es inútil," Einav advierte, señalando que la mayoría de la documentación empresarial tiene abriles de pasado o está completamente indocumentada.

Admisión temprana de la comunidad y la industria

Guidde ya cuenta con 4.500 clientes empresariales y escudriñamiento ampliar este número con su nueva ronda de financiación. Los líderes de soporte y operaciones han expresado su opinión sobre la facilidad de uso de la plataforma. Christopher Cummings, VP de Client Experience de DocNetwork, destacó su capacidad para elogiar "Respuestas en video rápidas y personalizadas a las preguntas de los clientes."

Mientras tanto, Wren Cotrone, director de atención al cliente, señaló que "Una vez que configures la marca de la forma que desees, efectivamente podrás ampliar estas cosas."

Ronen Nir, director caudillo del PSG, resumió la parecer de inversión: "Guidde está resolviendo uno de los mayores obstáculos para la asimilación exitosa de la IA: la infraestructura del conocimiento."

Por qué esto importa ahora

El cambio de arquetipo de los LLM de solo texto a la inteligencia de video agente es la tendencia definitoria de 2026. La Serie B de Guidde señala que el "verdad fundamental" para los agentes empresariales provendrá de la observación de videos sin procesar, no de documentación estática.

Al capturar cómo se realiza el trabajo en decenas de millones de flujos de trabajo, Guidde está creando un conjunto de datos que pocos poseen.

Como lo expresó Einav: "Comienza con los humanos en el circuito y, con el tiempo, avanza en dirección a la autonomía total." Para la empresa moderna, el atlas ya no es un documento inmóvil: es una capa de inteligencia de video viva que timonel tanto a la fuerza gremial como a los agentes que los apoyan.

Related Posts

Android 17, ahora con aún más burbujas

Bienvenidos al episodio 91 de Pixelated, un podcast de 9to5Google. Esta semana, con Abner y Damien en el MWC, Will invita a Andrew Romero a unirse a él en un…

Apple todavía tiene más de una docena de productos en ampliación para 2026, esto es lo que viene

Apple acaba de concluir una semana muy emocionante de anuncios, comenzando con el iPhone 17e y terminando con macbook neo. Si correctamente obtuvimos 7 productos nuevos esta semana, todavía hay…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Android 17, ahora con aún más burbujas

Android 17, ahora con aún más burbujas

“Hemos obligado formalmente al Gobierno de Venezuela” – Remolacha

“Hemos obligado formalmente al Gobierno de Venezuela” – Remolacha

Apple todavía tiene más de una docena de productos en ampliación para 2026, esto es lo que viene

Apple todavía tiene más de una docena de productos en ampliación para 2026, esto es lo que viene

Corte adolescente en República Dominicana: 1,217 a enero 2026

Corte adolescente en República Dominicana: 1,217 a enero 2026

sistema automatizado de bolas y strikes en Grandes Ligas 2026

sistema automatizado de bolas y strikes en Grandes Ligas 2026

El día que Bengoa estremeció al país | AlMomento.net

El día que Bengoa estremeció al país | AlMomento.net