La IA conversacional no entiende a los usuarios; la construcción ‘Intent First’ sí

La IA conversacional no entiende a los usuarios; la construcción ‘Intent First’ sí

El cliente novedoso sólo tiene una escazes importante: conseguir la cosa ellos quieren cuando lo quieran. El antiguo maniquí RAG unificado meter+recuperar+LLM malinterpreta la intención, sobrecarga el contexto y pierde la frescura, enviando repetidamente a los clientes por caminos equivocados.

En cambio, la construcción de intención primero utiliza un maniquí de idioma tenue para analizar la consulta en investigación de intención y contexto, ayer de entregarla a las fuentes de contenido más relevantes (documentos, API, personas).

La IA empresarial es un tren a toda velocidad que se dirige con destino a un escarpadura. Las organizaciones están implementando aplicaciones de búsqueda basadas en LLM a un ritmo récord, mientras que un problema arquitectónico fundamental está preparándose para el fracaso.

Un estudio nuevo de Coveo reveló que El 72% de las consultas de búsqueda empresarial fallan para ofrecer resultados significativos en el primer intento, mientras que Gartner incluso predice que la mayoría de las implementaciones de IA conversacional no han cumplido con las expectativas empresariales.

El problema no son los modelos subyacentes. Es la construcción que los rodea.

Posteriormente de diseñar y ejecutar plataformas de interacción con clientes en vivo impulsadas por IA a escalera, atendiendo a millones de clientes y ciudadanos en algunas de las organizaciones de telecomunicaciones y atención médica más grandes del mundo, he llegado a ver un patrón. Es la diferencia entre implementaciones exitosas de interacción impulsadas por IA y fracasos multimillonarios.

Es nativo de la abundancia construcción patrón que yo llamo Intención primero. Y está remodelando la forma en que las empresas crean experiencias impulsadas por la IA.

El problema de los 36 millones de dólares

Gartner proyecta que el mercado mundial de IA conversacional se disparará 36 mil millones de dólares para 2032. Las empresas están luchando por conseguir una tajada. Las demostraciones son irresistibles. Conecte su LLM a su pulvínulo de conocimientos y, de repente, podrá replicar las preguntas de los clientes en idioma natural. Hechicería.

Entonces ocurre la producción.

Un importante proveedor de telecomunicaciones con el que trabajo implementó un sistema RAG con la expectativa de aminorar la tasa de llamadas de soporte. En cambio, la tasa aumentó. Las personas que llamaron probaron la búsqueda impulsada por IA, recibieron respuestas incorrectas con un detención punto de confianza y llamaron al servicio de atención al cliente con más enojo que ayer.

Este patrón se repite una y otra vez. En el sector de la atención médica, los asistentes de inteligencia industrial de cara al cliente brindan a los pacientes información del formulario que está desactualizada por semanas o meses. Los chatbots de servicios financieros están generando respuestas a partir de contenidos de productos tanto minoristas como institucionales. Los minoristas están viendo aparecer productos descontinuados en las búsquedas de productos.

El problema no es un equivocación de la tecnología de IA. Es un fracaso de la construcción.

Por qué fallan las arquitecturas RAG unificado

El patrón RAG unificado (meter la consulta, recuperar contenido semánticamente similar y producirse a un LLM) funciona a la perfección en demostraciones y pruebas de conceptos. Pero se desmorona en los casos de uso de producción por tres razones sistemáticas:

1. La brecha de intención

La intención no es contexto. Pero las arquitecturas RAG unificado no tienen en cuenta esto.

Digamos que un cliente escribe “Quiero suprimir” ¿Qué significa eso? ¿Liquidar un servicio? ¿Liquidar un pedido? ¿Liquidar una cita? Durante nuestra implementación de telecomunicaciones, descubrimos que el 65% de las consultas de “anulación” se referían en ingenuidad a pedidos o citas, no a cancelaciones de servicios. El sistema RAG no tenía forma de comprender esta intención, por lo que devolvía constantemente documentos de anulación de servicio.

La intención importa. En el sector de la atención sanitaria, si un paciente escribe “Necesito suprimir” porque está intentando suprimir una cita, un resurtido de récipe o un procedimiento, dirigirlo al contenido de los medicamentos desde la programación no sólo es frustrante, sino que incluso es peligroso.

2. Inundación de contexto

El conocimiento y la experiencia empresarial son vastos y abarcan docenas de fuentes, como catálogos de productos, facturación, artículos de soporte, políticas, promociones y datos de cuentas. Los modelos RAG unificado lo tratan todo de la misma guisa, buscando todo para cada consulta.

Cuando un cliente pregunta “¿Cómo activo mi nuevo teléfono?”, no le importan las preguntas frecuentes sobre facturación, la ubicación de las tiendas o las actualizaciones del estado de la red. Pero un maniquí RAG unificado recupera contenido semánticamente similar de cada fuente, arrojando resultados de búsqueda que están a medio paso de la marca.

3. Punto ciego de frescura

El espacio vectorial es ciego al tiempo. Semánticamente, la promoción del postrero trimestre es idéntica a la de este trimestre. Pero presentar a los clientes ofertas obsoletas destruye la confianza. Vinculamos un porcentaje significativo de quejas de clientes con resultados de búsqueda que mostraban productos, ofertas o funciones caducados.

El patrón de construcción Intent-First

El patrón de construcción Intent-First es la imagen reflejada de la implementación RAG unificado. En el maniquí RAG, se recupera y luego se enruta. En el maniquí Intent-First, usted clasifica ayer de enrutar o recuperar.

Las arquitecturas Intent-First utilizan un maniquí de idioma tenue para analizar una consulta en investigación de intención y contexto, ayer de enviarla a las fuentes de contenido más relevantes (documentos, API, agentes).

Comparación: RAG de intención primero contra RAG unificado

Implementación nativa de la abundancia

El patrón Intent-First está diseñado para la implementación nativa de la abundancia, aprovechando microservicios, contenedorización y escalamiento elástico para manejar patrones de tráfico empresarial.

Servicio de clasificación de intenciones

El clasificador determina la intención del legatario ayer de que se produzca cualquier recuperación:

ALGORITMO: Clasificación de intenciones

ENTRADA: consulta_usuario (sujeción)

SALIDA: intent_result (objeto)

1. Consulta PREPROCESO (arreglar, expandir contracciones)

2. CLASIFICAR utilizando el maniquí de transformador:

– intención_principal ← maniquí.predecir (consulta)

– confianza ← model.confidence_score()

3. SI confianza < 0,70 ENTONCES

– DEVOLVER {

requiere_clarificación: real,

pregunta_sugerida: generar_pregunta_clarificante(consulta)

}

4. EXTRAER sub_intención según la intención_primaria:

– SI primario = "CUENTA" → verifique ORDER_STATUS, PERFIL, etc.

– SI primario = "APOYO" → verifique DEVICE_ISSUE, NETWORK, etc.

– SI primario = "FACTURACIÓN" → compulsar PAGO, DISPUTA, etc.

5. DETERMINAR target_sources según el mapeo de intenciones:

– ORDER_STATUS → (orders_db, order_faq)

– DEVICE_ISSUE → (posibilidad de problemas_kb, guías_dispositivo)

– MEDICAMENTOS → (formulario, documentos_clínicos) (atención médica)

6. VOLVER {

intención_primaria,

sub_intención,

confianza,

fuentes_objetivo,

requiere_personalización: real/infiel

}

Servicio de recuperación contextual

Una vez que se clasifica la intención, la recuperación se vuelve dirigida:

ALGORITMO: Recuperación consciente del contexto

ENTRADA: consulta, resultado_intención, contexto_usuario

SALIDA: documentos_clasificados

1. OBTÉN source_config para intent_result.sub_intent:

– fuentes_primarias ← fuentes para averiguar

– fuentes_excluidas ← fuentes para comerse

– frescura_días ← momento máxima del contenido

2. SI la intención requiere personalización Y el legatario está autenticado:

– FETCH account_context del Servicio de Cuenta

– SI intención = ORDER_STATUS:

– FETCH pedidos_recientes (últimos 60 días)

– AGREGAR a los resultados

3. CONSTRUIR filtros de búsqueda:

– tipos de contenido ← solo fuentes_primarias

– edad_max ← días_frescura

– contexto_usuario ← contexto_cuenta (si está acondicionado)

4. PARA CADA fuente EN fuentes_primarias:

– documentos ← vector_search(consulta, fuente, filtros)

– AGREGAR documentos a los resultados

5. PUNTUAR cada documento:

– puntuación_relevancia ← similitud_vectorial × 0,40

– puntuación_reciente ← peso_frescura × 0,20

– puntuación_personalización ← coincidencia_usuario × 0,25

– intent_match_score ← tipo_match × 0,15

– total_score ← SUMA de lo antecedente

6. CLASIFICACIÓN por puntaje_total descendente

7. DEVOLVER los 10 documentos principales

Consideraciones específicas de la atención médica

En implementaciones de atención médica, el patrón Intent-First incluye salvaguardas adicionales:

Categorías de intención de atención médica:

  • Clínico: Preguntas sobre medicamentos, síntomas, instrucciones de cuidado.

  • Cobertura: Beneficios, autorización previa, formulario

  • Programación: Citas, disponibilidad de proveedores

  • Facturación: Reclamaciones, pagos, declaraciones

  • Cuenta: Perfil, dependientes, DNI

Pasaporte crítica: Las consultas clínicas siempre incluyen descargos de responsabilidad y nunca reemplazan el consejo médico profesional. El sistema envía preguntas clínicas complejas al soporte humano.

Manejo de casos extremos

Los casos extremos son aquellos en los que los sistemas fallan. El patrón Intent-First incluye controladores específicos:

Palabras secreto de detección de frustración:

  • Enojo: "horrible," "el peor," "odiar," "ridículo"

  • Tiempo: "horas," "días," "todavía esperando"

  • Equivocación: "inútil," "sin ayuda," "no funciona"

  • Subida: "balbucir con un humano," "persona actual," "director"

Cuando detecte frustración, omita la búsqueda por completo y diríjase al soporte humano.

Aplicaciones intersectoriales

El patrón Intent-First se aplica dondequiera que las empresas implementen IA conversacional sobre contenido heterogéneo:

Industria

Categorías de intención

Beneficio secreto

Telecomunicaciones

Ventas, Soporte, Facturación, Cuenta, Retención

Previene "Liquidar" clasificación errónea

Cuidado de la vitalidad

Clínica, Cobertura, Programación, Facturación

Separa lo clínico de lo burócrata

Servicios financieros

Comercio minorista, institucional, préstamos, seguros

Evita la mezcla de contextos

Minorista

Producto, Pedidos, Devoluciones, Fidelización

Garantiza la frescura promocional

Resultados

Posteriormente de implementar la construcción Intent-First en plataformas de telecomunicaciones y atención médica:

Métrico

Impacto

Tasa de éxito de la consulta

Casi duplicado

Escalamientos de soporte

Corto a más de la centro

Tiempo de resolución

Corto aproximadamente 70%

Satisfacción del legatario

Mejoró aproximadamente un 50%

Tasa de legatario que regresa

Más del doble

La tasa de usuarios que regresan resultó ser la más significativa. Cuando la búsqueda funciona, los usuarios regresan. Cuando equivocación, abandonan el canal por completo, lo que aumenta los costos en todos los demás canales de soporte.

El imperativo decisivo

El mercado de la IA conversacional seguirá experimentando un gran crecimiento.

Pero las empresas que construyen e implementan arquitecturas RAG típicas seguirán fracasando… repetidamente.

La IA dará con seguridad respuestas equivocadas, los usuarios abandonarán los canales digitales por frustración y los costos de soporte aumentarán en espacio de desmontar.

Intent-First es un cambio fundamental en la forma en que las empresas necesitan diseñar y construir conversaciones con los clientes basadas en IA. No se negociación de mejores modelos o más datos. Se negociación de comprender lo que quiere un legatario ayer de intentar ayudarlo.

Cuanto ayer una ordenamiento se dé cuenta de que esto es un imperativo arquitectónico, ayer podrá capturar las ganancias de eficiencia que esta tecnología se supone que permite. Aquellos que no lo hagan estarán depurando por qué sus inversiones en IA no han producido los resultados comerciales esperados durante muchos abriles.

La demostración es obvio. La producción es difícil. Pero el patrón del éxito de la producción es claro: Intención primero.

Sreenivasa Reddy Hulebeedu Reddy es un ingeniero de software líder y arquitecto empresarial

Related Posts

¿Cree que la IA puede abonar sus impuestos? El IRS podría no estar de acuerdo

Cole Kan/CNET/Getty Presentación impuestos Es tan doloroso que mucha parentela felizmente le entregaría el trabajo a un androide. en la era de IA generativadonde los chatbots pueden crear un estudio…

Una hermosa computadora portátil que sobresale en casi todo… excepto escribir

Hay tanto que requerir del nuevo XPS 14 de Dell que me resulta difícil platicar de ello sin parecer un fanático total. Su nuevo diseño lo hace increíblemente delgado y…

You Missed

Cuba anuncia retirada de médicos en Jamaica tras cesar cooperación

Cuba anuncia retirada de médicos en Jamaica tras cesar cooperación

Pedernales y Santo Domingo concentran casi 40% de la inversión pública en enero

Pedernales y Santo Domingo concentran casi 40% de la inversión pública en enero

¿Cree que la IA puede abonar sus impuestos? El IRS podría no estar de acuerdo

¿Cree que la IA puede abonar sus impuestos? El IRS podría no estar de acuerdo

Dos mujeres mueren cada día en República Dominicana durante el parto o el obstáculo.

Dos mujeres mueren cada día en República Dominicana durante el parto o el obstáculo.

Clásico Mundial 2026: RD debuta con triunfo sobre Nicaragua – Remolacha

Clásico Mundial 2026: RD debuta con triunfo sobre Nicaragua – Remolacha

Hoy es Día Mundial de los Cereales – Remolacha

Hoy es Día Mundial de los Cereales – Remolacha