De los registros a la información: el avance de la IA que redefine la observabilidad

De los registros a la información: el avance de la IA que redefine la observabilidad

Presentado por elástico


Los registros se convertirán en la útil principal para encontrar el “por qué” en el dictamen de incidentes de red

Los entornos de TI modernos tienen un problema de datos: hay demasiados. Las organizaciones que necesitan tramitar el entorno de una empresa se enfrentan cada vez más al desafío de detectar y diagnosticar problemas en tiempo verdadero, optimizar el rendimiento, mejorar la confiabilidad y avalar la seguridad y el cumplimiento, todo ello en el interior de presupuestos limitados.

El panorama actual de la observabilidad tiene muchas herramientas que ofrecen una opción. La mayoría excursión en torno a equipos de DevOps o ingenieros de confiabilidad del sitio (SRE) que analizan registros, métricas y seguimientos para descubrir patrones, descubrir qué sucede en la red y diagnosticar por qué ocurrió un problema o incidente. El problema es que el proceso crea una sobrecarga de información: un clúster de Kubernetes por sí solo puede emitir de 30 a 50 gigabytes de registros por día, y patrones de comportamiento sospechosos pueden ocurrir desapercibidos para los luceros humanos.

"Es tan anacrónico ahora, en el mundo de la IA, pensar en humanos solos observando la infraestructura," dice Ken Exner, director de producto de Elastic. "Odio decírtelo, pero las máquinas son mejores que los seres humanos a la hora de comparar patrones”.

El enfoque de toda la industria en la visualización de síntomas obliga a los ingenieros a inquirir respuestas manualmente. lo crucial "por qué" está enterrado en registros, pero conveniente a que contienen volúmenes masivos de datos no estructurados, la industria tiende a usarlos como útil de final solicitud. Esto ha obligado a los equipos a realizar costosas concesiones: ocuparse incontables horas a crear canales de datos complejos, descartar datos de registro valiosos y arriesgarse a lagunas de visibilidad críticas, o iniciar sesión y olvidarse.

Elastic, la empresa de búsqueda de inteligencia químico, lanzó recientemente una nueva función de observabilidad citación Streams, que pretende convertirse en la señal principal para las investigaciones tomando registros ruidosos y convirtiéndolos en patrones, contexto y significado.

Streams utiliza IA para particionar y analizar automáticamente registros sin procesar para extraer campos relevantes y sujetar en gran medida el esfuerzo requerido por los SRE para hacer que los registros sean utilizables. Streams asimismo muestra automáticamente eventos importantes, como errores críticos y anomalías, a partir de registros ricos en contexto, lo que brinda a los SRE alertas tempranas y una comprensión clara de sus cargas de trabajo, lo que les permite investigar y resolver problemas más rápido. El objetivo final es mostrar los pasos de remediación.

"A partir de datos sin procesar, voluminosos y desordenados, Streams crea automáticamente una estructura, poniéndola en un formato que sea útil, le alerta automáticamente sobre problemas y le ayuda a solucionarlos." dice Exner. "Esa es la ocultismo de Streams."

Un flujo de trabajo roto

Streams trastorna un proceso de observabilidad que algunos dicen que está roto. Normalmente, los SRE configuran métricas, registros y seguimientos. Luego, configuran alertas y objetivos de nivel de servicio (SLO), a menudo reglas codificadas para mostrar dónde un servicio o proceso ha superado un límite, o se ha detectado un patrón específico.

Cuando se activa una alerta, apunta a la métrica que muestra una anomalía. A partir de ahí, los SRE miran un panel de métricas, donde pueden visualizar el problema y comparar la alerta con otras métricas, o la CPU con la memoria y las E/S, y comenzar a inquirir patrones.

Luego, es posible que necesiten observar un seguimiento y examinar las dependencias ascendentes y descendentes en toda la aplicación para profundizar en la causa raíz del problema. Una vez que descubren qué está causando el problema, acceden a los registros de esa cojín de datos o servicio para intentar depurar el problema.

Algunas empresas simplemente buscan sumar más herramientas cuando las actuales resultan ineficaces. Eso significa que los SRE están saltando de una útil a otra para mantenerse al tanto del monitoreo y la resolución de problemas en toda su infraestructura y aplicaciones.

"Estás saltando a través de diferentes herramientas. Depende de un humano para interpretar estas cosas, observar visualmente la relación entre los sistemas en un planisferio de servicios, observar visualmente los gráficos en un panel de métricas, para descubrir cuál y dónde está el problema, " dice Exner. "Pero la IA automatiza ese flujo de trabajo."

Con Streams impulsado por IA, los registros no solo se utilizan de forma reactiva para resolver problemas, sino asimismo para procesar proactivamente problemas potenciales y crear alertas ricas en información que ayudan a los equipos a ocurrir directamente a la resolución de problemas, ofreciendo una opción para remediar o incluso solucionar el problema por completo, antaño de informar automáticamente al equipo que ya se ha solucionado.

"Creo que los registros, el conjunto más rico de información, el tipo de señal diferente, comenzarán a impulsar gran parte de la automatización que un ingeniero de confiabilidad del servicio suele realizar hoy en día, y que realiza de forma muy manual." añade. "Un ser humano no debería estar en ese proceso, en el que lo hace investigando en sí mismo, tratando de descubrir qué está pasando, dónde y cuál es el problema, y ​​luego, una vez que encuentra la causa raíz, intenta descubrir cómo depurarlo."

El futuro de la observabilidad

Los modelos de lenguajes grandes (LLM) podrían ser un actor secreto en el futuro de la observabilidad. Los LLM se destacan en el registro de patrones en grandes cantidades de datos repetitivos, que se parecen mucho a los datos de registro y telemetría en sistemas complejos y dinámicos. Y los LLM de hoy pueden capacitarse para procesos de TI específicos. Con las herramientas de automatización, el LLM tiene la información y las herramientas que necesita para resolver errores de la cojín de datos o problemas del montón de Java, y más. Será esencial incorporarlos en plataformas que aporten contexto y relevancia.

La remediación automatizada todavía llevará algún tiempo, afirma Exner, pero los runbooks y los manuales de estrategias automatizados generados por los LLM se convertirán en una maña standard en los próximos dos primaveras. En otras palabras, las medidas de remediación serán impulsadas por los LLM. El LLM ofrecerá soluciones y el humano las verificará e implementará, en ocasión de vocear a un habituado.

Enfrentarse la escasez de habilidades

Situar por la IA para obtener observabilidad ayudaría a asaltar una importante escasez de talento necesario para tramitar la infraestructura de TI. La contratación es lenta porque las organizaciones necesitan equipos con mucha experiencia y comprensión de los problemas potenciales y de cómo resolverlos rápidamente. Esa experiencia puede provenir de un LLM que esté basado en el contexto, dice Exner.

"Podemos ayudar a guerrear con la escasez de habilidades aumentando las personas con LLM que los conviertan a todos en expertos al instante." él explica. "Creo que esto hará que sea mucho más tratable para nosotros tomar profesionales novatos y convertirlos en expertos tanto en seguridad como en observabilidad, y hará posible que un practicante más novato actúe como un habituado”.

Streams en Elastic Observability ya está arreglado. Originarse por lección más sobre los Streams.


Los artículos patrocinados son contenido producido por una empresa que paga por la publicación o tiene una relación comercial con VentureBeat, y siempre están claramente marcados. Para más información, póngase en contacto ventas@venturebeat.com.

Related Posts

¿Escuchas anuncios en Spotify Premium hoy? no eres solo tu

Ryan Haines / Autoridad de Android TL;DR Algunos usuarios de Spotify Premium informaron acontecer escuchado anuncios inesperados esta mañana. Esta es la tercera vez que Spotify reproduce anuncios por error…

Exolotl Zian, Subnautica, Runic Curse y más

Reg. $1+/GRATIS+ Su registro vespertina de las mejores ofertas de juegos y aplicaciones para Android ya está registro para comenzar, incluidos títulos como Exolotl: Zian, Subnautica, HamayWalls, PARANORMASIGHT, Runic Curse,…

You Missed

Gobierno de La Altagracia coordina acciones para eficaz de Semana Santa 2026

Gobierno de La Altagracia coordina acciones para eficaz de Semana Santa 2026

La prohibición del uso de pasamontañas y capuchas

La prohibición del uso de pasamontañas y capuchas

Héctor Guzmán defiende candidaturas independientes, pero advierte que deben estar reguladas

Héctor Guzmán defiende candidaturas independientes, pero advierte que deben estar reguladas

¿Escuchas anuncios en Spotify Premium hoy? no eres solo tu

¿Escuchas anuncios en Spotify Premium hoy? no eres solo tu

Asiento BHD convoca a la décima primera estampación del Premio Mujeres que Cambian el Mundo

Asiento BHD convoca a la décima primera estampación del Premio Mujeres que Cambian el Mundo

Dispositivo portátil devuelve la voz a pacientes tras un ACV

Dispositivo portátil devuelve la voz a pacientes tras un ACV