
Siga ZDNET: Agréganos como fuente preferida en Google.
Conclusiones secreto de ZDNET
- OpenAI creó un “atacante automatizado” para probar las defensas de Atlas.
- Las cualidades que hacen que los agentes sean avíos asimismo los hacen vulnerables.
- La seguridad de la IA será un selección del sagaz y el ratón durante mucho tiempo.
OpenAI está automatizando el proceso de prueba de ChatGPT Atlas, su navegador web agente, en pesquisa de vulnerabilidades que puedan dañar a los usuarios. Al mismo tiempo, la empresa reconoce que la naturaleza de este nuevo tipo de navegador probablemente signifique que nunca estará completamente protegido contra ciertos tipos de ataques.
La empresa publicó un publicación de blog el martes describiendo su zaguero esfuerzo para proteger Atlas contra ataques de inyección rápida, en los que terceros maliciosos deslizan encubiertamente instrucciones al agente detrás del navegador, lo que hace que actúe en contra de los intereses del adjudicatario; Piense en ello como un virus digital que toma temporalmente el control de un host.
Encima: ¿Utiliza un navegador con IA? Cinco formas de ampararse de las inyecciones inmediatas, antiguamente de que sea demasiado tarde
El nuevo enfoque utiliza IA para imitar las acciones de los piratas informáticos humanos. Al automatizar el proceso de formación de equipos rojos, los investigadores pueden explorar la superficie de seguridad mucho más rápida y exhaustivamente, lo cual es aún más importante considerando la velocidad a la que se envían navegadores web agentes a los consumidores.
Sin retención, la publicación del blog enfatiza de modo crítica que incluso con los métodos de seguridad más sofisticados, los navegadores web agentes como Atlas son intrínsecamente vulnerables y probablemente seguirán siéndolo. Lo mejor que puede esperar la industria, dice OpenAI, es intentar ir un paso por delante de los atacantes.
“Esperamos que los adversarios sigan adaptándose”, escribe la compañía en la publicación del blog. “Es poco probable que la inyección rápida, al igual que las estafas y la ingeniería social en la web, alguna vez se ‘resuelva’ por completo. Pero somos optimistas de que un ciclo de respuesta rápida proactivo y enormemente receptivo puede continuar reduciendo materialmente el peligro del mundo vivo con el tiempo”.
Encima: La próxima crisis de los agentes de IA: por qué el nuevo habitual de seguridad de Okta es imprescindible para su negocio
(Divulgación: Ziff Davis, la empresa matriz de ZDNET, presentó una demanda en abril de 2025 contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis al entrenar y ejecutar sus sistemas de IA).
El ‘atacante automatizado basado en LLM’
Al igual que otros navegadores web agentes, el modo agente en Atlas está diseñado para realizar tareas complejas de varios pasos en nombre de los usuarios. Piense en hacer clic en enlaces, completar formularios digitales, adicionar artículos a un carrito de compras en andana y cosas por el estilo. La palabra “agente” implica un maduro radio de control: el sistema de IA toma la iniciativa en tareas que en el pasado sólo podían ser realizadas por un humano.
Pero una maduro agencia conlleva un maduro peligro.
Los ataques de inyección rápida explotan las mismas cualidades que hacen que los agentes sean avíos. Los agentes adentro de los navegadores operan, por diseño, en todo el ámbito de la vida digital de un adjudicatario, incluido el correo electrónico, las redes sociales, las páginas web y los calendarios en andana. Por lo tanto, cada uno de ellos representa un vector de ataque potencial a través del cual los piratas informáticos pueden introducir mensajes maliciosos.
Encima: he estado probando los mejores navegadores con IA; estos son los que positivamente me impresionaron
“Entregado que el agente puede realizar muchas de las mismas acciones que un adjudicatario puede realizar en un navegador, el impacto de un ataque exitoso puede hipotéticamente ser igual de amplio: reenviar un correo electrónico confidencial, dirigir cuartos, editar o eliminar archivos en la cúmulo, y más”, señala OpenAI en su publicación de blog.
Con la esperanza de alentar las defensas de Atlas, OpenAI construyó lo que describe como “un atacante automatizado basado en LLM”, un maniquí que experimenta continuamente con novedosas técnicas de inyección rápida. El atacante automatizado emplea formación por refuerzo (RL), un método fundamental para entrenar sistemas de inteligencia industrial que los premio cuando exhiben comportamientos deseados, aumentando así la probabilidad de que los repitan en el futuro.
Sin retención, el atacante no se limita a empujar y empujar ciegamente a Atlas. Es capaz de considerar múltiples estrategias de ataque y ejecutar posibles escenarios en un entorno de simulación extranjero antiguamente de establecer un plan. OpenAI dice que este enfoque agrega una nueva profundidad al equipo rojo: “Nuestro atacante entrenado en RL puede dirigir a un agente para que ejecute flujos de trabajo dañinos sofisticados y de espacioso plazo que se desarrollan en decenas (o incluso cientos) de pasos”, escribió la compañía. “Todavía observamos nuevas estrategias de ataque que no aparecieron en nuestra campaña de formación de equipos humanos ni en informes externos”.
Encima: Gartner insta a las empresas a “cercar todos los navegadores con IA”: ¿qué hay detrás de esta terrible advertencia?
En una demostración, OpenAI describe cómo el atacante automatizado introdujo una inyección rápida en Atlas, dirigiendo la cuenta de correo electrónico de un adjudicatario simulado para que enviara un correo electrónico a su director ejecutor, anunciando su renuncia inmediata. Luego, el agente detectó el intento de inyección y notificó al adjudicatario antiguamente de que se enviara el correo electrónico de renuncia automatizado.
En pocas palabras
Los desarrolladores como OpenAI se han enfrentado a una enorme presión, por parte de inversores y competidores, para crear rápidamente nuevos productos de IA. A algunos expertos les preocupa que la colosal inercia capitalista que alimenta la carrera de la IA se produzca a gastos de la seguridad.
En el caso de los navegadores web con IA, que se han convertido en una prioridad para muchas empresas, la dialéctica predominante en toda la industria parece ser: dirigir primero, preocuparse por los riesgos a posteriori. Es un enfoque comparable al de los constructores navales que suben a la concurrencia a un enorme crucero nuevo y reparan las grietas en el casco mientras ya está en el mar.
Encima: ¿Utiliza navegadores AI? Ten cuidado. Este exploit convierte los sitios confiables en armas: así es como se hace
Por lo tanto, incluso con nuevas actualizaciones de seguridad y esfuerzos de investigación, es esencial que los usuarios reconozcan que los navegadores web agentes no son completamente seguros, ya que pueden ser manipulados para interpretar de modo peligrosa, y es probable que esta vulnerabilidad persista durante algún tiempo, si no indefinidamente.
Como escribe OpenAI en su entrada de blog del martes: “La inyección rápida sigue siendo un desafío despejado para la seguridad de los agentes, y esperamos seguir trabajando en él durante los próximos primaveras”.






