Un investigador de seguridad de Meta AI dijo que un agente de OpenClaw se volvió perturbado en su bandeja de entrada

El publicación X ahora vírico de la investigadora de seguridad de Meta AI Summer Yue se lee, al principio, como una sátira. Le dijo a su agente de OpenClaw AI que revisara su abarrotada bandeja de entrada de correo electrónico y le sugiriera qué eliminar o dar carpetazo.

El agente procedió a enloquecer. Comenzó a borrar todos sus correos electrónicos en una “carrera rápida” mientras ignoraba las órdenes de su teléfono que le decían que se detuviera.

“Tuve que CORRER en dirección a mi Mac mini como si estuviera desactivando una explosivo”, escribió, publicando imágenes de las indicaciones de parada ignoradas como recibos.

La Mac Mini, una computadora Apple asequible que se coloca sobre un escritorio y cerca de en la palma de la mano, se ha convertido en el dispositivo predilecto hoy en día para ejecutar OpenClaw. (El Mini se vende “como pan caliente”, aparentemente dijo un empleado de Apple “confundido” el reconocido investigador de IA Andrej Karpathy cuando compró uno para ejecutar una alternativa de OpenClaw convocatoria NanoClaw).

OpenClaw es, por supuesto, el agente de IA de código rajado que alcanzó triunfo a través de Moltbook, una red social monopolio de IA. Los agentes de OpenClaw estuvieron en el centro de ese episodio ahora ampliamente desacreditado en Moltbook en el que parecía que las IA estaban conspirando contra los humanos.

Pero la empresa de OpenClaw, según su página de GitHubno está enfocado a las redes sociales. Su objetivo es ser un asistente personal de IA que se ejecuta en sus propios dispositivos.

La familia de Silicon Valley se ha enamorado tanto de OpenClaw que “garfio” y “garras” se han convertido en la palabra secreto. palabras de moda de comicios para agentes que se ejecutan en hardware personal. Otros agentes similares incluyen Mano Cero, garfio de hierroy PicoGarra. El equipo de podcasts de Y Combinator incluso apareció en su episodio más nuevo vestidos con trajes de langosta.

Evento tecnológico

Boston, Massachusetts
|
9 de junio de 2026

Pero la publicación de Yue sirve como advertencia. Como señalaron otros en X, si un investigador de seguridad de IA pudiera encontrarse con este problema, ¿qué esperanzas tienen los simples mortales?

“¿Estabas probando intencionalmente sus barandillas o cometiste un error de novato?” un desarrollador de software le preguntó sobre X.

“Error de novato para ser honesto”, respondió ella. Había estado probando a su agente con una bandeja de entrada de “trebejo” más pequeña, como ella la llamaba, y había funcionado adecuadamente en correos electrónicos menos importantes. Se había reses su confianza, por lo que pensó que se dejaría soportar por la existencia.

Yue cree que la gran cantidad de datos en su bandeja de entrada existente “provocó la compactación”, escribió. La compactación ocurre cuando la ventana de contexto (el registro continuo de todo lo que se le ha dicho y hecho a la IA en una sesión) crece demasiado, lo que hace que el agente comience a resumir, comprimir y establecer la conversación.

En ese punto, la IA puede eliminar instrucciones que el humano considera sobrado importantes.

En este caso, es posible que se haya saltado su extremo mensaje (donde le dijo que no actuara) y haya vuelto a las instrucciones de la bandeja de entrada del “trebejo”.

Como varios otros en X señaló, No se puede esperar en las indicaciones. proceder como barreras de seguridad. Los modelos pueden malinterpretarlos o ignorarlos.

Varias personas ofrecieron sugerencias que iban desde la sintaxis exacta que Yue debería acaecer usado para detener al agente, hasta varios métodos para certificar una mejor adhesión a las barreras de seguridad, como escribir instrucciones en archivos dedicados o usar otras herramientas de código rajado.

En aras de una transparencia total, TechCrunch no pudo compulsar de forma independiente lo que sucedió en la bandeja de entrada de Yue. (Ella no respondió a nuestra solicitud de comentarios, aunque sí respondió a muchas preguntas y comentarios que le enviaron en X).

Pero positivamente no importa.

El quid de la historia es que los agentes dirigidos a los trabajadores del conocimiento, en su etapa flagrante de crecimiento, son riesgosos. Las personas que dicen que los están utilizando con éxito están inventando métodos para acogerse.

Un día, quizás pronto (¿2027? ¿2028?), podrían estar listos para su uso generalizado. Jehová sabe que a muchos de nosotros nos encantaría acoger ayuda con el correo electrónico, los pedidos de comestibles y la programación de citas con el dentista. Pero ese día aún no ha llegado.

Related Posts

Ahorre $50 en el Bose QuietComfort Extremista de segunda vivientes (¡actúe rápido!)

¿Estás buscando unos auriculares increíbles? Conocida desde hace mucho tiempo por sus impresionantes capacidades ANC, la diámetro Bose QuietComfort Extremista sigue siendo sólida, con muy pocos competidores que se acerquen…

Pixel 10a frente a Pixel 10: una pequeña brecha ahora es un quebrada (vídeo)

En abriles pasados, la serie A ha invadido el Pixel central, pero ese no será el caso en 2026. ¿Cómo se compara el Pixel 10a con el Pixel 10? Aquí…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Ahorre $50 en el Bose QuietComfort Extremista de segunda vivientes (¡actúe rápido!)

Ahorre  en el Bose QuietComfort Extremista de segunda vivientes (¡actúe rápido!)

RD entre países que la Interpol intervino por abusos infantiles – Remolacha

RD entre países que la Interpol intervino por abusos infantiles – Remolacha

Pixel 10a frente a Pixel 10: una pequeña brecha ahora es un quebrada (vídeo)

Pixel 10a frente a Pixel 10: una pequeña brecha ahora es un quebrada (vídeo)

Investigación: Pesimismo sobre el rumbo del país, pero optimismo personal

Investigación: Pesimismo sobre el rumbo del país, pero optimismo personal

Apple probó si la IA podría mejorar los resultados de búsqueda de la App Store

Apple probó si la IA podría mejorar los resultados de búsqueda de la App Store

Arabia Saudí reporta interceptación de misil y drones en su región

Arabia Saudí reporta interceptación de misil y drones en su región