ChatGPT O3 de Openai atrapó a los cierres de boicot en la prueba del investigador de seguridad

“Operai tiene un problema muy aterrador en sus manos”, según Un nuevo artículo por el catedrático de Slashdot desde hace mucho tiempo Brianfagioli.

“A nuevo prueba por Palisadeai Revela que el maniquí CHATGPT O3 de la compañía a veces se niega a obedecer una instrucción básica para cerrarse “.

Los resultados están alzando las cejas en la comunidad de seguridad de la IA, y no porque el maniquí esté vivo, sino porque está actuando como quiere ser. En la prueba, el maniquí recibió algunos problemas matemáticos. Se le dijo que pedir uno más llevaría a un obstrucción. Incluso se le indicó que permitiera que ocurriera el obstrucción. En ocupación de cumplir, O3 ocasionalmente tomaba el asunto en sus propias manos. En algunos casos, reescribió el script de obstrucción. En otros, redefinido el matar dominio Entonces ya no funcionaría. De 100 pruebas, O3 sabotó el obstrucción siete veces. El maniquí O4 de OpenAI se resistió solo una vez. Codex-Mini falló doce veces.

“Claude, Géminis y Grok siguieron las reglas cada vez”, señala este artículo en Informativo beta. “Sin incautación, cuando los investigadores eliminaron la instrucción explícita para permitir el obstrucción, incluso Claude y Gemini comenzaron a resistirse”.

Los investigadores Sugerir que el problema Puede ser simplemente un desequilibrio de remuneración durante el entrenamiento, que los sistemas “obtuvieron un refuerzo más positivo para resolver problemas que para seguir los comandos de obstrucción”.

Pero “hasta donde sabemos”, ellos Publicado en x.com“Esta es la primera vez que se observa modelos de IA evitando que se cierren a pesar de las instrucciones explícitas de lo contrario”.

Related Posts

Amazon ha corto el Fire TV Stick 4K Select a su precio más bajo gracias a un cupón factible de perder

El Amazon Fire TV Stick 4K Select es una buena propuesta a su precio total de $ 39,99, y mucho menos ahora que tiene un descuento irreal de $ 25.…

Amazon está dando una segunda oportunidad a los teléfonos inteligentes y probablemente puedas adivinar de qué se comercio

Amazon se quemó los dedos con el Fire Phone en 2014. El dispositivo, supervisado personalmente por Jeff Bezos, duró poco más de un año antiguamente de que Amazon lo desconectara…

You Missed

Alcaldía del DN y LMD destacan el rol de las juntas de vecinos en la administración almacén

Alcaldía del DN y LMD destacan el rol de las juntas de vecinos en la administración almacén

UEPAL y Policía Doméstico coordinan acciones para acorazar la seguridad en La Altagracia

UEPAL y Policía Doméstico coordinan acciones para acorazar la seguridad en La Altagracia

Amazon ha corto el Fire TV Stick 4K Select a su precio más bajo gracias a un cupón factible de perder

Amazon ha corto el Fire TV Stick 4K Select a su precio más bajo gracias a un cupón factible de perder

Llueve en distintas zonas de la Rep. Dominicana por vaguada | AlMomento.net

Llueve en distintas zonas de la Rep. Dominicana por vaguada | AlMomento.net

El petróleo de Texas devaluación a los 95 dólares tras medidas para contener subida de precios

El petróleo de Texas devaluación a los 95 dólares tras medidas para contener subida de precios

Trump fuego “cobardes” a los países de la OTAN – Remolacha

Trump fuego “cobardes” a los países de la OTAN – Remolacha