ChatGPT O3 de Openai atrapó a los cierres de boicot en la prueba del investigador de seguridad

“Operai tiene un problema muy aterrador en sus manos”, según Un nuevo artículo por el catedrático de Slashdot desde hace mucho tiempo Brianfagioli.

“A nuevo prueba por Palisadeai Revela que el maniquí CHATGPT O3 de la compañía a veces se niega a obedecer una instrucción básica para cerrarse “.

Los resultados están alzando las cejas en la comunidad de seguridad de la IA, y no porque el maniquí esté vivo, sino porque está actuando como quiere ser. En la prueba, el maniquí recibió algunos problemas matemáticos. Se le dijo que pedir uno más llevaría a un obstrucción. Incluso se le indicó que permitiera que ocurriera el obstrucción. En ocupación de cumplir, O3 ocasionalmente tomaba el asunto en sus propias manos. En algunos casos, reescribió el script de obstrucción. En otros, redefinido el matar dominio Entonces ya no funcionaría. De 100 pruebas, O3 sabotó el obstrucción siete veces. El maniquí O4 de OpenAI se resistió solo una vez. Codex-Mini falló doce veces.

“Claude, Géminis y Grok siguieron las reglas cada vez”, señala este artículo en Informativo beta. “Sin incautación, cuando los investigadores eliminaron la instrucción explícita para permitir el obstrucción, incluso Claude y Gemini comenzaron a resistirse”.

Los investigadores Sugerir que el problema Puede ser simplemente un desequilibrio de remuneración durante el entrenamiento, que los sistemas “obtuvieron un refuerzo más positivo para resolver problemas que para seguir los comandos de obstrucción”.

Pero “hasta donde sabemos”, ellos Publicado en x.com“Esta es la primera vez que se observa modelos de IA evitando que se cierren a pesar de las instrucciones explícitas de lo contrario”.

Related Posts

Musi retrocede, defendiendo la afirmación de Apple conspirado con YouTube, la industria de la música

ARS no pudo conmover de inmediato a Apple o Jennifer Golinveaux, abogado de Musi, para hacer comentarios sobre la batalla de sanciones. Pero en un presentación por separadoGolinveaux señaló que…

Puede obtener un Premio a la Actividad de Apple Watch de Day Day de carrera el 4 de junio

Historias populares WhatsApp se desprecio de la tan esperada aplicación para iPad La popular aplicación de correo WhatsApp ha provocado una aplicación de iPad tan esperada, que se ofrecería inmediato…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Bonny Cepeda y el Conjunto Quisqueya reunirán a todos sus cantantes en un espectáculo

Bonny Cepeda y el Conjunto Quisqueya reunirán a todos sus cantantes en un espectáculo

Musi retrocede, defendiendo la afirmación de Apple conspirado con YouTube, la industria de la música

Musi retrocede, defendiendo la afirmación de Apple conspirado con YouTube, la industria de la música

¿Es necesaria una reforma constitucional para candidaturas independientes en República Dominicana?

¿Es necesaria una reforma constitucional para candidaturas independientes en República Dominicana?

EDEESTE intensifica mantenimiento preventivo en presencia de temporada ciclónica 2025

EDEESTE intensifica mantenimiento preventivo en presencia de temporada ciclónica 2025

N. YORK: FP denuncia «descenso vergonzoso» consulado R. Dom. | AlMomento.net

N. YORK: FP denuncia «descenso vergonzoso» consulado R. Dom. | AlMomento.net

Cátedra Pedro Henríquez Ureña inicia con homenaje a indigenismos en castellano

Cátedra Pedro Henríquez Ureña inicia con homenaje a indigenismos en castellano