Las instrucciones de IA ocultas revelan cómo los controles antrópicos Claude 4

Willison, quien acuñó el término “inyección rápida” en 2022, siempre está atento a las vulnerabilidades de LLM. En su publicación, señala que las indicaciones del sistema de lección le recuerdan…

Nuevos modelos de IA de OpenAI desobedecen instrucciones humanas y se niegan a apagarse

El Pregonero, Estados Unidos.-OpenAI o3, el más flamante maniquí de inteligencia fabricado (IA) de la compañía creadora del popular chatbot ChatGPT, ignoró una orden explícita e incluso saboteó una serie…