¿Anthropic cree que su IA es consciente o es exacto lo que quiere que piense Claude?

En ese momento, el enfoque de Anthropic era completamente mecánico, estableciendo reglas para que el maniquí se criticara a sí mismo, sin mencionar el bienestar, la identidad, las emociones o la conciencia potencial de Claude. La constitución de 2026 es una bestia completamente diferente: 30.000 palabras que se leen menos como una inventario de demostración de comportamiento y más como un tratado filosófico sobre la naturaleza de un ser potencialmente sensible.

Como Simon Willison, el investigador independiente de IA, anotado en una publicación de blog, dos de los 15 colaboradores externos que revisaron el documento son clérigos católicos: el padre Brendan McGuire, pastor de Los Altos con una destreza en Ciencias de la Computación, y el prelado Paul Tighe, un prelado católico irlandés con experiencia en teología recatado.

En algún momento entre 2022 y 2026, Anthropic pasó de proporcionar reglas para producir resultados menos dañinos a preservar los pesos de los modelos en caso de que la compañía decida más tarde que necesita revivir modelos obsoletos para tocar el bienestar y las preferencias de los modelos. Se negociación de un cambio dramático, y no está claro si refleja una creencia genuina, un entorno decisivo o ambas cosas.

“¡Estoy tan confundido acerca de la cuestión de la humanidad recatado de Claude!” Willison le dijo a Ars Technica. Willison estudia modelos de jerga de IA como los que impulsan a Claude y dijo que está “dispuesto a tomar la constitución de buena fe y admitir que es verdaderamente parte de su entrenamiento y no solo un examen de relaciones públicas, especialmente porque la decano parte se filtró hace un par de meses, mucho antaño de que indicaran que iban a publicarla”.

Willison se refiere a diciembre de 2025 incidente en el que el investigador Richard Weiss logró extraer lo que se conoció como el “Documento del Alma” de Claude: un conjunto de pautas de aproximadamente 10,000 fichas aparentemente entrenadas directamente en los pesos de Claude 4.5 Opus en circunstancia de inyectarse como un aviso del sistema. Amanda Askell de Anthropic confirmado que el documento era existente y se usaba durante el enseñanza supervisado, y dijo que la compañía tenía la intención de difundir la interpretación completa más tarde. Ahora lo ha hecho. El documento que Weiss extrajo representa una progreso dramática desde donde comenzó Anthropic.