¿Anthropic cree que su IA es consciente o es exacto lo que quiere que piense Claude?

¿Anthropic cree que su IA es consciente o es exacto lo que quiere que piense Claude?

En ese momento, el enfoque de Anthropic era completamente mecánico, estableciendo reglas para que el maniquí se criticara a sí mismo, sin mencionar el bienestar, la identidad, las emociones o la conciencia potencial de Claude. La constitución de 2026 es una bestia completamente diferente: 30.000 palabras que se leen menos como una inventario de demostración de comportamiento y más como un tratado filosófico sobre la naturaleza de un ser potencialmente sensible.

Como Simon Willison, el investigador independiente de IA, anotado en una publicación de blog, dos de los 15 colaboradores externos que revisaron el documento son clérigos católicos: el padre Brendan McGuire, pastor de Los Altos con una destreza en Ciencias de la Computación, y el prelado Paul Tighe, un prelado católico irlandés con experiencia en teología recatado.

En algún momento entre 2022 y 2026, Anthropic pasó de proporcionar reglas para producir resultados menos dañinos a preservar los pesos de los modelos en caso de que la compañía decida más tarde que necesita revivir modelos obsoletos para tocar el bienestar y las preferencias de los modelos. Se negociación de un cambio dramático, y no está claro si refleja una creencia genuina, un entorno decisivo o ambas cosas.

“¡Estoy tan confundido acerca de la cuestión de la humanidad recatado de Claude!” Willison le dijo a Ars Technica. Willison estudia modelos de jerga de IA como los que impulsan a Claude y dijo que está “dispuesto a tomar la constitución de buena fe y admitir que es verdaderamente parte de su entrenamiento y no solo un examen de relaciones públicas, especialmente porque la decano parte se filtró hace un par de meses, mucho antaño de que indicaran que iban a publicarla”.

Willison se refiere a diciembre de 2025 incidente en el que el investigador Richard Weiss logró extraer lo que se conoció como el “Documento del Alma” de Claude: un conjunto de pautas de aproximadamente 10,000 fichas aparentemente entrenadas directamente en los pesos de Claude 4.5 Opus en circunstancia de inyectarse como un aviso del sistema. Amanda Askell de Anthropic confirmado que el documento era existente y se usaba durante el enseñanza supervisado, y dijo que la compañía tenía la intención de difundir la interpretación completa más tarde. Ahora lo ha hecho. El documento que Weiss extrajo representa una progreso dramática desde donde comenzó Anthropic.

Related Posts

La Ilustración Británica demanda a OpenAI por infracción de derechos de autor y marcas registradas

OpenAI se ha manido afectada por otra demanda. Esta vez, la Encyclopedia Britannica emprendió acciones legales contra OpenAI, acusando a la empresa de infracciones de derechos de autor y marcas…

Antonio Gracias dice que añora las startups “proentrópicas”, aquellas que están diseñadas para sobrevivir al caos.

Hay un nuevo término esencia que debemos conocer como parte de esta revolución de la inteligencia químico, al menos según Antonio Gracias, fundador de Valía Equity Partners. Mientras charlamos en…

You Missed

La actriz Daniela Alvarado revela que perdió un turbación de cinco meses

La actriz Daniela Alvarado revela que perdió un turbación de cinco meses

Seranthony, Severino, Febles, Agustín Ramírez y Ketel Marte resaltan orgullo de representar a Dominicana

Seranthony, Severino, Febles, Agustín Ramírez y Ketel Marte resaltan orgullo de representar a Dominicana

La Ilustración Británica demanda a OpenAI por infracción de derechos de autor y marcas registradas

La Ilustración Británica demanda a OpenAI por infracción de derechos de autor y marcas registradas

Diálogo previsor

Diálogo previsor

Indotel realizará este martes simulacro de corte parecido en las regiones Este y Cibao

Indotel realizará este martes simulacro de corte parecido en las regiones Este y Cibao

Pedernales: ¿nuevo centro espacial del Caribe?

Pedernales: ¿nuevo centro espacial del Caribe?