Xai incumplimiento a la obsesión de Grok con el exterminación blanco en una ‘modificación no autorizada’

Xai culpó a una “modificación no autorizada” por un error en su chatbot de Grok con IA que causó que Grok referirse repetidamente a “Exterminio blanco en Sudáfrica” ​​cuando se invoca en ciertos contextos en X.

El miércoles, Grok comenzó a contestar a docenas de publicaciones en X con información sobre el exterminación blanco en Sudáfrica, incluso en respuesta a sujetos no relacionados. Las respuestas extrañas surgieron de la cuenta X para Grok, que replica a los usuarios con publicaciones generadas por IA cada vez que una persona fórmula “@grok”.

Según una publicación del jueves de la cuenta oficial de XAI, se realizó un cambio el miércoles por la mañana a la solicitud del sistema de Grok Bot, las instrucciones de parada nivel que guían el comportamiento del bot, que dirigió a Grok a proporcionar una “respuesta específica” sobre un “tema político”. Xai dice que el ajuste “violó (sus) políticas internas y títulos centrales”, y que la compañía ha “llevado a angla una investigación exhaustiva”.

Es la segunda vez que Xai reconoce públicamente un cambio no calificado al código de Grok, causó que la IA respondiera de modo controvertida.

En febrero, Grok censuró brevemente menciones poco halagadoras de Donald Trump y Elon Musk, el fundador multimillonario de Xai y propietario de X. Igor Babuschkin, un líder de ingeniería de Xai, dijo que Grok había sido instruido por un empleado pícaro Para ignorar las fuentes que mencionaron a Musk o Trump difundiendo información errónea, y que Xai volvió el cambio tan pronto como los usuarios comenzaron a señalarlo.

Xai dijo el jueves que hará varios cambios para evitar que ocurran incidentes similares en el futuro.

A partir de hoy, Xai lo hará informar las indicaciones del sistema de Grok en Github y en un ChangeLog. La compañía dice que además “establecerá controles y medidas adicionales” para certificar que los empleados de XAI no puedan modificar el indicador del sistema sin revisión y establecer un “equipo de monitoreo 24/7 para contestar a incidentes con las respuestas de Grok que no son atrapados por los sistemas automatizados”.

A pesar de las frecuentes advertencias de Musk de los peligros de AI desaparecido desenfrenadoXai tiene un historial de seguridad de AI deficiente. Un documentación flamante Descubrí que Grok desnudaría las fotos de las mujeres cuando se les pidiera. El chatbot además puede ser considerablemente más cerril que la IA como Gemini y ChatGPT de Google, maldiciendo sin mucha restricción para charlar.

Un estudio de Saferai, una ordenamiento sin fines de interés con el objetivo de mejorar la responsabilidad de AI Labs, encontró que Xai ocupa un mal estado en la seguridad entre sus pares, adecuado a su Prácticas de trámite de riesgos “muy débiles”. A principios de este mes, Xai se perdió una término linde autoimpuesta para informar un situación de seguridad de IA finalizado.


Related Posts

Android 16 podría introducir ‘acciones mágicas’ de notificación impulsadas por Gemini

Edgar Cervantes / Android Authority Tl; Dr Google puede estar desarrollando “acciones mágicas” para Android, una restablecimiento con IA a las acciones de notificación que podrían disfrutar el maniquí Gemini…

La mostrador de Samsung’s Now tiene desesperado más

La anticipación fue entrada para la UI 7 de Samsung, e incluso cuando se ignoran todos los retrasos y los problemas originales con el nuevo sistema eficaz, todavía está congruo…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Descubre el ‘Safari de los Dinosaurios’ en el zoológico del Bronx: ¡una aventura para todos!

Descubre el ‘Safari de los Dinosaurios’ en el zoológico del Bronx: ¡una aventura para todos!

Arrestan corregidor de Monserrat por presunta comercio de personas y tráfico – Remolacha

Arrestan corregidor de Monserrat por presunta comercio de personas y tráfico – Remolacha

Android 16 podría introducir ‘acciones mágicas’ de notificación impulsadas por Gemini

Android 16 podría introducir ‘acciones mágicas’ de notificación impulsadas por Gemini

Cannes 2025: El Cine Dominicano Dice Presente y con Estilo – Remolacha

Cannes 2025: El Cine Dominicano Dice Presente y con Estilo – Remolacha

Rusia y Ucrania mantienen primeras conversaciones

Rusia y Ucrania mantienen primeras conversaciones

Mesa Mundial proyecta un beocio dinamismo en la creación de empleo en América Latina en 2025

Mesa Mundial proyecta un beocio dinamismo en la creación de empleo en América Latina en 2025