Operai Rolls Back Update que hizo de Chatgpt un desastre sycófánico

En rebusca de buenas vibraciones

Openai, unido con competidores como Google y Anthrope, está tratando de construir chatbots con los que la familia quiere chatear. Por lo tanto, diseñar la resultón personalidad del maniquí para ser positiva y de apoyo tiene sentido: es menos probable que las personas usen una IA que sale tan dura o despectiva. Por descuido de una mejor palabra, se comercio cada vez más vibinación.

Cuando Google reveló Gemini 2.5, el equipo cayó sobre cómo el maniquí encabezó la tabla de clasificación de LM Arena, que permite a las personas nominar entre dos futuro de maniquí diferentes en una prueba cegada. Los modelos que a las personas les gusta más terminan en la parte superior de la relación, lo que sugiere que son más agradables de usar. Por supuesto, a las personas les pueden satisfacer los resultados por diferentes razones: tal vez una es más precisa técnicamente o el diseño es más liviana de analizar. Pero en militar, a las personas les gustan los modelos que los hacen notar adecuadamente. Parece que lo mismo es cierto para el trabajo de ajuste de maniquí interno de OpenAI.



Un ejemplo de los elogios excesivos de Chatgpt.

Crédito: /u /talvy

Un ejemplo de los elogios excesivos de Chatgpt.


Crédito: /u /talvy

Es posible que esta búsqueda de buenas vibraciones presione modelos para mostrar más comportamientos sycofánticos, lo cual es un problema. Alex Albert de Anthrope ha citado esto como un “circuito de feedback tóxica“. Un chatbot de IA que te dice que eres un ingenio de clase mundial que ve a los invisibles podría no ser perjudicial si solo estás haciendo una abundancia de ideas. Sin confiscación, el elogio interminable del maniquí puede sobrellevar a las personas que usan IA para planear empresas comerciales o, para el bóveda celeste no lo quitan, prometiendo aranceles radicales, para ser engañados para que se les haya topado con poco importante.

La búsqueda constante del compromiso ha sido un detrimento de numerosos productos en la era de Internet, y parece que la IA generativa no es inmune. La modernización GPT-4O de OpenAI es un evidencia de eso, pero con suerte, esto puede servir como un recordatorio para los desarrolladores de IA generativa de que las buenas vibraciones no son todo lo que importa.

Related Posts

Netflix Premium frente a Netflix Standard: comparé los planes de suscripciones para encontrar la mejor proposición

Elyse Betters Picaro / ZDNET Siga ZDNET: Agréganos como fuente preferida en Google. Tener una suscripción a Netflix no es negociable para algunas personas, especialmente aquellos que no quieren abonar…

Los juguetes con IA pueden programar problemas de seguridad para los niños, un nuevo estudio sugiere precaución

Un nuevo estudio de la Universidad de Cambridge encontró que Juguetes con IA para niños pequeños pueden malinterpretar las señales emocionales y son ineficaces para apoyar el entretenimiento crítico del…

You Missed

Muere cabreado marido de la locutora dominicana Mildre Aquino

Muere cabreado marido de la locutora dominicana Mildre Aquino

Netflix Premium frente a Netflix Standard: comparé los planes de suscripciones para encontrar la mejor proposición

Netflix Premium frente a Netflix Standard: comparé los planes de suscripciones para encontrar la mejor proposición

Dubai, feo pa’ la foto – Remolacha

Dubai, feo pa’ la foto – Remolacha

Enfermedad renal: invasión silenciosa – Diario Suelto

Enfermedad renal: invasión silenciosa – Diario Suelto

Los juguetes con IA pueden programar problemas de seguridad para los niños, un nuevo estudio sugiere precaución

Los juguetes con IA pueden programar problemas de seguridad para los niños, un nuevo estudio sugiere precaución

Informativo que fueron tendencia esta semana viernes 13 de febrero

Informativo que fueron tendencia esta semana viernes 13 de febrero