Operai Rolls Back Update que hizo de Chatgpt un desastre sycófánico

En rebusca de buenas vibraciones

Openai, unido con competidores como Google y Anthrope, está tratando de construir chatbots con los que la familia quiere chatear. Por lo tanto, diseñar la resultón personalidad del maniquí para ser positiva y de apoyo tiene sentido: es menos probable que las personas usen una IA que sale tan dura o despectiva. Por descuido de una mejor palabra, se comercio cada vez más vibinación.

Cuando Google reveló Gemini 2.5, el equipo cayó sobre cómo el maniquí encabezó la tabla de clasificación de LM Arena, que permite a las personas nominar entre dos futuro de maniquí diferentes en una prueba cegada. Los modelos que a las personas les gusta más terminan en la parte superior de la relación, lo que sugiere que son más agradables de usar. Por supuesto, a las personas les pueden satisfacer los resultados por diferentes razones: tal vez una es más precisa técnicamente o el diseño es más liviana de analizar. Pero en militar, a las personas les gustan los modelos que los hacen notar adecuadamente. Parece que lo mismo es cierto para el trabajo de ajuste de maniquí interno de OpenAI.



Un ejemplo de los elogios excesivos de Chatgpt.

Crédito: /u /talvy

Un ejemplo de los elogios excesivos de Chatgpt.


Crédito: /u /talvy

Es posible que esta búsqueda de buenas vibraciones presione modelos para mostrar más comportamientos sycofánticos, lo cual es un problema. Alex Albert de Anthrope ha citado esto como un “circuito de feedback tóxica“. Un chatbot de IA que te dice que eres un ingenio de clase mundial que ve a los invisibles podría no ser perjudicial si solo estás haciendo una abundancia de ideas. Sin confiscación, el elogio interminable del maniquí puede sobrellevar a las personas que usan IA para planear empresas comerciales o, para el bóveda celeste no lo quitan, prometiendo aranceles radicales, para ser engañados para que se les haya topado con poco importante.

La búsqueda constante del compromiso ha sido un detrimento de numerosos productos en la era de Internet, y parece que la IA generativa no es inmune. La modernización GPT-4O de OpenAI es un evidencia de eso, pero con suerte, esto puede servir como un recordatorio para los desarrolladores de IA generativa de que las buenas vibraciones no son todo lo que importa.

Related Posts

Desmontaje del prototipo de cubierta de vapor de $ 3,000: las unidades conceptuales tenían soporte discreto de GPU, joysticks más pequeños, paneles de toque circulares

Un creador de YouTube ha podido tener en sus manos un prototipo temprano de la cubierta de vapor (muestra de ingeniería 34) y lo desmontó a la cámara para mostrar…

NYT Strands sugiere y respuestas para el lunes 16 de junio (Ocio #470)

¿Buscas un día diferente? Un nuevo rompecabezas de NYT Strands aparece a la medianoche cada día para su zona horaria, lo que significa que algunas personas siempre están jugando ‘Ocio…

You Missed

Alcaldía de Santiago declara a La Sophy como “Visitante Distinguida”

Alcaldía de Santiago declara a La Sophy como “Visitante Distinguida”

El Festival Guadalajara cierra con traje de premios

El Festival Guadalajara cierra con traje de premios

Desmontaje del prototipo de cubierta de vapor de $ 3,000: las unidades conceptuales tenían soporte discreto de GPU, joysticks más pequeños, paneles de toque circulares

Desmontaje del prototipo de cubierta de vapor de $ 3,000: las unidades conceptuales tenían soporte discreto de GPU, joysticks más pequeños, paneles de toque circulares

Corro de Medios Panorama se integra a la SIP

Corro de Medios Panorama se integra a la SIP

Banreservas celebra caminata bancarización

Banreservas celebra caminata bancarización

Declaran a La Sophy como Visitante Distinguida de Santiago – Remolacha

Declaran a La Sophy como Visitante Distinguida de Santiago – Remolacha