Operai Rolls Back Update que hizo de Chatgpt un desastre sycófánico

En rebusca de buenas vibraciones

Openai, unido con competidores como Google y Anthrope, está tratando de construir chatbots con los que la familia quiere chatear. Por lo tanto, diseñar la resultón personalidad del maniquí para ser positiva y de apoyo tiene sentido: es menos probable que las personas usen una IA que sale tan dura o despectiva. Por descuido de una mejor palabra, se comercio cada vez más vibinación.

Cuando Google reveló Gemini 2.5, el equipo cayó sobre cómo el maniquí encabezó la tabla de clasificación de LM Arena, que permite a las personas nominar entre dos futuro de maniquí diferentes en una prueba cegada. Los modelos que a las personas les gusta más terminan en la parte superior de la relación, lo que sugiere que son más agradables de usar. Por supuesto, a las personas les pueden satisfacer los resultados por diferentes razones: tal vez una es más precisa técnicamente o el diseño es más liviana de analizar. Pero en militar, a las personas les gustan los modelos que los hacen notar adecuadamente. Parece que lo mismo es cierto para el trabajo de ajuste de maniquí interno de OpenAI.



Un ejemplo de los elogios excesivos de Chatgpt.

Crédito: /u /talvy

Un ejemplo de los elogios excesivos de Chatgpt.


Crédito: /u /talvy

Es posible que esta búsqueda de buenas vibraciones presione modelos para mostrar más comportamientos sycofánticos, lo cual es un problema. Alex Albert de Anthrope ha citado esto como un “circuito de feedback tóxica“. Un chatbot de IA que te dice que eres un ingenio de clase mundial que ve a los invisibles podría no ser perjudicial si solo estás haciendo una abundancia de ideas. Sin confiscación, el elogio interminable del maniquí puede sobrellevar a las personas que usan IA para planear empresas comerciales o, para el bóveda celeste no lo quitan, prometiendo aranceles radicales, para ser engañados para que se les haya topado con poco importante.

La búsqueda constante del compromiso ha sido un detrimento de numerosos productos en la era de Internet, y parece que la IA generativa no es inmune. La modernización GPT-4O de OpenAI es un evidencia de eso, pero con suerte, esto puede servir como un recordatorio para los desarrolladores de IA generativa de que las buenas vibraciones no son todo lo que importa.

Related Posts

Apple MacBook Neo supera a la CPU de PC x86 única en rendimiento de un solo núcleo

Los primeros puntos de relato muestran la MacBook Neo con tecnología A18 Pro superando a todas las CPU x86 actuales en rendimiento Cinebench de un solo núcleoincluidos chips de Intel…

Google Play presenta “pruebas de juegos” para permitir a los usuarios probar juegos pagos de forma gratuita

Google ha anunciado una nueva Pruebas de recreo función para Google Play que permite a los usuarios probar juegos pagos antaño de comprarlos. El sistema permite a los jugadores conseguir…

You Missed

CADSECI y entidades de la UTO concluyen subsistencia de cifras de homicidios de 2025

CADSECI y entidades de la UTO concluyen subsistencia de cifras de homicidios de 2025

Onesvie fortalece capacidades técnicas de sus colaboradores con capacitación en Ingeniería Forense

Onesvie fortalece capacidades técnicas de sus colaboradores con capacitación en Ingeniería Forense

Realizan construcción de aceras y contenes en distintos puntos de Higüey

Realizan construcción de aceras y contenes en distintos puntos de Higüey

Investigador INTEC desarrolla aplicación evaluación puentes | AlMomento.net

Investigador INTEC desarrolla aplicación evaluación puentes | AlMomento.net

El gobierno cubano confirma «conversaciones» con EE.UU. | AlMomento.net

El gobierno cubano confirma «conversaciones» con EE.UU. | AlMomento.net

Apple MacBook Neo supera a la CPU de PC x86 única en rendimiento de un solo núcleo

Apple MacBook Neo supera a la CPU de PC x86 única en rendimiento de un solo núcleo