Operai Rolls Back Update que hizo de Chatgpt un desastre sycófánico

En rebusca de buenas vibraciones

Openai, unido con competidores como Google y Anthrope, está tratando de construir chatbots con los que la familia quiere chatear. Por lo tanto, diseñar la resultón personalidad del maniquí para ser positiva y de apoyo tiene sentido: es menos probable que las personas usen una IA que sale tan dura o despectiva. Por descuido de una mejor palabra, se comercio cada vez más vibinación.

Cuando Google reveló Gemini 2.5, el equipo cayó sobre cómo el maniquí encabezó la tabla de clasificación de LM Arena, que permite a las personas nominar entre dos futuro de maniquí diferentes en una prueba cegada. Los modelos que a las personas les gusta más terminan en la parte superior de la relación, lo que sugiere que son más agradables de usar. Por supuesto, a las personas les pueden satisfacer los resultados por diferentes razones: tal vez una es más precisa técnicamente o el diseño es más liviana de analizar. Pero en militar, a las personas les gustan los modelos que los hacen notar adecuadamente. Parece que lo mismo es cierto para el trabajo de ajuste de maniquí interno de OpenAI.



Un ejemplo de los elogios excesivos de Chatgpt.

Crédito: /u /talvy

Un ejemplo de los elogios excesivos de Chatgpt.


Crédito: /u /talvy

Es posible que esta búsqueda de buenas vibraciones presione modelos para mostrar más comportamientos sycofánticos, lo cual es un problema. Alex Albert de Anthrope ha citado esto como un “circuito de feedback tóxica“. Un chatbot de IA que te dice que eres un ingenio de clase mundial que ve a los invisibles podría no ser perjudicial si solo estás haciendo una abundancia de ideas. Sin confiscación, el elogio interminable del maniquí puede sobrellevar a las personas que usan IA para planear empresas comerciales o, para el bóveda celeste no lo quitan, prometiendo aranceles radicales, para ser engañados para que se les haya topado con poco importante.

La búsqueda constante del compromiso ha sido un detrimento de numerosos productos en la era de Internet, y parece que la IA generativa no es inmune. La modernización GPT-4O de OpenAI es un evidencia de eso, pero con suerte, esto puede servir como un recordatorio para los desarrolladores de IA generativa de que las buenas vibraciones no son todo lo que importa.

Related Posts

Por fin, auriculares inalámbricos que suenan muy proporcionadamente, se sienten cómodos y no rompen el faja

Takeaways de contraseña de ZDNET Los auriculares Baseus MC1 están disponibles ahora en Amazon por $ 69 Aunque el sonido de los auriculares MC1 no te dejará patidifuso, la comodidad…

Las respuestas de NYT Mini Crossword de hoy para el 15 de junio

Buscando el mas nuevo ¿Mini respuesta de crucigrama? Haga clic aquí para ver las mini sugerencias de crucigramas de hoy, así como nuestras respuestas y sugerencias diarias para el Wordle,…

You Missed

Por fin, auriculares inalámbricos que suenan muy proporcionadamente, se sienten cómodos y no rompen el faja

Por fin, auriculares inalámbricos que suenan muy proporcionadamente, se sienten cómodos y no rompen el faja

El canal causará diluvio con tormentas eléctricas

El canal causará diluvio con tormentas eléctricas

Independencia y soberanía

Independencia y soberanía

Tyson Pérez calma audacia de FIBA para juguetear con Dominicana | AlMomento.net

Tyson Pérez calma audacia de FIBA para juguetear con Dominicana | AlMomento.net

Así somos

Así somos

14 de junio

14 de junio