Operai Rolls Back Update que hizo de Chatgpt un desastre sycófánico

En rebusca de buenas vibraciones

Openai, unido con competidores como Google y Anthrope, está tratando de construir chatbots con los que la familia quiere chatear. Por lo tanto, diseñar la resultón personalidad del maniquí para ser positiva y de apoyo tiene sentido: es menos probable que las personas usen una IA que sale tan dura o despectiva. Por descuido de una mejor palabra, se comercio cada vez más vibinación.

Cuando Google reveló Gemini 2.5, el equipo cayó sobre cómo el maniquí encabezó la tabla de clasificación de LM Arena, que permite a las personas nominar entre dos futuro de maniquí diferentes en una prueba cegada. Los modelos que a las personas les gusta más terminan en la parte superior de la relación, lo que sugiere que son más agradables de usar. Por supuesto, a las personas les pueden satisfacer los resultados por diferentes razones: tal vez una es más precisa técnicamente o el diseño es más liviana de analizar. Pero en militar, a las personas les gustan los modelos que los hacen notar adecuadamente. Parece que lo mismo es cierto para el trabajo de ajuste de maniquí interno de OpenAI.



Un ejemplo de los elogios excesivos de Chatgpt.

Crédito: /u /talvy

Un ejemplo de los elogios excesivos de Chatgpt.


Crédito: /u /talvy

Es posible que esta búsqueda de buenas vibraciones presione modelos para mostrar más comportamientos sycofánticos, lo cual es un problema. Alex Albert de Anthrope ha citado esto como un “circuito de feedback tóxica“. Un chatbot de IA que te dice que eres un ingenio de clase mundial que ve a los invisibles podría no ser perjudicial si solo estás haciendo una abundancia de ideas. Sin confiscación, el elogio interminable del maniquí puede sobrellevar a las personas que usan IA para planear empresas comerciales o, para el bóveda celeste no lo quitan, prometiendo aranceles radicales, para ser engañados para que se les haya topado con poco importante.

La búsqueda constante del compromiso ha sido un detrimento de numerosos productos en la era de Internet, y parece que la IA generativa no es inmune. La modernización GPT-4O de OpenAI es un evidencia de eso, pero con suerte, esto puede servir como un recordatorio para los desarrolladores de IA generativa de que las buenas vibraciones no son todo lo que importa.

Related Posts

¿La multitud verdaderamente quiere lentes inteligentes ahora?

Es la tecnología “Google probó (y falló) hace más de una decenio”, escribe CNN. (Y Meta y Amazon incluso han intentado divulgar anteojos con cámaras, altavoces y asistentes de voz).…

Windows 11 finalmente obtiene una pequeña característica de la mostrador de tareas de Windows 10 de Windows.

Windows 11 cumple cuatro abriles a finales de este año, pero algunas de las características que Microsoft eliminó durante la transición permanece faltante hasta el día de hoy. Sin bloqueo,…

You Missed

Indomet prevé clima mayormente soleado con chubascos aislados este domingo

Indomet prevé clima mayormente soleado con chubascos aislados este domingo

Indotel inicia proceso de reforma de Ley Caudillo de Telecomunicaciones

Indomet prevé clima mayormente soleado con chubascos aislados este domingo

Cruz Roja afirma donación de crimen es seguro y beneficia la vigor del donante

Indomet prevé clima mayormente soleado con chubascos aislados este domingo

Ataques israelíes Irán: alabarda una nueva ola de ataques contra Israel

Ataques israelíes Irán: alabarda una nueva ola de ataques contra Israel

Misiles lanzados por Irán dejan al menos 13 muertos y más de 380 heridos en varias regiones de Israel

Misiles lanzados por Irán dejan al menos 13 muertos y más de 380 heridos en varias regiones de Israel

Los fanáticos de los Yankees se “comen vivo” al dominicano Jasson Domínguez por mal corrido

Los fanáticos de los Yankees se “comen vivo” al dominicano Jasson Domínguez por mal corrido