OpenAi se desconcertó ya que los nuevos modelos muestran tasas de espejismo crecientes

Los últimos modelos de razonamiento de Openai, O3 y O4-Mini, delirar con más frecuencia que los sistemas de IA anteriores de la compañía, según pruebas internas e investigaciones de terceros. En el punto de remisión Personqa de OpenAI, O3 alucinó el 33%del tiempo: duplique la tasa de modelos más antiguos O1 (16%) y O3-Mini (14.8%). El O4-Mini funcionó aún peor, alucinando el 48% del tiempo. La estructura sin fines de provecho AI Lab Transluce los procesos de fabricación de O3 descubiertos que afirmó usar, incluida la ejecución del código en un 2021 MacBook Pro “Fuera de ChatGPT”. El profesor adjunto de Stanford, Kian Katanforoosh, señaló que su equipo encontró que O3 genera con frecuencia los enlaces de sitios web rotos.

Operai dice en su mensaje técnico que “se necesita más investigación” para comprender por qué las alucinaciones empeoran a medida que los modelos de razonamiento aumentan.

Related Posts

Microsoft agrega copiloto al menú contextual de Windows 11, pero puede deshabilitarlo

Microsoft está encontrando nuevas formas de promocionar su asistente de IA, Copilot. Una nueva aggiornamento de la aplicación Copilot para Windows ha anejo un tropel en el menú contextual de…

Portar a otra máquina de Windows está a punto de ser mucho más obvio

Breviario Microsoft está desarrollando una aparejo para favorecer la migración de Windows. La aparejo transferirá datos entre dos computadoras en la misma red Wi-Fi. La característica puede ser particularmente útil…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Esclavitud farmacias Rite Aid cerrará todas sus tiendas en NY; dominicano se afectarían

Esclavitud farmacias Rite Aid cerrará todas sus tiendas en NY; dominicano se afectarían

Celebran huida de cinco opositores venezolanos

Celebran huida de cinco opositores venezolanos

Rusia disminuye intensidad de ataques nocturnos sobre Ucrania en vísperas de negociaciones

Rusia disminuye intensidad de ataques nocturnos sobre Ucrania en vísperas de negociaciones

TSA permitirá volatilizarse sin REAL ID a posteriori 7 de mayo; pasajeros podrían ser desviados a diferentes líneas

TSA permitirá volatilizarse sin REAL ID a posteriori 7 de mayo; pasajeros podrían ser desviados a diferentes líneas