OpenAi se desconcertó ya que los nuevos modelos muestran tasas de espejismo crecientes

Los últimos modelos de razonamiento de Openai, O3 y O4-Mini, delirar con más frecuencia que los sistemas de IA anteriores de la compañía, según pruebas internas e investigaciones de terceros. En el punto de remisión Personqa de OpenAI, O3 alucinó el 33%del tiempo: duplique la tasa de modelos más antiguos O1 (16%) y O3-Mini (14.8%). El O4-Mini funcionó aún peor, alucinando el 48% del tiempo. La estructura sin fines de provecho AI Lab Transluce los procesos de fabricación de O3 descubiertos que afirmó usar, incluida la ejecución del código en un 2021 MacBook Pro “Fuera de ChatGPT”. El profesor adjunto de Stanford, Kian Katanforoosh, señaló que su equipo encontró que O3 genera con frecuencia los enlaces de sitios web rotos.

Operai dice en su mensaje técnico que “se necesita más investigación” para comprender por qué las alucinaciones empeoran a medida que los modelos de razonamiento aumentan.

Related Posts

El Reino Unido planea exigir etiquetas en el contenido generado por IA

Un catedrático incógnito cita un noticia de Reuters: Gran Bretaña planea considere exigir etiquetas en el contenido generado por IA para proteger a los consumidores de la desinformación y las…

La aggiornamento de Firefox trae VPN integrada, paisaje dividida y más controles de adjudicatario

Mozilla ha anunciado una importante aggiornamento de Firefox que se implementará durante las próximas semanas, con Firefox 149 Su impulso está programado para el 24 de marzo. La aggiornamento agrega…

You Missed

El Reino Unido planea exigir etiquetas en el contenido generado por IA

El Reino Unido planea exigir etiquetas en el contenido generado por IA

INDRHI y Consejo Doméstico de Regantes coordinan acciones para reforzar el sistema de riego doméstico

INDRHI y Consejo Doméstico de Regantes coordinan acciones para reforzar el sistema de riego doméstico

Banreservas inaugura tercera Feria Inmobiliaria en Nueva York y Lawrence con tasas desde 9.50%

Banreservas inaugura tercera Feria Inmobiliaria en Nueva York y Lawrence con tasas desde 9.50%

EU: Pentágono anuncia diálogo con Rusia cuestiones nucleares | AlMomento.net

EU: Pentágono anuncia diálogo con Rusia cuestiones nucleares | AlMomento.net

EEUU: La Fed apunta el conflicto de Irán afectará a la inflación | AlMomento.net

EEUU: La Fed apunta el conflicto de Irán afectará a la inflación | AlMomento.net

La aggiornamento de Firefox trae VPN integrada, paisaje dividida y más controles de adjudicatario

La aggiornamento de Firefox trae VPN integrada, paisaje dividida y más controles de adjudicatario