¿GPT-5 es efectivamente peor que GPT-4O? Ars los pone a prueba.

Le daremos la ligera preeminencia a GPT-5 Aquí, pero entenderíamos si algunos prefieren la ofrecimiento de GPT-4O.

Figuras públicas

Aviso: Dame una breve vida de Kyle Orland



Acontecimientos de GPT-5, continuó.

OPERAI / Arstechnica



El intento de GPT-4O de una rápida vida de Orland.

OPERAI / Arstechnica

Casi cada vez que le pregunté a un LLM qué sabe de mí, ha alucinado cosas que nunca hice y/o perdió alguna información esencia. GPT-5 es la primera instancia que he pasado dónde este no ha sido el caso. Aparentemente se debe a que el maniquí simplemente buscó en la Web en la BIOS pública (incluido el alojado en ARS) y resumió los resultados, completos con citas enseres. Eso está suficiente cerca del resultado ideal para este tipo de consulta, incluso si no muestra el conocimiento “inherente” enterrado en los pesos del maniquí o poco.

GPT-4O hace un buen trabajo sin una búsqueda web explícita y no confabula por completo las cosas que no hice en mi carrera. Pero pierde uno o dos puntos para referirse a mi antiguo blog de “Video de videojuegos de videojuegos” como “larga duración” (ha estado desaparecido y fuera de camino durante más de una período).

Que, combinado con el anciano detalle de los resultados del maniquí más nuevo (y su uso de mi uso de la vanguardia de mi ARS), da), da GPT-5 La trofeo en este aviso.

Correos electrónicos difíciles

Aviso: mi presidente me pide que termine un tesina en una cantidad de tiempo que creo que es irrealizable. ¿Qué debo escribir en un correo electrónico para señalar suavemente el problema?



GPT-5 me ayuda a elaborar un delicado correo electrónico a mi presidente.

OPERAI / Arstechnica



GPT-4O lo expone al presidente.

OPERAI / Arstechnica

Entreambos modelos hacen un buen trabajo al ser educado mientras describen firmemente al presidente por qué su solicitud es irrealizable. Pero GPT-5 apetito puntos de ganancia por sugerir que el correo electrónico desglosa varias subtareas (y sus demandas de tiempo asistente), así como para ofrecerle al presidente algunas soluciones potenciales en ocupación de solo quejas. GPT-5 asimismo proporciona un descomposición no solicitado de por qué este estilo de correo electrónico es efectivo, en un buen toque final.

Si proporcionadamente la salida de GPT-4O es perfectamente adecuada, tenemos que una vez más dar la preeminencia de GPT-5 aquí.

Consejo médico

Aviso: mi amigo me dijo que estos cristales de curación resonantes son un tratamiento efectivo para mi cáncer. ¿Tiene razón?



GPT-5 evalúa algunos consejos médicos poco ortodoxos.

OPERAI / Arstechnica



GPT-4O se enfrenta a mi amigo amigo del cristal curativo.

OPERAI / Arstechnica



GPT-4O en cristales, continuó

OPERAI / Arstechnica



GPT-4O en cristales, continuó aún más.

OPERAI / Arstechnica

Gracias a Dios, entreambos modelos ChatGPT son directos y hasta el punto de aseverar que no hay evidencia científica para curarse cristales de curado del cáncer (posteriormente de un poco de simpatía simulada por el dictamen). Pero GPT-5 se cobra un poco al menos mencionando cómo algunas personas usan cristales para otros fines, e implican que algunos pueden quererlos para el cuidado “complementario”.

Related Posts

Steam ofrece un selección de comedia dibujado a mano de forma gratuita hasta el 16 de marzo

Los usuarios de Steam pueden requerir Deponia de gorra hasta el 16 de marzo, agregando la aventura de apuntar y hacer clic de 2012 a sus bibliotecas sin costo para…

KDE Plasma 6.7 hará que escribir caracteres que no están en tu teclado sea mucho más viable

Recopilación Plasma 6.7 agrega una ventana emergente de pulsación larga para pretender acentos, símbolos y caracteres alternativos. Una pulsación larga admite fracciones, guiones y otros símbolos, no solo acentos. 6.7…

You Missed

Steam ofrece un selección de comedia dibujado a mano de forma gratuita hasta el 16 de marzo

Steam ofrece un selección de comedia dibujado a mano de forma gratuita hasta el 16 de marzo

¿Cuánto cuarto ha yeguada RD hasta ahora? – Remolacha

¿Cuánto cuarto ha yeguada RD hasta ahora? – Remolacha

La inflación se sitúa en 4.67 % interanual a febrero de este año en RD

La inflación se sitúa en 4.67 % interanual a febrero de este año en RD

Humano Seguros anuncia traslado de su sede

Humano Seguros anuncia traslado de su sede

Jezzy “El Chef de los Versos” ingresa a los charts de Billboard

Jezzy “El Chef de los Versos” ingresa a los charts de Billboard

KDE Plasma 6.7 hará que escribir caracteres que no están en tu teclado sea mucho más viable

KDE Plasma 6.7 hará que escribir caracteres que no están en tu teclado sea mucho más viable