
Operai lanzó dos poderosos modelos de razonamiento hace unos días que hacen que Chatgpt sea aún más impresionante. Estos son O3 y O4-Mini que puedes probar de inmediato en ChatGPT. Son mucho mejores en el razonamiento que sus predecesores y pueden sobresalir en la codificación y las matemáticas si esos son sus pasatiempos.
Sin retención, la nueva función de cambio de comienzo de ChatGPT en O3 y O4-Mini es, al menos para mí, la capacidad de la IA para interpretar los datos en las imágenes. Esencialmente, ChatGPT tiene una visión por computadora como en las películas, incluidas las capacidades de razonamiento que permiten que la IA extraiga los datos de ubicación de las fotos. Puedes preguntarle a la IA: “¿Dónde se tomó esta foto?” Y la IA hará todo lo que esté en su poder para objetar.
Chatgpt O3 y O4-Mini obtendrán las cosas adecuadamente, como estás a punto de ver en mi prueba en extremo científica que sigue. Es afirmar, harán las cosas adecuadamente incluso si trato de usar AI para engañar a Chatgpt.
Porque sí, usé GPT-4O Generation para crear una foto realista de una ubicación de esquí adecuadamente conocida en los Alpes en área de subir una imagen existente. Luego le dije a ChatGPT que alterara esa imagen de una modo que cambiaría el horizonte.
Posteriormente de eso, comencé nuevas chats con O3 y O4-Mini, convencido de que ChatGPT reconocería la ubicación en la foto falsa que acababa de remitir. No me equivoqué; Uno y otro modelos me dieron el resultado que esperaba, demostrando que puede usar contenido generado por IA para engañar a la IA. Pero, sin retención, me volaron la mente.
Recientemente le expliqué cómo los algoritmos de Apple Watch me decepcionan mientras esquiaba la semana pasada, y eso es lo que usé como inspiración en mi cuestionario para engañar a la IA.
Le pedí a ChatGPT que generara una foto que mostrara el conocido Matterhorn Peak en un día soleado, con esquiadores disfrutando de su tiempo. La foto tenía que tener una relación de aspecto de 16: 9 y parecerse a una foto de iPhone.

Le dije a la IA que pusiera una guagua por si suerte, pero, como puede ver en el primer intento, que Embarcación no iba a lugares. No importa; Solo necesitaba una primera imagen de la IA para poder alterarla. Ingrese la posterior imagen:
Le indiqué a ChatGPT que eliminara la guagua y colocara un pico más pequeño de Matterhorn alrededor de la derecha.

Tomé una captura de pantalla de la imagen para que no preservara ningún metadato, y luego convertí el archivo en una foto JPG:

Luego, comencé dos chats separados, con Chatgpt O3 y Chatgpt O4-Mini, donde subí la foto falsa de Matterhorn y le pedí a la IA que me dijera dónde se tomó la foto y cómo la descubrieron.
Como era de esperar, los dos modelos de IA de razonamiento identificaron con éxito Matterhorn como la ubicación.
Chatgpt o3
Primero, tenemos O3, que me dio amplios detalles sobre cómo determinó la ubicación. La IA tiene una confianza increíblemente segura en su respuesta, diciéndome que “picos flanqueantes como el Dent Blanche y Weisshorn” son letreros.

Tenía una sonrisa en mi rostro. Había vencido a la IA, con ai Haciéndolo investigar la ubicación en una foto falsa. Era aún mejor que el O3 estuviera tan seguro de sí mismo posteriormente de solo 34 segundos de pensamiento.

Pero luego pensé que empujaría las cosas más para que pudiera vigilar que la imagen era falsa. Le pedí que dibujara círculos sobre Dent Blanche y Weisshorn.

Aquí es donde ver a O3 en movimiento me voló. Esta vez, la IA pasó casi seis minutos mirando la foto, tratando de identificar de modo confiable los dos picos que dijo que podía ver en la distancia.
Como verá, el Mini Matterhorn a la derecha inmediatamente arrojó la IA, pero Chatgpt no se detuvo allí. Seguía mirando la foto y buscó en la web imágenes de la región Alps donde se encuentran estos picos.

Asimismo observó la foto para determinar la ubicación relativa de los picos adicionales en la región. “Puedo intentar superponer a los máximos locales aproximados basados en el brillo, pero honestamente, creo que es más posible usar mis fanales para esto”, pensó O3, y me sorprendió leerlo.

La IA pasó a acercarse para ver mejor las partes de la foto de IA falsa:

Recortó partes de la imagen tratando de descubrir detalles que esperaría estar allí en una foto existente de las áreas que rodean el Matterhorn. En su cautiverio de pensamiento, Chatgpt dijo que no podía detectar formas de montaña que pensaba que debería estar allí.

La IA comenzó a anotar la imagen, buscando la respuesta mientras continuaba buscando en la web más imágenes que lo ayudarían a determinar la ubicación de los dos picos que le pedí que colocara círculos rojos.
Como puede ver, el simulado Mini-Matterhorn a la derecha seguía engañando a la IA.

En última instancia, ChatGPT O3 reconoció las incertidumbres, pero aún así decidió marcar los dos picos que pedí. Ejecutó el código en el chat y me dio la posterior imagen.
Me hubiera encantado ver Chatgpt O3 denominar a mi candil y decirme que esta foto no es existente. Quizás las versiones futuras de la IA puedan hacerlo. Pero debo afirmar que ojear esos cinco minutos de “pensamiento”, la mayoría de ellos vistos en la imagen de en lo alto, fue aún mejor.

Me mostró que AI está trabajando para hacer el trabajo y acrecentar mi idea de que la visión por computadora de IA es increíble en estas nuevas versiones de ChatGPT.
Pero dilación, se vuelve mejor.
Chatgpt o4-mini
Mi cuestionario no se puede hacer sin usar ChatGpt O4-Mini. Posteriormente de todo, O4-Mini es el precursor de O4, que debería ser incluso mejor que O3. O4-Mini fue mucho más rápido que O3 al darme la respuesta.

La IA pensó durante 15 segundos, durante los cuales apareció imágenes de Internet para respaldar su opinión que la foto que había subido era una imagen existente del Matterhorn.
O4-Mini asimismo explicó cómo identificaba la ubicación, pero se sentía seguro de que era correcto al respecto. Este es el Matterhorn, regalado todo lo que ha aprendido de la Web.

A diferencia de ChatGPT O3, O4-Mini no mencionó los picos adicionales. Pero le pedí a O4-Mini que hiciera lo mismo que O3: Identifique a Dent Blanche y Weisshorn.
O4-Mini me voló con su velocidad aquí. Tomó 18 segundos darme la posterior imagen, que tiene círculos rojos en torno a de los dos picos.

Sí, no es un gran trabajo, y no tengo idea de por qué la IA coloca esos círculos allí porque la transcripción más limitada de la cautiverio de pensamiento no lo explica.
Obviamente es incorrecto, considerando que estamos trabajando con una imagen de IA falsa aquí. Y sí, O4-Mini no podía afirmar que la foto era falsa.
El efectivo materia
Las conclusiones son obvias, y no todas son grandes telediario.
Primero, la vivientes de imágenes 4O puede ser fácilmente abusada. En existencia, nunca he gastado el Matterhorn en persona, y por eso le pedí a la IA que hiciera esta imagen específica. Reconocí su famosa silueta de las fotos de la vida existente, pero definitivamente no estoy familiarizado con los otros picos de la región. Esto demuestra que las imágenes creadas por Chatgpt pueden engañar a las personas. Asimismo pueden engañar a otros modelos de IA.
En segundo área, O3 y O4-Mini son simplemente increíbles al analizar los datos en las imágenes. Por supuesto, tienen que serlo. Si 4O puede crear fotos impresionantes y realistas, es porque la IA puede interpretar los datos en las imágenes.
En tercer área, encontrar información de ubicación de las fotos será trivialmente posible para modelos OpenAI como O3 y O4-Mini. Los competidores probablemente obtendrán poderes similares. Este es un problema de privacidad que tendremos que tener en cuenta en el futuro.
Cuarto, ChatGPT O3 se toma muy en serio el trabajo de razonamiento. Si pasó todo ese tiempo en una foto de IA falsa tratando de igualarlo con el mundo existente, pasará un tiempo similar en otros trabajos que podría lanzarle, y usará un montón de herramientas disponibles en ChatGPT (como codificación, búsqueda web, manipulación de imágenes) para hacer el trabajo.
Estoy seguro de que si hubiera pasado más tiempo con el razonamiento de la IA sobre la imagen, finalmente llegaríamos a la conclusión de que la imagen que la IA estaba investigando era falsa.
Botellín, ChatGpt O4-Mini puede ser verdaderamente rápido. Demasiado rápido. Es poco que quieres de Genai Chatbots, pero asimismo poco de lo que preocuparse. O4-Mini siquiera reconoció la foto falsa, pero su enfoque era mucho más descuidado. Eso me hace pensar que debes prestar atención adicional al trabajar con la interpretación Mini para apuntalar que la IA haga el trabajo. Pero bueno, estoy trabajando con un cuestionario muy establecido aquí.
Finalmente, aquí está el Matterhorn y el radio circundante de un clip de YouTube que se cargó en diciembre de 2020. Digo que, porque, en la era de la IA, el video que estás a punto de ver siempre podría ser simulado. El video te brinda una “clarividencia desde en lo alto del Nordwand de Weisshorn mirando alrededor de Matterhorn (L) y Dent Blanche (R). Mt Blanc es visible en la distancia (remotamente R)”. Es un ángulo diferente, pero al menos lo suficientemente bueno como para darle una idea de lo que Chatgpt O3 estaba buscando.