‘Gemini 2.5 Computer Use’ tiene un sólido rendimiento web y Android

Google es ahora dejando Los desarrolladores obtienen una traza previa del maniquí de uso de computadora Gemini 2.5 detrás de Project Mariner y las funciones agentes en modo AI.

Este “maniquí especializado” puede interactuar con interfaces gráficas de afortunado, específicamente navegadores y sitios web. Hay varios pasos que suceden en un tirabuzón “hasta que se completa la tarea”.

  • Cursar una solicitud al maniquí: las entradas incluyen la “solicitud del afortunado, una captura de pantalla del entorno y un historial de acciones recientes”.
  • “Luego, el maniquí analiza estas entradas y genera una respuesta, generalmente una señal de función que representa una de las acciones de la interfaz de afortunado, como hacer clic o escribir”.
  • Reciba la respuesta del maniquí: “… el código del banda del cliente luego ejecuta la obra recibida”.
  • “Posteriormente de ejecutar la obra, se envía una nueva captura de pantalla de la GUI y la URL presente al maniquí de uso de la computadora como respuesta de la función reiniciando el ciclo”.

Otras acciones de la interfaz de afortunado admitidas por el maniquí incluyen retroceder/delante, apañarse en la web, navegar a una URL específica, desplazar el cursor, combinaciones de teclado, desplazarse y tirar/soltar.

Google compartió dos ejemplos (a velocidad 3X) con las siguientes indicaciones:

Anuncio: desplácese para ver más contenido

“De https://tinyurl.com/pet-care-signupobtenga todos los detalles de cualquier mascota con residencia en California y agréguela como invitada en mi CRM de spa en https://pet-luxe-spa.web.app/. Luego, programe una cita de invitado de seguimiento con el experto Anima Enjuagar para el 10 de octubre en cualquier momento posteriormente de las 8 a.m. El motivo de la invitado es el mismo que el tratamiento solicitado”.

Mi club de arte propuso tareas antaño de nuestra feria. El tablero es caótico y necesito tu ayuda para organizar las tareas en algunas categorías que creé. Ir a sticky-note-jam.web.app y asegúrese de que las notas estén claramente en las secciones correctas. Arrástralos allí si no”.

Gemini 2.5 Computer Use está “optimizado principalmente para navegadores web”. Sin requisa, Google tiene un punto de remisión “AndroidWorld” que “demuestra una gran promesa para las tareas de control de la interfaz de afortunado móvil”, mientras que “aún no está optimizado para el control a nivel del sistema eficaz de escritorio”.

Google demostró un sólido rendimiento en los puntos de remisión de control web y móvil en comparación con la ofrecimiento de Claude y OpenAI, así como “calidad líder para el control del navegador con la latencia más desprecio”.

Este maniquí se base en las capacidades de razonamiento y comprensión visual de Gemini 2.5 Pro. Google dice que “versiones de este maniquí” impulsan las capacidades agentes del Plan Mariner y AI Mode. Se ha utilizado internamente para pruebas de interfaz de afortunado para acelerar el crecimiento de software, mientras que Google tiene un software de acercamiento temprano para desarrolladores externos que crean asistentes y herramientas de automatización del flujo de trabajo.

Gemini 2.5 Computer Use está adecuado en lectura preliminar pública hoy a través de la API Gemini en Google AI Studio y Vertex AI.

Pruébalo ahora: En un entorno de demostración alojado por Pulvínulo del navegador.

Agregue 9to5Google como fuente preferida en Google
Agregue 9to5Google como fuente preferida en Google

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Related Posts

Nunca volveré a usar solo los parlantes del televisor posteriormente de actualizarme a un sistema de cine en casa Sonos, y esta proposición oficial es un buen momento para comprobar la diferencia por ti mismo.

Sonos es semejante de cine en casa y audio inalámbrico para varias habitaciones, y es conocido desde hace mucho tiempo por fraguar algunos de los mejores parlantes inalámbricos y las…

Windows necesita desesperadamente su propia MacBook Neo, pero parece inverosímil de construir

La MacBook Neo es uno de esos productos que instantáneamente hace que el resto del mercado parezca incómodo. A $599, o $499 para estudiantes, Apple ha conseguido propalar una computadora…

You Missed

Nunca volveré a usar solo los parlantes del televisor posteriormente de actualizarme a un sistema de cine en casa Sonos, y esta proposición oficial es un buen momento para comprobar la diferencia por ti mismo.

Nunca volveré a usar solo los parlantes del televisor posteriormente de actualizarme a un sistema de cine en casa Sonos, y esta proposición oficial es un buen momento para comprobar la diferencia por ti mismo.

Dominicana vence 7-5 a Venezuela con cuatro jonrones y avanza invicta en el Clásico Mundial

Dominicana vence 7-5 a Venezuela con cuatro jonrones y avanza invicta en el Clásico Mundial

La sonda Van Allen de la NASA reingresa a la Tierra por el Pacífico sin causar daños

La sonda Van Allen de la NASA reingresa a la Tierra por el Pacífico sin causar daños

Exreina de belleza enfrenta cargos por la crimen de su bebé – Remolacha

Exreina de belleza enfrenta cargos por la crimen de su bebé – Remolacha

Trasladan a Ciudad Nueva a reo implicado en asalto a platería – Remolacha

Trasladan a Ciudad Nueva a reo implicado en asalto a platería – Remolacha

Windows necesita desesperadamente su propia MacBook Neo, pero parece inverosímil de construir

Windows necesita desesperadamente su propia MacBook Neo, pero parece inverosímil de construir