Construí castillos de malvaviscos en el nuevo magneto mundial de inteligencia industrial de Google

Google DeepMind está abriendo el comunicación a Project Genie, su útil de inteligencia industrial para crear mundos de juegos interactivos a partir de mensajes de texto o imágenes.

A partir del jueves, los suscriptores de Google AI Intolerante en los EE. UU. pueden pugnar con el prototipo de investigación real, que funciona con una combinación del final maniquí mundial de Google, Genie 3, su maniquí de procreación de imágenes Nano Plátano Pro y Gemini.

Cinco meses posteriormente de la sagacidad previa de la investigación de Genie 3, la medida es parte de un impulso más amplio para resumir comentarios de los usuarios y datos de entrenamiento mientras DeepMind se apresura a desarrollar modelos mundiales más capaces.

Los modelos mundiales son sistemas de inteligencia industrial que generan una representación interna de un entorno y pueden estilarse para predecir resultados futuros y planificar acciones. Muchos líderes de IA, incluidos los de DeepMind, creen que los modelos mundiales son un paso crucial para conseguir la inteligencia industrial universal (AGI). Pero a corto plazo, laboratorios como DeepMind imaginan un plan de comercialización que comienza con videojuegos y otras formas de entretenimiento y se expande cerca de el entrenamiento de agentes encarnados (incluso conocidos como robots) en simulación.

El dispersión de Project Genie por parte de DeepMind se produce cuando la carrera por los modelos mundiales está comenzando a calentarse. World Labs de Fei-Fei Li lanzó a finales del año pasado su primer producto comercial llamado Marble. Runway, la startup de procreación de videos con IA, incluso lanzó recientemente un maniquí mundial. Y la startup AMI Labs del ex irrefutable patrón de Meta, Yann LeCun, incluso se centrará en el expansión de modelos mundiales.

“Creo que es emocionante estar en un división donde podemos tener comunicación a más personas y darnos su opinión”, dijo a TechCrunch Shlomi Fruchter, directora de investigación de DeepMind, a través de una entrevista en video, sonriendo de oreja a oreja con evidente entusiasmo por el dispersión de Project Genie.

Los investigadores de DeepMind con los que habló TechCrunch fueron sinceros sobre la naturaleza real de la útil. Puede ser inconsistente, a veces genera mundos jugables de forma impresionante, otras veces produce resultados desconcertantes que no dan en el blanco. Así es como funciona.

Evento tecnológico

Boston, Massachusetts
|
23 de junio de 2026

Un castillo en el firmamento estilo plastilina hecho de malvaviscos y dulces.Créditos de imagen:TechCrunch

Comienzas con un “bosquejo del mundo” proporcionando indicaciones de texto tanto para el entorno como para un personaje principal, a quien luego podrás maniobrar a través del mundo en sagacidad de primera o tercera persona. Nano Plátano Pro crea una imagen basada en las indicaciones que, en teoría, puedes modificar antaño de que Genie use la imagen como punto de partida para un mundo interactivo. Las modificaciones funcionaron en su mayoría, pero el maniquí ocasionalmente tropezaba y te daba guedeja morado cuando pedías verde.

Igualmente puedes usar fotos de la vida positivo como pulvínulo para que el maniquí construya un mundo, que, nuevamente, fue impredecible. (Más sobre eso más delante).

Una vez que esté satisfecho con la imagen, Project Genie tardará unos segundos en crear un mundo explorable. Igualmente puedes remezclar mundos existentes en nuevas interpretaciones basándose en sus indicaciones, o explorar mundos seleccionados en la local o mediante la útil de aleatorización en búsqueda de inspiración. Luego podrás descargar videos del mundo que acabas de explorar.

DeepMind solo otorga 60 segundos de procreación y navegación mundial en este momento, en parte oportuno a las limitaciones de presupuesto y computación. Porque Genie 3 es un maniquí autorregresivose necesita mucha computación dedicada, lo que pone un tope ajustado a la cantidad que DeepMind puede proporcionar a los usuarios.

“La razón por la que lo limitamos a 60 segundos es porque queríamos llevarlo a más usuarios”, dijo Fruchter. “Básicamente, cuando lo estás usando, hay un chip en algún división que es solo tuyo y está dedicado a tu sesión”.

Añadió que extenderlo más allá de los 60 segundos disminuiría el valencia incremental de la prueba.

“Los entornos son interesantes, pero en algún momento, oportuno a su nivel de interacción y el dinamismo del entorno, es poco pequeño. Aún así, lo vemos como una término que esperamos mejorar”.

La excentricidad funciona, el realismo no.

Google recibió un cese y desión de Disney el año pasado, por lo que no construiría modelos relacionados con Disney.Créditos de imagen:TechCrunch

Cuando utilicé el maniquí, las barandillas de seguridad ya estaban montadas y funcionando. No podía originar carencia parecido a la desnudez, ni podía originar mundos que olieran ni remotamente a Disney u otro material protegido por derechos de autor. (En diciembre, Disney golpeó a Google con un cese y desión, acusando a los modelos de inteligencia industrial de la empresa de infracción de derechos de autor al entrenar sobre los personajes y la propiedad intelectual de Disney y originar contenido no calificado, entre otras cosas). Ni siquiera pude conseguir que Genie generara mundos de sirenas explorando tierras de excentricidad submarinas o reinas de hielo en sus castillos invernales.

Aún así, la demostración fue profundamente impresionante. El primer mundo que construí fue un intento de morar una pequeña excentricidad inmaduro, en la que podía explorar un castillo en las nubes formado por malvaviscos con un río de salsa de chocolate y árboles hechos de dulces. (Sí, era un criatura gordito.) Le pedí al maniquí que lo hiciera en estilo de animación con plastilina, y me entregó un mundo caprichoso que mi infancia habría devorado, las torres y torres de colores pastel y blanco del castillo lucían hinchadas y lo suficientemente sabrosas como para provenir un trozo y sumergirlo en el foso de chocolate. (Vídeo en lo alto).

Un mundo inspirado en “Entretenimiento de Tronos” que no logró originar el realismo fotográfico que quería.Créditos de imagen:TechCrunch

Dicho esto, Project Genie todavía tiene algunos problemas que resolver.

Los modelos se destacaron en la creación de mundos basados ​​en indicaciones artísticas, como el uso de acuarelas, estilo anime o la estética clásica de los dibujos animados. Pero tendía a errar cuando se trataba de mundos fotorrealistas o cinematográficos, y a menudo parecía un videojuego en división de personas reales en un entorno positivo.

Siquiera siempre respondió proporcionadamente cuando se le dieron fotos reales para trabajar. Cuando le di una foto de mi oficina y le pedí que creara un mundo basado en la foto exactamente como era, me dio un mundo que tenía algunos de los mismos muebles de mi oficina (un escritorio de madera, plantas, un sofá anodino) distribuidos de forma diferente. Y parecía desinfectado, digital, no realista.

Cuando le di una foto de mi escritorio con un trebejo de peluche, Project Genie animó el trebejo navegando por el espacio e incluso hizo que otros objetos reaccionaran ocasionalmente cuando pasaba contiguo a ellos.

Esa interactividad es poco en lo que DeepMind está trabajando para mejorar. Hubo varias ocasiones en las que mis personajes atravesaron paredes u otros objetos sólidos.

Le pedí a Project Genie que animara un trebejo de peluche (Bingo Bronson) para que pudiera explorar mi escritorio. Créditos de imagen:TechCrunch

Cuando DeepMind lanzó Genie 3 inicialmente, los investigadores resaltaron cómo la bloque autorregresiva del maniquí significaba que podía recapacitar lo que había generado, por lo que quería probarlo regresando a partes del entorno que ya había generado para ver si sería lo mismo. En universal, el maniquí tuvo éxito. En un caso, generé un micho explorando otro escritorio, y solo una vez, cuando volví al banda derecho del escritorio, el maniquí generó una segunda taza.

La parte que encontré más frustrante fue la forma en que navegabas por el espacio usando las flechas para mirar a tu aproximadamente, la mostrador espaciadora para saltar o ascender y las teclas WASD para moverte. No soy un atleta, así que esto no me resultó natural, pero las teclas a menudo no respondían o te enviaban en la dirección equivocada. Intentar caminar desde un banda de la habitación hasta una puerta del otro banda a menudo se convertía en un prueba caótico de zigzag, como intentar conducir un carrito de compras con una rueda rota.

Fruchter me aseguró que su equipo era consciente de estas deficiencias y me recordó nuevamente que Project Genie es un prototipo real. En el futuro, dijo, el equipo aplazamiento aumentar el realismo y mejorar las capacidades de interacción, incluso dando a los usuarios más control sobre las acciones y los entornos.

“No pensamos en (Project Genie) como un producto de principio a fin al que la concurrencia pueda acogerse todos los días, pero creemos que ya se vislumbra poco que es interesante y único y que no se puede hacer de otra forma”, dijo.

Related Posts

Amazon no quiere ser culpado por la rotura de Correos

Amazon se pone a la defensiva a posteriori de una mensaje de El diario de Wall Street reveló que el cíclope del comercio electrónico planea recortar los envíos con el…

El Reino Unido planea exigir etiquetas en el contenido generado por IA

Un catedrático incógnito cita un noticia de Reuters: Gran Bretaña planea considere exigir etiquetas en el contenido generado por IA para proteger a los consumidores de la desinformación y las…

You Missed

Amazon no quiere ser culpado por la rotura de Correos

Amazon no quiere ser culpado por la rotura de Correos

VENEZUELA: Delcy Rodríguez destituye al Ministro de Defensa | AlMomento.net

VENEZUELA: Delcy Rodríguez destituye al Ministro de Defensa | AlMomento.net

PLD defiende su representante y planea un cambio consciente para el 2028

PLD defiende su representante y planea un cambio consciente para el 2028

Extraditan a dos dominicanos a Puerto Rico por red de narcotráfico que utilizaba criptomonedas

Extraditan a dos dominicanos a Puerto Rico por red de narcotráfico que utilizaba criptomonedas

Prisión preventiva contra líder de “Los Bronx” por asalto a orfebrería en Cristo Rey

Prisión preventiva contra líder de “Los Bronx” por asalto a orfebrería en Cristo Rey

Delcy Rodríguez destituye a Padrino López tras más de una lapso como ministro de Defensa

Delcy Rodríguez destituye a Padrino López tras más de una lapso como ministro de Defensa