Nvidia venablo DreamDojo, un androide ‘maniquí mundial’ entrenado con 44.000 horas de vídeo humano

Nvidia venablo DreamDojo, un androide ‘maniquí mundial’ entrenado con 44.000 horas de vídeo humano

Un equipo de investigadores dirigido por NVIDIA ha libertino DreamDojoun nuevo sistema de inteligencia sintético diseñado para enseñar a los robots cómo interactuar con el mundo físico viendo decenas de miles de horas de video humano, un crecimiento que podría resumir significativamente el tiempo y el costo necesarios para entrenar la próxima procreación de máquinas humanoides.

El investigaciónpublicado este mes y en el que participan colaboradores de Universidad de Berkeley, stanfordel Universidad de Texas en Austiny varias otras instituciones, presenta lo que el equipo candela "el primer maniquí de mundo robótico de este tipo que demuestra una robusto universalización a diversos objetos y entornos posteriormente del entrenamiento posterior."

En el núcleo de DreamDojo es lo que los investigadores describen como "un conjunto de datos de vídeo a gran escalera" que comprende "44.000 horas de diversos vídeos humanos egocéntricos, el conjunto de datos más egregio hasta la vencimiento para el preentrenamiento de modelos mundiales." El conjunto de datos, llamado DreamDojo-HVes un brinco dramático en escalera – "15 veces más duración, 96 veces más habilidades y 2000 veces más escenas que el conjunto de datos más egregio anteriormente para el entrenamiento de modelos mundiales." según la documentación del tesina.

Interiormente del sistema de entrenamiento de dos fases que enseña a los robots a ver como humanos

El sistema opera en dos fases distintas. Primero, DreamDojo "adquiere conocimientos físicos integrales a partir de conjuntos de datos humanos a gran escalera mediante un entrenamiento previo con acciones latentes." Luego se somete "entrenamiento posterior en la carnación objetivo con acciones continuas del androide" – esencialmente ilustrarse física normal observando a los humanos y luego ajustar ese conocimiento para hardware de androide específico.

Para las empresas que están considerando robots humanoides, este enfoque soluciona un obstáculo persistente. Enseñar a un androide a manipular objetos en entornos no estructurados tradicionalmente requiere cantidades masivas de datos de demostración específicos del androide, cuya resumen es costosa y requiere mucho tiempo. DreamDojo evita este problema aprovechando el vídeo humano existente, permitiendo a los robots ilustrarse de la observación antiguamente de tocar un objeto físico.

Uno de los avances técnicos es la velocidad. A través de un proceso de destilación, los investigadores lograron "interacciones en tiempo positivo a 10 FPS durante más de 1 minuto" – una capacidad que permite aplicaciones prácticas como teleoperación en vivo y planificación sobre la marcha. El equipo demostró el sistema funcionando en múltiples plataformas robóticas, incluido el GR-1, G1, Agiboty BATATA robots humanoides, mostrando lo que llaman "Implementaciones realistas condicionadas a la batalla." al otro costado de "una amplia grado de entornos e interacciones de objetos."

Por qué Nvidia está apostando robusto por la robótica a medida que aumenta el pago en infraestructura de IA

El tirada llega en un momento crucial para las ambiciones robóticas de Nvidia y para la industria de la IA en normal. Al Foro Financiero Mundial En Davos el mes pasado, el director ejecutor Jensen Huang declaró que la robótica de IA representa un "una vez en una procreación" oportunidad, particularmente para las regiones con bases manufactureras sólidas. De acuerdo a DigitimesHuang todavía ha afirmado que la próxima período será "un período crítico de crecimiento acelerado de la tecnología robótica."

Los riesgos financieros son enormes. Huang dijo a CNBC "Documentación de medio tiempo" el 6 de febrero que los gastos de haber de la industria tecnológica, que potencialmente alcanzarán los 660 mil millones de dólares este año provenientes de los principales hiperescaladores, están "justificado, apropiado y sostenible." Caracterizó el momento contemporáneo como "la longevo construcción de infraestructura en la historia de la humanidad," y empresas como Meta, Amazon, Google y Microsoft aumentan drásticamente su pago en IA.

Ese impulso a la infraestructura ya está remodelando el panorama de la robótica. Las startups de robótica batieron un récord 26.500 millones de dólares en 2025según datos de Dealroom. Los gigantes industriales europeos, incluidos siemens, Mercedes-Benzy volvo han anunciado asociaciones de robótica el año pasado, mientras que el director ejecutor de Tesla, Elon Musk, ha afirmado que 80 por ciento del valía futuro de su empresa provendrá de sus robots humanoides Optimus.

Cómo DreamDojo podría modificar la implementación y las pruebas de robots empresariales

Para los responsables de la toma de decisiones técnicas que evalúan robots humanoides, el valía más inmediato de DreamDojo puede residir en sus capacidades de simulación. Los investigadores destacan aplicaciones posteriores que incluyen "Evaluación de políticas confiable sin implementación en el mundo positivo y planificación basada en modelos para mejorar en el momento de las pruebas." – capacidades que podrían permitir a las empresas afectar ampliamente el comportamiento de los robots antiguamente de comprometerse con costosas pruebas físicas.

Esto es importante porque la brecha entre las demostraciones de laboratorio y las fábricas sigue siendo significativa. Un androide que funciona perfectamente en condiciones controladas a menudo lucha con las variaciones impredecibles de los entornos del mundo positivo: iluminación diferente, objetos desconocidos, obstáculos inesperados. Al entrenar con 44.000 horas de diversos vídeos humanos que abarcan miles de escenas y casi 100 habilidades distintas, DreamDojo pretende desarrollar el tipo de intuición física normal que hace que los robots sean adaptables en superficie de frágiles.

El equipo de investigación, dirigido por Linxi "Jim" Fan, Joel Jang y Yuke Zhu, con Shenyuan Gao y William Liang como coautores, han indicado que el código se hará notorio, aunque no se especificó un cronograma.

Panorama más amplio: la transformación de Nvidia de cíclope de los juegos a potencia de la robótica

Si DreamDojo Aún está por estar qué se traduce en productos robóticos comerciales. Pero la investigación señala alrededor de dónde se dirigen las ambiciones de Nvidia a medida que la compañía se posiciona cada vez más más allá de sus raíces en los juegos. Como Kyle Barr observado en Gizmodo A principios de este mes, Nvidia ahora ve "todo lo relacionado con los juegos y la ‘computadora personal’" como "títulos atípicos en las hojas de cálculo trimestrales de Nvidia."

El cambio refleja una puesta calculada: que el futuro de la informática es físico, no sólo digital. Nvidia ya ha invertido 10 mil millones de dólares en Antrópico y señaló planes para trastornar fuertemente en la próxima ronda de financiación de OpenAI. DreamDojo sugiere que la compañía ve los robots humanoides como la próxima frontera donde pueden converger su experiencia en inteligencia sintético y su dominio en chips.

Por ahora, las 44.000 horas de vídeo humano en el corazón de DreamDojo representan poco más fundamental que un punto de remisión técnico. Representan una teoría: que los robots pueden ilustrarse a navegar en nuestro mundo viéndonos proceder en él. Resulta que las máquinas han estado tomando notas.

Related Posts

Apple ganó aproximadamente 900 millones de dólares con aplicaciones de IA generativa en 2025

Entre enero y agosto de 2025, los ingresos de la App Store procedentes de aplicaciones de IA generativa casi se triplicaron. impulsado en gran medida por las suscripciones a ChatGPT.…

El tendero es estafado cuando un cliente de eBay devuelve un RTX 5090 de $ 4,000 al que le faltan módulos de memoria y núcleo de GPU: Zotac en pleno funcionamiento, despojado de los componentes más valiosos y devuelto

Tenemos otro caso clásico de estafa de piezas de PC que involucra al RTX 5090. Según un tendero de ebayun cliente hizo poco rápido al devolver una Zotac Gaming GeForce…

You Missed

Chiky Bombom revela que renovó su resolución con Telemundo tras rumores de despido

Chiky Bombom revela que renovó su resolución con Telemundo tras rumores de despido

Apple ganó aproximadamente 900 millones de dólares con aplicaciones de IA generativa en 2025

Apple ganó aproximadamente 900 millones de dólares con aplicaciones de IA generativa en 2025

Exceso de velocidad causa 4 de cada 10 accidentes en La Altagracia

Exceso de velocidad causa 4 de cada 10 accidentes en La Altagracia

El petróleo, un espíritu que gobierna el mundo

El petróleo, un espíritu que gobierna el mundo

El tendero es estafado cuando un cliente de eBay devuelve un RTX 5090 de $ 4,000 al que le faltan módulos de memoria y núcleo de GPU: Zotac en pleno funcionamiento, despojado de los componentes más valiosos y devuelto

El tendero es estafado cuando un cliente de eBay devuelve un RTX 5090 de $ 4,000 al que le faltan módulos de memoria y núcleo de GPU: Zotac en pleno funcionamiento, despojado de los componentes más valiosos y devuelto

Condenan a 20 primaveras hombre contrató sicario para matar a su padre

Condenan a 20 primaveras hombre contrató sicario para matar a su padre