
- Los robots siguen fallando rápidamente una vez que se retiran de los entornos predecibles de las fábricas
- Microsoft Rho-alpha vincula la comprensión del jerga directamente con el control de movimiento robótico
- La detección táctil es fundamental para aminorar las brechas entre el software y la batalla física.
Los robots han funcionado de forma confiable durante mucho tiempo interiormente de entornos industriales estrictamente controlados con entornos predecibles y desviaciones limitadas, pero fuera de eso, a menudo tienen problemas.
Para aliviar este problema, Microsoft ha anunciado Rho-alfael primer maniquí de robótica derivado de su serie de jerga de visión Phi, argumentando que los robots necesitan mejores formas de ver y comprender instrucciones.
La empresa cree que los sistemas pueden funcionar más allá de las líneas de montaje respondiendo a condiciones cambiantes en circunscripción de seguir guiones rígidos.
Para qué está diseñado Rho-alpha
Microsoft vincula esto con lo que ampliamente se ardor IA física, donde se paciencia que los modelos de software guíen a las máquinas a través de situaciones menos estructuradas.
Combina jerga, percepción y batalla, lo que reduce la dependencia de líneas de producción o instrucciones fijas.
Rho-alpha traduce comandos del jerga natural en señales de control robótico y se centra en tareas de manipulación bimanual, que requieren coordinación entre dos brazos robóticos y un control detallado.
Microsoft caracteriza el sistema como una extensión de los enfoques VLA típicos al expandir tanto la percepción como las entradas de enseñanza.
“La aparición de modelos de visión-lenguaje-acción (VLA) para sistemas físicos está permitiendo que los sistemas perciban, razonen y actúen con una autonomía cada vez anciano unido con los humanos en entornos que están mucho menos estructurados”, afirmó Ashley Llorens, vicepresidenta corporativa y directora universal de Microsoft Research Accelerator.
Rho-alpha incluye detección táctil unido con la visión, con modalidades de detección adicionales como la fuerza, que es un avance continuo.
Estas opciones de diseño sugieren un intento de aminorar la brecha entre la inteligencia simulada y la interacción física, aunque su efectividad aún está bajo evaluación.
Una parte central del enfoque de Microsoft se fundamento en la simulación para enfrentarse datos limitados de robótica a gran escalera, en particular datos relacionados con el tacto.
Las trayectorias sintéticas se generan a través del enseñanza por refuerzo interiormente de Nvidia Isaac Sim, luego combinado con demostraciones físicas de conjuntos de datos comerciales y abiertos.
“Para entrenar modelos básicos que puedan razonar y desempeñarse es necesario pasar la escasez de datos diversos del mundo auténtico”, dijo Deepu Talla, vicepresidente de Robótica y Edge AI de Nvidia.
“Al beneficiarse NVIDIA Isaac Sim en Azure para crear conjuntos de datos sintéticos físicamente precisos, Microsoft Research está acelerando el avance de modelos versátiles como Rho-alpha que pueden dominar tareas de manipulación complejas”.
Microsoft además enfatiza la entrada correctiva humana durante la implementación, lo que permite a los operadores intervenir utilizando dispositivos de teleoperación y proporcionar comentarios de los que el sistema puede educarse con el tiempo.
Este ciclo de entrenamiento combina simulación, datos del mundo auténtico y corrección humana, lo que refleja una creciente dependencia de las herramientas de inteligencia sintético para compensar los escasos conjuntos de datos incorporados.
El profesor Abhishek Gupta, profesor asistente de la Universidad de Washington, dijo: “Si adecuadamente la engendramiento de datos de entrenamiento mediante sistemas robóticos teleoperadores se ha convertido en una habilidad tipificado, hay muchos entornos en los que la teleoperación no es habilidad o increíble”.
“Estamos trabajando con Microsoft Research para enriquecer los conjuntos de datos previos al entrenamiento recopilados de robots físicos con diversas demostraciones sintéticas utilizando una combinación de simulación y enseñanza por refuerzo”.
Siga TechRadar en Google News y agréganos como fuente preferida para cobrar noticiario, reseñas y opiniones de nuestros expertos en sus feeds. ¡Asegúrate de hacer clic en el brote Seguir!
Y por supuesto además puedes Siga TechRadar en TikTok para noticiario, reseñas, unboxings en forma de video y reciba actualizaciones periódicas de nuestra parte en WhatsApp además.





