Usamos cookies. Más información  aquí Aceptar

Entrenar robots con Machine Learning

El Aprendizaje Automático, o Machine Learning, ya se puede aplicar al entrenamiento de los robots

Un entorno virtual integrado con el conocimiento del mundo físico acelera la resolución de problemas por parte de los robots con Machine Learning

Actualmente los robots son capaces de resolver tareas complejas como resolver un cubo de Rubik y navegar por el terreno accidentado de Marte. No obstante, aun contando con montañas de datos e instrucciones claras, se les dificultan tareas sencillas que hasta un niño puede aprender fácilmente como extender un trozo de masa o manipular un par de palillos.


Para esto se ha diseñado un entorno de simulación apodado como “PlasticineLab”, el cual está diseñado para que el aprendizaje de los robots sea más sencillo, incorporando conocimientos del mundo físico. Con esto los investigadores esperan facilitar la tarea de aprendizaje de los robots para manipular objetos y materiales del mundo real que a menudo se doblan o se deforman, sin volver a su forma original. Este simulador fué lanzado en la Conferencia Internacional realizada en Mayo y ha sido desarrollado por investigadores del MIT, MIT-IBM Watson IA Lab y la Universidad de California en San Diego.


En este simulador, el robot es capaz de aprender a completar una serie de tareas manipulando objetos blandos en la simulación. Sus diferentes funciones son “RollingPin”, que pretende aplanar un trozo de masa. “Rope”, que pretende enrollar un trozo de cuerda en un pilar. “Chopsticks”, que pretende tomar una cuerda y moverla a la ubicación de destino.


Gracias a este simulador, consiguieron que sus robots aprendan a completar estas y otras tareas más rápido que otros robots entrenados con otras técnicas de Machine Learning. Esto se consigue incorporando el conocimiento del mundo físico en las variables.


Zhiao Huang, el autor principal del estudio, añadió "Programar un conocimiento básico de física en el simulador hace que el proceso de aprendizaje sea más eficiente", “Esto le da al robot un sentido más intuitivo del mundo real, que está lleno de seres vivos y objetos deformables".


El investigador de IBM y autor principal del trabajo, Chuang Gan, añadió "Puede tomar miles de iteraciones para que un robot domine una tarea a través de la técnica de prueba y error del aprendizaje por refuerzo, que se usa comúnmente para entrenar robots en simulación", "Demostramos que se puede hacer mucho más rápido incorporando algunos conocimientos de física, lo que permite que el robot use algoritmos de planificación basados en gradientes para aprender".


Gracias a un lenguaje de programación de gráficos llamado TaiChi, se han podido integrar ecuaciones físicas básicas. Tanto TaiChi como el simulador PlasticineLab fueron desarrollados por Yuanming Hu. Mediante el uso de algoritmos de planificación basados en gradientes, el agente de PlasticineLab puede comparar continuamente su objetivo con los movimientos realizados hasta ese punto y eso consigue correcciones de rumbo más rápidas.


El estudiante de doctorado en el MIT y coautor del estudio, Tao Du, añadió “Podemos encontrar la solución óptima a través de la retro propagación, la misma técnica utilizada para entrenar redes neuronales”, "La retro propagación le da al agente la retroalimentación que necesita para actualizar sus acciones y alcanzar su objetivo más rápidamente".


Este trabajo forma parte de un esfuerzo continuo de dotar a los robots con más sentido común para realizar tareas mundanas en el mundo real como cocinar, limpiar, doblar la ropa... ¡Esto no ha hecho más que empezar!


Solicítanos ahora tu presupuesto para proyecto de Inteligencia Artificial y uno de nuestros consultores especializados te atenderá personalmente.


Blog sobre Inteligencia Artificial