"La creación de modelos básicos para robots humanoides de uso general es uno de los problemas más apasionantes de la IA actual", afirmaba Jensen Huang el pasado 18 de marzo, en la keynote de NVIDIA, la NVIDIA GTC 2024. El CEO de la compañía afirmó que las tecnologías necesarias para esto ya colaboran a día de hoy para que los principales expertos en robótica de todo el mundo den pasos de gigante hacia la robótica artificial general.
Cuando pensamos en máquinas que hacen uso de Inteligencia Artificial (de manera funcional), se suelen pensar en herramientas que, lejos de cobrar una apariencia humana, esta esté en sintonía con la labor y objetivo de la propia máquina. Bajo esta premisa, sería lógica pensar que, en ambientes industriales, donde se requiere rápidez, a la vez que precisión, existan máquinas que ayuden a este tipo de tareas, cuyo aspecto está especializado, y limitado a su vez, al cumplimiento de su objetivo. Un ejemplo de esto son los productos que desarrolla SoftRoboticsInc, cuyos robots combinan características tan complejas como la visión 3D e Inteligencia Artificial para poder manipular de forma apropiada distintos alimentos, en entornos industriales.
¿Qué es GR00T?
En su presentación, NVIDIA anunció un nuevo proyecto al que están poniendo grandes empeños, al cual han llamado GR00T (Generalist Robot 00 Technology), con el que buscan avanzar en su labor de impulsar los avances en robótica e IA incorporada. Al parecer, el proyecto de NVIDIA habilitaría a robots humanoides a aprender de diferentes fuentes de datos, para lograr imitar los movimientos característicos humanos, los cuales podrían suponer un punto de inflexión en nuestra concepción de trabajo junto a máquinas. GR00T, como software multimodal, ayudaría a los robots a aprender del propio lenguaje natural, datos en vídeo, y demostraciones y gestos característicos de nosotros, los humanos.
Junto con GR00T, la compañia también ha presentado un nuevo ordenador, Jetson Thor, para robots humanoides basado en el sistema en chip (SoC) NVIDIA Thor. Por otro lado, se han tratado importantes mejoras en el proyecto NVIDIA Isaac™, una plataforma de robótica que incluye modelos básicos de IA generativa y herramientas de simulación e infraestructura de flujos de trabajo de IA, lo que la hacec muy potente para entrenamientos modelos basados en Aprendizaje por Refuerzo.
Los robots con tecnología GR00T estarían diseñados para entender el lenguaje natural y emular movimientos observando las acciones humanas, aprendiendo rápidamente coordinación, destreza y otras habilidades para navegar, adaptarse e interactuar con el mundo real. En su discurso de apertura de la GTC, Huang mostró varios robots de este tipo realizando diversas tareas.
Vamos a tratar por separado algunos de los factores que sustentan a GR00T.
Jetson Thor
Si no estás muy adentrado en la gama de productos de NVIDIA Jetson, se trata de un programa dedicado a la contrucción de hardware especializado para multitud de aplicaciones en diferentes industrias. Los módulos Jetson representan un ordenador completo, ya que cuenta con una GPU, CPU y memoria propios, gestión de la energía, interfaces de alta velocidad y mucho más. Existe una gran variedad de casos de éxito que utilizan productos Jetson, entre los que podemos encontrar sectores como la agricultura, la salud, la logística, e incluso, el comercio.
Jetson Thor incluye una GPU de próxima generación con un motor transformador que ofrece 800 teraflops de rendimiento de IA para ejecutar modelos de IA generativa multimodales. Esta nueva gama del programa Jetson aprovecharía toda la experiencia en el desarrollo de hardware y software multimodal de este programa, junto con la capacidad de los nuevos chips de NVIDIA, [insertar enlace a blog chips Blackwell] basados en la arquitectura Blackwell, que promete un cambio revolucionario en la capacidad de modelos actuales de IA generativa.
NVIDIDA Isaac Sim
Isaac Sim es un entorno de simulación, desarrollado por NVIDIA, en el que resulta mucho más eficiente entrenar modelos que tengan como objetivo comprender las físicas del mundo real. Esta herramienta combina NVIDIA OSMO para diseñar flujos de trabajo complejos con el objetivo de la capacitación de robots, y NVIDIA Isaac Lab para generar los entornos de simulación en los que el modelo aprende antes de implementarse en robots del mundo real.
Tal y como se menciona en el portal web de NVIDIA, “Isaac Lab se beneficia de las tecnologías de NVIDIA Omniverse para tareas de aprendizaje por refuerzo basadas en la percepción, fotorrealistas y basadas en la física. Se trata de una aplicación de código abierto y optimizada para el rendimiento y aprendizaje de robots basada en la plataforma Isaac Sim. Incorpora una API de aprendizaje por refuerzo y un framework de tareas fácil de usar para los desarrolladores.”
La renovación de la plataforma de aprendizaje Isaac permitiría el entrenamiento de modelos que se podrían implementar robots de cualquier aspecto, lo que refuerza aún más el poder de esta plataforma. Al final del blog puedes encontrar enlaces para acceder a la web oficial de NVIDIA y obtener mucha más información.
En conclusión, el proyecto GR00T de NVIDIA es un testimonio del vertiginoso avance en el campo de la robótica y la Inteligencia Artificial. Este proyecto no solo representa un salto hacia el desarrollo de robots de aspecto humano más sofisticados y versátiles, sino también una (potencial) nueva perspectiva en nuestra relación con las máquinas.
Sin duda, este es un momento emocionante para estar en el cruce de la tecnología y la innovación, donde proyectos como GR00T nos muestran un atisbo del mañana, un futuro en el que los robots podrían no solo trabajar junto a nosotros, sino también aprender de nuestra manera de interactuar con el mundo. A medida que continuamos explorando estas posibilidades, es evidente que estamos en el umbral de una nueva era en robótica e inteligencia artificial, una era marcada por la colaboración, la innovación y un potencial cuyo límite está en nuestra imaginación.