Detección postural con inteligencia artificial
Uso de la librería Movenet para detectar la posición del cuerpo humano
Tensorflow es clave para conocer la ubicación de los principales puntos del cuerpo humano
by Overstand, 29/11/2022
Detección postural con inteligencia artificial: el movimiento humano hecho comprensible para los ordenadores
La estimación de postura consiste en el reconocimiento del cuerpo humano (o en algunos casos, el cuerpo de animales) en imágenes o vídeos. Un software de estimación de pose es capaz de reconocer la presencia de un humano en una imagen y describir la postura del mismo, normalmente mediante la detección de puntos clave en su cuerpo, como pueden ser sus muñecas, su cabeza o sus pies.
La estimación de pose es un campo en el que la inteligencia artificial ha visto grandes avances en los últimos seis años, y hoy en día es posible realizar detecciones de gran precisión en tiempo real. Movenet es un API desarrollado por el equipo de TensorFlow que permite a sus usuarios utilizar una serie de modelos de estimación de pose con unos requerimientos de hardware y software mínimos.
Movenet se basa en una arquitectura que se puede esquematizar como una columna vertebral de la que salen varias cabezas. La “columna vertebral” es un extractor de características, esto es, una red neuronal que recibe una imagen y devuelve una serie de rasgos de la misma. Un rasgo que se puede detectar en una imágen es, por ejemplo, dónde hay bordes en la imagen donde píxeles rojos estén cerca de píxeles azules. En la práctica, la extracción de características en imágenes suele consistir en operaciones de convolución, que se considera un proceso similar a cómo se comporta el ojo humano en el día a día. Las “cabezas” son cada uno de los propósitos para los que se van a utilizar las características extraídas: una cabeza puede ser una red neuronal que se encarga de detectar si la cadera es visible o no en la imagen, y otra cabeza puede encargarse de detectar dónde se encuentra la cadera dentro de la imagen.
La estimación de pose tiene aplicaciones en campos como la fisioterapia, interpretación del lenguaje de signos, vigilancia en cámaras de seguridad, juegos de realidad virtual, efectos especiales e interfaces sin contacto en quirófanos.
En colaboración con los desarrolladores de Movenet, IncludeHealth, una compañía de salud digital, explora ciertas aplicaciones con el fin de determinar la viabilidad del cuidado remoto de pacientes. IncludeHealth ha desarrollado una aplicación web interactiva que guía al paciente mientras este realiza una serie de rutinas de ejercicios desde su casa. Estas rutinas son prescritas por fisioterapeutas con el objetivo de evaluar equilibrio, fuerza y rango de movilidad o flexibilidad.
Hoy en día, la estimación de pose como interfaz de aplicaciones de realidad virtual y de realidad aumentada se utiliza para mejorar la experiencia online de los usuarios, aumentando la sensación de inmersión. Por ejemplo, los usuarios pueden aprender de manera virtual a jugar a juegos como el tenis gracias a tutores que usan detección postural para transmitir sus movimientos a sus alumnos con precisión. Además, la estimación de pose puede utilizarse en aplicaciones basadas en la realidad aumentada. Por ejemplo, el servicio militar estadounidense realiza pruebas con programas de realidad aumentada pensados para su utilización en combate. Estos programas permiten implementar funciones como la ayuda al reconocimiento de tropas aliadas frente a tropas enemigas y una visión nocturna mejorada.
Los sistemas de reconocimiento de gestos de la mano son software de estimación de pose centrados específicamente el reconocimiento de gestos y puntos clave en la región anatómica de las manos. Estos sistemas se utilizan en quirófanos para controlar sin contacto dispositivos dependientes de ordenadores, como por ejemplo, pantallas que muestran estudios de TAC o dispositivos de navegación quirúrgica. El uso de estos sistemas en sustitución de teclado y ratón permite la eliminación de potenciales riesgos de contaminación durante intervenciones médicas, y generalmente son percibidos por los profesiones sanitarios como más cómodos y efectivos que los controles de voz.
La estimación postural es un campo de la inteligencia artificial con perspectivas de crecimiento muy prometedoras, y en los próximos años podemos esperar la aparición en el mercado de sistemas capaces de describir el movimiento humano de manera sofisticada y con un nivel de detalle incluso mayor que los actuales.