Los sistemas de aprendizaje automático son sistemas inteligentes capaces de aprender comporamientos y tomar decisiones en entornos cambiantes.

El controlador, que generalmente va implementado en el sofware del robot, recibe datos de varios sensores, procesa los datos y calcula los nuevos comandos de acción que ejecutará el robot.

Para el desarrollo de algoritmos eficientes de aprendizaje automático con una buena capacidad de generalización para sistemas autónomos en entornos dinámicos e inciertos, y debido a la creciente complejidad de las aplicaciones de la realidad actual, es importante que los sistemas autónomos tengan mejoradas habilidades de aprendizaje, como aprendizaje en línea, aprendizaje a partir de datos desequilibrados, detección, planificación y control de movimiento.

Cuando las tareas del robot u otros sistemas autónomos son preprogramadas y el entorno no cambia significativamente, existen métodos muy conocidos para diseñar tales sistemas de control. Sin embargo en situaciones desconocidas que no pueden preprogramarse o en entornos más complejos de los que tienen reconocidos, no podemos prever todas las situaciones a las que el robot pudiera necesitar hacer frente. Por tanto, una rígida preprogramación de los mismos no es viable para ejecutar autonomia. Mientras los robot deben actuar en situaciones desconocidas, su sistema de control también debe ser capaz de adaptarse y aprender durante la operación.

Es a través de la retroalimentación sensorial continua sobre sus acciones, que el robot puede aprender cómo es mejor interactuar con su entorno y actuar con mayor precisión y eficiencia. Por lo tanto, el "aprendizaje" es una característica fundamental de un sistema autónomo, que abarca todos sus componentes algorítmicos.

En lugar de aprender de una vez un conjunto de datos, el robot debe aprender continuamente de los datos que genera. El robot aprende de los datos que generó a través de sus propias acciones y sistema de percepción. El resultado del aprendizaje, a su vez, influye en el comportamiento del robot. Por lo tanto, el proceso de aprendizaje y el comportamiento del robot se influyen mutuamente y forman un proceso dinámico. Dado que el robot genera sus propios datos, a menudo existe un intercambio interesante entre poner en practica lo que se ha aprendido y tratar de hacer nuevas exploraciones. Este problema fundamental en el control del aprendizaje se conoce como trade-off de exploración y explotación.

Control de aprendizaje en el Departamento de Movimiento Autónomo

El grupo de Control de Aprendizaje del Departamento de Movimiento Autónomo se enfoca en desarrollar algoritmos que aprovechan el aprendizaje automático y estadístico, así como la teoría de control automático para aumentar el nivel de autonomía de los futuros sistemas robóticos, idealmente en forma de caja negra completa, sin la necesidad de ajustar ningún parámetro abierto y con garantías de convergencia. Entre otros, trabajan en los siguientes temas de investigación:

Aprendizaje incremental

Aprendizaje reforzado

Aprendizaje por demostración

Aprendizaje de controladores de retroalimentación

Diseño automático y ajuste de controladores de retroalimentación

Como resultado de muchos sensores y una gran cantidad de grados de libertad de movimiento los sistemas robóticos modernos tienen un estado dimensional bastante elevado. Aprender en cientos, miles o incluso cientos de miles de dimensiones no es una solicitud irracional, pero lidiar con esta complejidad, así como detectar la redundancia y la irrelevancia son requisitos desafiantes para el control del aprendizaje.

La información completa podrás encontrarla en la página web de Autonomus