Conocimiento Bóveda 6 /41 - ICML 2019
Aprendizaje automático para que los robots piensen rápido
Aude Billard
< Imagen de Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef main fill:#f9d4f9, font-weight:bold, font-size:14px classDef robotics fill:#f9d4d4, font-weight:bold, font-size:14px classDef ml fill:#d4f9d4, font-weight:bold, font-size:14px classDef matrix fill:#d4d4f9, font-weight:bold, font-size:14px classDef sparse fill:#f9f9d4, font-weight:bold, font-size:14px classDef impact fill:#d4f9f9, font-weight:bold, font-size:14px Main["Aprendizaje automático para
robots para pensar
rápido"] --> A["Robótica y
Aprendizaje Automático"] Main --> B["Aplicaciones de
Aprendizaje Automático"] Main --> C["Factorización de Matrices"] Main --> D["Codificación Dispersa"] Main --> E["Impacto y
Direcciones Futuras"] A --> A1["Billard: profesora de robótica y aprendizaje automático en EPFL 1"] A --> A2["Desafíos de robots atrapando objetos en movimiento rápido 2"] A --> A3["Incertidumbre en modelos de ML, permite cálculo rápido 3"] A --> A4["Sistemas dinámicos generan políticas de control estables 4"] A --> A5["Sistemas multi-atractor adaptan configuraciones de agarre 5"] A --> A6["SVMs aprenden límites de cambio de atractores 6"] B --> B1["GMMs representan configuraciones de robots para
planificación 7"] B --> B2["Control óptimo genera datos de entrenamiento
offline 8"] B --> B3["Táctil, visión permiten adaptación de agarre
al vuelo 9"] B --> B4["ML crucial para manipulación de objetos deformables
10"] B --> B5["Combinación de teoría de control y ML es
importante 11"] B --> B6["Aprendizaje de diccionario online tiene impacto
significativo 12"] C --> C1["Factorización de matrices descompone datos, aprendizaje
no supervisado 13"] C --> C2["Variantes de factorización de matrices producen diferentes
técnicas 14"] C --> C3["Factorización de matrices exitosa en varios
dominios 18"] C --> C4["Minimización alterna inadecuada para grandes
datasets 19"] C --> C5["SGD escalable pero requiere ajuste cuidadoso
20"] C --> C6["Autores propusieron algoritmo online rápido, sin ajuste
21"] D --> D1["Codificación dispersa descubre características de imagen
útiles 15"] D --> D2["Principio de dispersión tiene larga historia 16"] D --> D3["Codificación dispersa llevó a avances en restauración de
imágenes 17"] D --> D4["Ideas clave: actualizaciones rápidas, aproximación online
22"] D --> D5["Convergencia garantizada a pesar de desafíos de optimización 23"] D --> D6["Aprendizaje de diccionario conectado a redes
neuronales 26"] E --> E1["Impacto por oportunidad, software, flexibilidad 24"] E --> E2["Caja de herramientas SPAMS encontró aplicaciones diversas 25"] E --> E3["Codificación dispersa convolucional, multicapa posible 27"] E --> E4["Principio de simplicidad sigue siendo relevante para
interpretabilidad 28"] E --> E5["Simplicidad sola insuficiente, considerar otras
propiedades 29"] E --> E6["Software fácil de usar aumenta impacto de investigación 30"] class Main main class A,A1,A2,A3,A4,A5,A6 robotics class B,B1,B2,B3,B4,B5,B6 ml class C,C1,C2,C3,C4,C5,C6 matrix class D,D1,D2,D3,D4,D5,D6 sparse class E,E1,E2,E3,E4,E5,E6 impact

Resumen:

1.- Aude Billard es profesora de robótica y aprendizaje automático en EPFL que ha realizado contribuciones significativas en el control y aprendizaje de robots.

2.- Controlar robots para atrapar objetos en movimiento rápido es desafiante debido a la incertidumbre en el movimiento del objeto y el tiempo limitado para el cálculo.

3.- El aprendizaje automático puede ayudar a modelar la incertidumbre y permitir el cálculo rápido de rutas de control en comparación con enfoques de teoría de control pura.

4.- Los sistemas dinámicos pueden aprenderse a partir de demostraciones para generar políticas de control estables en forma cerrada que permitan el seguimiento en tiempo real de objetivos en movimiento.

5.- Los sistemas dinámicos multi-atractor permiten al robot adaptar su configuración de agarre en tiempo real para atrapar objetos como botellas voladoras.

6.- Las máquinas de vectores de soporte pueden usarse para aprender límites de cambio entre diferentes sistemas atractores para la toma de decisiones rápida en tiempo de ejecución.

7.- Los modelos de mezcla gaussiana pueden representar de manera compacta distribuciones de probabilidad sobre configuraciones de robots para la planificación de rutas libres de colisiones entre varios brazos colaboradores.

8.- El control óptimo puede usarse para generar datos de entrenamiento offline cuando no hay demostraciones humanas disponibles, y el aprendizaje por refuerzo puede optimizar aún más las políticas.

9.- La sensación táctil y la visión permiten a un robot estimar la posición de un objeto y adaptar su agarre sobre la marcha.

10.- El aprendizaje automático es crucial para la manipulación de objetos deformables como alimentos, donde los modelos físicos explícitos son muy difíciles de obtener.

11.- La combinación de teoría de control y aprendizaje automático es importante: el control proporciona soluciones factibles y garantías, mientras que el aprendizaje automático aproxima políticas de manera eficiente.

12.- El documento sobre aprendizaje de diccionario online para codificación dispersa de 2009 ha tenido un impacto significativo en la última década.

13.- La factorización de matrices descompone una matriz de datos en un diccionario y un código disperso, útil para el aprendizaje no supervisado y la representación eficiente.

14.- Existen muchas variantes de factorización de matrices con diferentes restricciones en los factores, produciendo técnicas como NMF, PCA dispersa, codificación dispersa estructurada.

15.- La codificación dispersa, introducida en 1996, descubre automáticamente características útiles como los filtros de Gabor a partir de parches de imágenes naturales mediante un prior de dispersión.

16.- El principio de dispersión de seleccionar la explicación más simple para los datos tiene una larga historia, desde Rinsch y Jeffries en la década de 1920 en adelante.

17.- En la década de 2000, la codificación dispersa llevó a resultados de vanguardia en eliminación de ruido de imágenes, restauración de imágenes y otras tareas de restauración.

18.- La factorización de matrices también encontró éxito en visión por computadora, ganando los desafíos Pascal VOC e ImageNet, así como en filtrado colaborativo y bioinformática.

19.- La minimización alterna es un algoritmo estándar para la factorización de matrices pero requiere cargar todos los datos en memoria, no es adecuado para grandes conjuntos de datos.

20.- El descenso de gradiente estocástico es más escalable pero requiere ajustar cuidadosamente las tasas de aprendizaje y puede ser lento para converger.

21.- Los autores propusieron un algoritmo online que es tan rápido como el SGD bien ajustado pero no requiere ajuste de tasas de aprendizaje.

22.- Las ideas clave son: 1) la actualización del diccionario es rápida si se conocen los códigos dispersos óptimos, 2) los códigos óptimos pueden aproximarse online.

23.- La convergencia a puntos estacionarios está garantizada al explotar la estructura del problema, a pesar de que la optimización sea no convexa, restringida y estocástica.

24.- El impacto del trabajo proviene de la oportunidad (aumento del tamaño de los conjuntos de datos), software robusto/práctico y flexibilidad para adaptarse a varias aplicaciones.

25.- La caja de herramientas SPAMS que implementa el algoritmo ha encontrado aplicaciones diversas, desde modelar hojas de árboles hasta analizar patrones de expresión génica espacial.

26.- El aprendizaje de diccionario tiene conexiones con las redes neuronales: la codificación dispersa está relacionada con las activaciones ReLU, y el aprendizaje de extremo a extremo mediante retropropagación es posible.

27.- La codificación dispersa convolucional y multicapa es posible, relacionada con enfoques como la arquitectura de red neuronal LISTA.

28.- El principio de simplicidad detrás de la dispersión sigue siendo relevante hoy en día para la interpretabilidad y selección de modelos, aunque quizás en una forma diferente a la norma L1.

29.- La simplicidad por sí sola probablemente no sea suficiente, y otras propiedades como la robustez y la estabilidad también son importantes a considerar.

30.- Liberar software robusto y fácil de usar junto con publicaciones de investigación puede aumentar significativamente el impacto, incluso en campos más allá del dominio original.

Bóveda del Conocimiento construida porDavid Vivancos 2024