Conocimiento Bóveda 5 /88 - CVPR 2023
Conducción Autónoma Orientada a la Planificación
Yihan Hu, Jiazhi Yang, Li Chen, Keyu Li, Chonghao Sima, Xizhou Zhu, Siqi Chai, Senyao Du, Tianwei Lin, Wenhai Wang, Lewei Lu, Xiaosong Jia, Qiang Liu, Jifeng Dai, Yu Qiao, Hongyang Li
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4o | Llama 3:

graph LR classDef unified fill:#f9d4d4, font-weight:bold, font-size:14px classDef autonomous fill:#d4f9d4, font-weight:bold, font-size:14px classDef solutions fill:#d4d4f9, font-weight:bold, font-size:14px classDef uniad fill:#f9f9d4, font-weight:bold, font-size:14px classDef future fill:#f9d4f9, font-weight:bold, font-size:14px A["Conducción Autónoma Orientada a la Planificación"] --> B["UniAD: Marco de conducción
autónoma de pila completa 1"] A --> C["Conducción autónoma: Clima,
escenarios, tareas 2"] A --> D["Soluciones típicas: Modelos
independientes, errores 3"] A --> E["Marcos multitarea: Espina dorsal
compartida, no coordinados 4"] A --> F["De extremo a extremo: Política desde
sensores, ininterpretable 5"] A --> G["UniAD: Integrar percepción,
predicción, planificación 6"] G --> H["Tareas de UniAD: Formadores,
ocupación, planificador 7"] G --> I["Consulta unificada: Conecta,
coordina tareas 8"] G --> J["Módulos de transformador: Interacciones
complejas, atención 9"] H --> K["Seguimiento, mapa de formadores:
Entrenamiento de extremo a extremo 10"] H --> L["Formador de movimiento: Modelado
de relaciones diversas 11"] H --> M["Formador de ocupación: Predice
expectativas, restringe 12"] H --> N["Planificador: Atiende características,
ajusta camino 13"] G --> O["Entrenamiento en dos fases: Estabiliza,
comparte resultados 14"] G --> P["Experimentos: Validar tareas,
beneficio de planificación 15"] G --> Q["Planificación: Menor error,
tasa de colisión 16"] G --> R["Interpretabilidad: Visualizaciones, recupera
de errores 17"] G --> S["Consulta unificada: Conecta,
coordina tareas 18"] B --> T["Resultados: Solo visión de vanguardia 19"] A --> U["Futuro: Datos, entrenamiento,
algoritmos, sistemas 20"] A --> V["Potencial del modelo base:
Principios de UniAD 21"] A --> W["Aplicaciones: Robótica, navegación,
tareas autónomas 22"] A --> X["UniAD: Paso hacia
modelo base 23"] A --> Y["Documento, póster disponible
para detalles 24"] A --> Z["Preguntas y respuestas: Enviar preguntas
a través de la caja 25"] class B,G,H,I,J,K,L,M,N,O,P,Q,R,S,T unified class C autonomous class D,E,F solutions class U,V,W,X,Y,Z future

Resumen:

1.- UniAD: Marco unificado de conducción autónoma de pila completa que coordina tareas de percepción, predicción y planificación para una conducción segura.

2.- Desafíos de la conducción autónoma: Diversos climas, iluminaciones y escenarios; las tareas incluyen percepción, predicción y planificación.

3.- Soluciones típicas: Modelos independientes entrenados por separado para cada tarea, lo que lleva a errores acumulados.

4.- Marcos multitarea: Espina dorsal compartida para múltiples tareas, eficiente pero carece de coordinación entre las cabezas de tarea.

5.- Soluciones de extremo a extremo: Aprenden política directamente de las entradas de sensores, buenos resultados en simuladores pero carecen de interpretabilidad en escenarios del mundo real.

6.- Enfoque de UniAD: Integrar tareas de percepción y predicción críticas para la seguridad, organizarlas en una jerarquía para maximizar el flujo de información hacia el planificador.

7.- Tareas de UniAD: Seguimiento de formadores, mapa de formadores, formador de movimiento, formador de ocupación y planificador.

8.- Diseño de consulta unificada: Conecta toda la tubería y coordina todas las tareas hacia la planificación.

9.- Módulos de tarea basados en transformadores: Modelan interacciones complejas en escenas de conducción con mecanismos de atención.

10.- Seguimiento de formadores y mapa de formadores: Desarrollados a partir de investigaciones previas, tratan agentes y elementos del mapa como consultas para el entrenamiento de extremo a extremo.

11.- Formador de movimiento: Maneja el modelado de relaciones diversas con mecanismos de atención (relaciones agente-agente, agente-mapa, agente-ego).

12.- Formador de ocupación: Predice expectativas de ocupación y restringe interacciones entre agentes y sus correspondientes características BEV.

13.- Planificador: Usa la consulta del vehículo ego para atender características BEV, predice puntos de referencia futuros y ajusta el camino para evitar colisiones potenciales.

14.- Entrenamiento en dos fases: Estabiliza el proceso de entrenamiento y comparte resultados coincidentes entre módulos para la convergencia.

15.- Experimentos: Validan la necesidad de tareas precedentes, mostrando que se benefician mutuamente y a la planificación final.

16.- Rendimiento de planificación: UniAD logra el menor error L2 y tasa de colisión, superando métodos basados en escaleras y anteriores de extremo a extremo.

17.- Interpretabilidad: La visualización de representaciones intermedias exhibe la interpretabilidad de UniAD y su capacidad para recuperarse de errores ascendentes.

18.- Diseño de consulta unificada: Conecta y coordina todas las tareas en el marco.

19.- Resultados: UniAD logra resultados de vanguardia en todas las tareas investigadas con entradas solo de visión.

20.- Direcciones futuras: Estrategia de datos y entrenamiento, algoritmos embarcables y sistemas de bucle cerrado.

21.- Modelo base para conducción autónoma: Potencial para un modelo base universal basado en los principios y estructuras de UniAD.

22.- Aplicaciones: Extensión a una amplia gama de robótica, permitiendo que las máquinas interactúen, naveguen y realicen tareas de manera autónoma e inteligente.

23.- Conclusión: UniAD es un paso hacia un modelo base para la conducción autónoma, abriendo nuevas posibilidades en la robótica.

24.- Información adicional: Documento y sesión de póster disponibles para más detalles.

25.- Preguntas y respuestas: Los ponentes animan a realizar preguntas a través de la caja de preguntas y respuestas en la parte inferior de la pantalla.

Bóveda de Conocimiento construida porDavid Vivancos 2024