Conocimiento Bóveda 5 /34 - CVPR 2018
SPLATNet Redes de Lattice Escasas para el Procesamiento de Nubes de Puntos
Hang Su, Varun Jampani, Deqing Sun, Subhransu Maji, Evangelos Kalogerakis, Ming-Hsuan Yang, Jan Kautz.
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4o | Llama 3:

graph LR classDef splatnet fill:#d4d4f9, font-weight:bold, font-size:14px classDef bcl fill:#f9d4d4, font-weight:bold, font-size:14px classDef performance fill:#d4f9d4, font-weight:bold, font-size:14px classDef features fill:#f9f9d4, font-weight:bold, font-size:14px A["SPLATNet Redes de Lattice
Escasas para el Procesamiento
de Nubes de Puntos"] --> B["SplatNet procesa
nubes de puntos 3D directamente. 1"] A --> C["CNNs estándar no son adecuadas
para nubes de puntos escasas. 2"] C --> D["Voxelización, proyecciones 2D
tienen limitaciones. 3"] C --> E["SplatNet permite filtros flexibles
de múltiples escalas. 4"] B --> F["Procesa conjuntamente imágenes 2D,
nubes de puntos 3D. 5"] A --> G["Capa de Convolución Bilateral
BCL es clave. 6"] G --> H["BCL filtra puntos escasos
vía interpolación. 7"] H --> I["Lattice permutoédrico escala mejor
a dimensiones superiores. 8"] G --> J["BCL tiene características de puntos
y características de lattice. 9"] J --> K["Características de lattice controlan
el tamaño del campo receptivo. 10"] G --> L["BCL permite diferentes ubicaciones
de entrada-salida de puntos. 11"] L --> M["Variantes de BCL proyectan
entre 2D y 3D. 12"] A --> N["SplatNet-3D usa convoluciones 1x1,
secuencias BCL. 13"] N --> O["SplatNet-2D-3D añade
ramas CNN 2D. 14"] N --> P["SplatNet-3D supera
en segmentación de fachadas. 15"] P --> Q["SplatNet-2D-3D conjunto
mejora resultados de predicción. 16"] P --> R["SplatNet iguala el estado del arte
en ShapeNet. 17"] A --> S["XYZ+mormales como características 6D
dan flexibilidad. 18"] A --> T["Cálculo eficiente de nubes de puntos,
campos flexibles. 19"] T --> U["Código disponible en línea. 20"] class A,B,C,D,E,F,N,O,P,Q,R,S,T,U splatnet class G,H,I,J,K,L,M bcl class P,Q,R performance class S features

Resumen:

1.- SplatNet es una arquitectura de red para procesar nubes de puntos 3D directamente.

2.- Las CNNs estándar no están bien adaptadas para datos de nubes de puntos escasas y no estructuradas.

3.- Soluciones anteriores como la voxelización o proyecciones 2D de múltiples vistas tienen limitaciones.

4.- SplatNet permite campos receptivos de filtros flexibles para capturar información en múltiples escalas.

5.- También permite el procesamiento conjunto sin problemas de datos de imágenes 2D y nubes de puntos 3D.

6.- El bloque de construcción clave es la Capa de Convolución Bilateral (BCL).

7.- BCL filtra eficientemente puntos escasos mediante interpolación hacia/desde los vértices de una estructura de lattice.

8.- El lattice permutoédrico escala mejor a dimensiones superiores que una cuadrícula regular.

9.- BCL especifica dos conjuntos de características: características de puntos (qué) y características de lattice (dónde).

10.- Las características de lattice pueden usar diferentes escalas para controlar el tamaño del campo receptivo.

11.- BCL permite que los puntos de entrada y salida estén en diferentes ubicaciones.

12.- Las variantes BCL-2D-a-3D y BCL-3D-a-2D proyectan información entre 2D y 3D.

13.- SplatNet-3D tiene convoluciones 1x1, una secuencia de BCLs con escalas de lattice crecientes y concatenación.

14.- SplatNet-2D-3D añade ramas CNN 2D con proyección entre características 2D y 3D.

15.- SplatNet-3D supera métodos anteriores en el benchmark de segmentación de fachadas de edificios de Rimont 2014.

16.- El conjunto SplatNet-2D-3D mejora aún más los resultados de predicción tanto en 3D como en 2D.

17.- En la segmentación de partes de ShapeNet, SplatNet iguala el estado del arte y el conjunto 2D-3D ayuda aún más.

18.- Usar XYZ+mormales como características de lattice 6D da flexibilidad pero solo ganancias marginales aquí.

19.- El enfoque permite un cálculo eficiente de nubes de puntos, campos receptivos flexibles e integración sin problemas 2D-3D.

20.- El código está disponible en línea.

Bóveda de Conocimiento construida porDavid Vivancos 2024