Conocimiento Bóveda 5 /15 - CVPR 2016
Relajación Sublabel-Precisa de Energías No Convexas
Thomas Möllenhoff, Emanuel Laude, Michael Moeller, Jan Lellmann, Daniel Cremers
< Imagen de Resumen >

Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4o | Llama 3:

graph LR classDef optimization fill:#f9d4d4, font-weight:bold, font-size:14px classDef lifting fill:#d4f9d4, font-weight:bold, font-size:14px classDef approximation fill:#d4d4f9, font-weight:bold, font-size:14px classDef results fill:#f9f9d4, font-weight:bold, font-size:14px A["Relajación Sublabel-Precisa de
Energías No Convexas"] --> B["La visión por computadora variacional minimiza
datos y regularizador. 1"] A --> C["Problemas de optimización no convexos desafiantes. 2"] C --> D["El descenso de gradiente encuentra óptimos locales,
parámetros no intuitivos. 3"] C --> E["Ishikawa 2003: optimización global
corte de gráfico, sesgo de cuadrícula/etiqueta. 4"] C --> F["Pock et al. 2008: entorno continuo,
el sesgo de etiqueta permanece. 5"] A --> G["Emparejamiento estéreo: se necesitan más etiquetas,
se vuelve intratable. 6"] A --> H["Propone aproximación convexa por partes,
menos etiquetas. 7"] A --> I["Trabajo relacionado: MRFs continuos,
regularizadores específicos. 8"] A --> J["Contribuciones: sub-etiqueta continua precisa,
relajación convexa más ajustada. 9"] A --> K["Explicación de convexificación y elevación funcional. 10"] K --> L["Elevación tradicional muestrea etiquetas,
toma envolvente convexa. 11"] K --> M["Propuesto: costos entre etiquetas,
aproximación más cercana, convexa. 12"] K --> N["Energía no convexa plegada
en dimensiones superiores. 13"] K --> O["Energía reformulada definida
a lo largo de combinaciones convexas. 14"] K --> P["Envolvente convexa más ajustada
encontrada analíticamente. 15"] K --> Q["C caracterizado por
epígrafes de conjugados convexos. 16"] A --> R["Implementación: proyección sobre epígrafes,
lineal/cuadrática por partes. 17"] A --> S["Regularizador de variación total
elevado a dimensiones superiores. 18"] A --> T["Problema de punto de silla cóncavo-convexo,
algoritmo primal-dual en GPU. 19"] A --> U["Solución obtenida por retroproyección. 20"] A --> V["Modelo convexo: sub-etiqueta precisa
coincide con optimización directa. 21"] V --> W["Transiciones entre optimización directa
y elevación. 22"] A --> X["Solución exacta con 10 etiquetas,
tradicional necesita más. 23"] A --> Y["Estéreo: tradicional tiene sesgo de etiqueta,
muchas etiquetas. 24"] A --> Z["Propuesto: resultados suaves, pocas etiquetas,
menos tiempo/memoria. 25"] Z --> AA["Mejora con etiquetas iguales,
razonable con 2. 26"] A --> AB["Primera relajación continua sub-etiqueta precisa
para energías no convexas. 27"] A --> AC["Menos etiquetas que tradicional,
mejora tiempo/memoria. 28"] A --> AD["Generaliza a aproximaciones
convexas por partes. 29"] A --> AE["Código disponible en línea. 30"] class B,C,D,E,F optimization class G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U lifting class V,W,X,Y,Z,AA,AB,AC,AD approximation class AE results

Resumen:

1.- Los enfoques variacionales en visión por computadora minimizan energías con un término de datos y regularizador de variación total.

2.- Estos son problemas de optimización no convexos desafiantes.

3.- Métodos clásicos como el descenso de gradiente solo encuentran óptimos locales y tienen parámetros no intuitivos.

4.- Ishikawa (2003) propuso optimizar globalmente considerando el espacio producto y encontrando un corte de gráfico, pero esto tiene sesgo de cuadrícula/etiqueta.

5.- Pock et al. (2008) generalizaron esto a un entorno continuo, eliminando el sesgo de cuadrícula pero aún teniendo sesgo de etiqueta debido a la discretización del rango.

6.- Problemas de discretización de etiquetas ilustrados para emparejamiento estéreo - se necesitan más etiquetas para resultados suaves pero se vuelve intratable.

7.- Este trabajo propone resolver con menos etiquetas usando una aproximación convexa por partes en lugar de lineal por partes.

8.- Algunos trabajos relacionados sobre MRFs con espacios de estado continuos, pero enfocados en el entorno discreto o regularizadores específicos.

9.- Contribuciones clave - primera formulación completamente sub-etiqueta precisa espacialmente continua, prueba de la relajación convexa más ajustada, unifica elevación y optimización directa.

10.- Idea de convexificación y elevación funcional explicada - transformar energía a espacio de dimensiones superiores.

11.- El muestreo de energía elevada tradicional en etiquetas toma envolvente convexa - relajación lineal.

12.- El enfoque propuesto asigna costos entre etiquetas también antes de la envolvente convexa - aproximación más cercana, aún convexa.

13.- Energía no convexa plegada a lo largo de vectores base en espacio de dimensiones superiores.

14.- Energía reformulada definida como original a lo largo de combinaciones convexas de vectores base, infinito en otros lugares.

15.- Envolvente convexa más ajustada encontrada analíticamente, es función de soporte del conjunto convexo C.

16.- C caracterizado por epígrafes de conjugados convexos de piezas de energía no convexa.

17.- La implementación implica proyectar sobre epígrafes, hecho para lineal por partes y cuadrática hasta ahora.

18.- Regularizador de variación total también elevado a espacio de dimensiones superiores, igual que Pock et al. 2008.

19.- Resulta en un problema de punto de silla cóncavo-convexo, resuelto por algoritmo primal-dual en GPU.

20.- Solución obtenida por retroproyección de espacio superior a inferior.

21.- Evaluado en modelo convexo, sub-etiqueta precisa encuentra la misma solución que optimización directa con poco sobrecosto.

22.- Proporciona transición entre optimización directa y elevación funcional.

23.- Encuentra solución exacta con 10 etiquetas mientras que el tradicional necesita muchas más etiquetas y memoria.

24.- Para estéreo, el tradicional tiene sesgo de etiqueta visible incluso con muchas etiquetas.

25.- El método propuesto da resultados suaves con pocas etiquetas y menos tiempo/memoria.

26.- Clara mejora con conteos de etiquetas iguales, resultados razonables con solo 2 etiquetas.

27.- Concluye que es la primera relajación continua sub-etiqueta precisa para ciertas energías no convexas.

28.- Usa muchas menos etiquetas que la elevación tradicional mientras mejora tiempo y memoria.

29.- Generaliza de aproximaciones lineales por partes a convexas por partes.

30.- El código está disponible en línea.

Bóveda del Conocimiento construida porDavid Vivancos 2024