El Fin Del Conocimiento - Bóveda 2 - ICLR (2014-2023) - Sesión de Artículos Destacados 1 ICLR 2021

graph LR classDef alex fill:#f9d4d4, font-weight:bold, font-size:14px; classDef eigengame fill:#d4f9d4, font-weight:bold, font-size:14px; classDef sde fill:#d4d4f9, font-weight:bold, font-size:14px; classDef meshgraphnets fill:#f9f9d4, font-weight:bold, font-size:14px; A[ICLR 2021
Sesión de Artículos Destacados 1] --> B[Alex: neurosíntesis de audio binaural
para VR. 1] B --> C[Datos capturados alrededor de maniquí
para entrenar modelo. 2] C --> D[Modelo deforma señal mono
para sintetizar binaural. 3] D --> E[Componentes clave: deformación, WaveNet,
pérdida L2 modificada. 4] B --> F[Supera bases, permite audio VR
realista. 5] A --> G[Ian: Eigengame reformula PCA
como juego multi-jugador. 6] G --> H[PCA top-k es equilibrio de Nash
del juego. 7] G --> I[Actualizaciones distribuidas via productos
matriz-vector, escalable. 8] I --> J[Calcula componentes principales rápidamente
en gran conjunto de datos. 9] G --> K[Aplicaciones novedosas, supera bases. 10] A --> L[Yang: modelo generativo invierte
SDE perturbando datos. 11] L --> M[Red neuronal estima función de puntuación
en niveles de ruido. 12] L --> N[Muestras generadas resolviendo
SDE en tiempo inverso. 13] L --> O[Probabilidades exactas calculadas transformando
SDE a ODE. 14] L --> P[Calidad de muestra de última generación, permite
generación condicional. 15] A --> Q[Tobias: MeshGraphNets para simulaciones
basadas en mallas usando GNNs. 16] Q --> R[Codifica sistema físico como
gráfico de elementos de malla. 17] R --> S[GNN predice evolución de malla,
generaliza a escenarios complejos. 18] Q --> T[Modela tela, fluidos, elasticidad
cambiando cantidades de malla. 19] Q --> U[Remallado adaptativo asigna resolución,
generaliza a mallas más grandes. 20] class A,B,C,D,E,F alex; class G,H,I,J,K eigengame; class L,M,N,O,P sde; class Q,R,S,T,U meshgraphnets;

Resumen:

1.-Alex de Facebook Reality Labs presenta investigación sobre neurosíntesis de audio binaural a partir de audio mono para sonido realista en realidad virtual.

2.-Capturaron datos de audio alrededor de un maniquí para entrenar un modelo de extremo a extremo con un componente de deformación temporal neuronal.

3.-El modelo deforma la señal mono en el tiempo basado en las posiciones del transmisor/receptor para sintetizar audio binaural que coincide con la verdad del terreno.

4.-Los componentes clave son la deformación temporal neuronal, una red tipo WaveNet, y una pérdida L2 modificada que equilibra la optimización de amplitud y fase.

5.-El enfoque supera las bases de procesamiento de señales digitales y permite una renderización de audio realista e inmersiva para aplicaciones de VR.

6.-Ian Gemp presenta Eigengame, reformulando PCA como la solución a un juego multi-jugador para hacerlo más naturalmente distribuido y descentralizado.

7.-Demuestran que la solución PCA top-k es un equilibrio de Nash del juego que construyen con una función de utilidad interpretable para cada jugador.

8.-Las actualizaciones distribuidas de Eigengame dependen solo de productos matriz-vector, permitiendo escalar a conjuntos de datos masivos en hardware TPU.

9.-En un gran conjunto de datos de un ResNet-200 preentrenado, Eigengame calcula los 32 componentes principales en 9 horas usando 32 TPUs.

10.-Eigengame permite aplicaciones novedosas como el análisis interpretable de redes neuronales y supera las bases como direcciones frecuentes.

11.-Yang Song presenta un modelo generativo basado en aprender a invertir una ecuación diferencial estocástica (SDE) que perturba datos en ruido.

12.-Una red neuronal se entrena para estimar la función de puntuación (gradiente de la probabilidad logarítmica) de la distribución de datos perturbados en cada nivel de ruido.

13.-Las muestras se generan dibujando ruido aleatorio y resolviendo numéricamente la SDE en tiempo inverso usando la red de puntuación.

14.-Se pueden calcular probabilidades exactas para el modelo transformando la SDE en tiempo inverso en una ODE y usando la fórmula de cambio instantáneo de variables.

15.-El modelo logra calidad de muestra de última generación y puntuaciones de probabilidad en conjuntos de datos de imágenes como CIFAR-10 y permite varias tareas de generación condicional.

16.-Tobias Pfaff presenta MeshGraphNets, un método para aprender simulaciones basadas en mallas usando redes neuronales de grafos.

17.-Los métodos de elementos finitos basados en mallas son cruciales para simulaciones físicas eficientes y adaptativas pero rara vez se usan en aprendizaje automático.

18.-Su modelo codifica un sistema físico como un gráfico con nodos/aristas que representan elementos de malla y su conectividad en el espacio físico y mundial.

19.-Se aplica una red neuronal de grafos aprendida al gráfico de entrada para predecir la evolución temporal de la malla de una manera que generaliza a escenarios complejos no vistos.

20.-La misma arquitectura puede modelar tela, fluidos y elasticidad simplemente cambiando las cantidades de malla de entrada y salida.

21.-El remallado adaptativo aprendido permite al modelo asignar más resolución a regiones importantes y generalizar a mallas mucho más grandes que las vistas durante el entrenamiento.

Bóveda de Conocimiento construida porDavid Vivancos 2024