Conocimiento Bóveda 2/79 - ICLR 2014-2023
Moderadores: Adriana Romero-Soriano · Yale Song ICLR 2021 - Sesión de Artículos Destacados 1
<Imagen de Resumen >

Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4 | Gemini Adv | Llama 3:

ICLR 2021
Sesión de Artículos Destacados 1
Alex: neurosíntesis de audio binaural
para VR. 1
Datos capturados alrededor de maniquí
para entrenar modelo. 2
Modelo deforma señal mono
para sintetizar binaural. 3
Componentes clave: deformación, WaveNet,
pérdida L2 modificada. 4
Supera bases, permite audio VR
realista. 5
Ian: Eigengame reformula PCA
como juego multi-jugador. 6
PCA top-k es equilibrio de Nash
del juego. 7
Actualizaciones distribuidas via productos
matriz-vector, escalable. 8
Calcula componentes principales rápidamente
en gran conjunto de datos. 9
Aplicaciones novedosas, supera bases. 10
Yang: modelo generativo invierte
SDE perturbando datos. 11
Red neuronal estima función de puntuación
en niveles de ruido. 12
Muestras generadas resolviendo
SDE en tiempo inverso. 13
Probabilidades exactas calculadas transformando
SDE a ODE. 14
Calidad de muestra de última generación, permite
generación condicional. 15
Tobias: MeshGraphNets para simulaciones
basadas en mallas usando GNNs. 16
Codifica sistema físico como
gráfico de elementos de malla. 17
GNN predice evolución de malla,
generaliza a escenarios complejos. 18
Modela tela, fluidos, elasticidad
cambiando cantidades de malla. 19
Remallado adaptativo asigna resolución,
generaliza a mallas más grandes. 20

Resumen:

1.-Alex de Facebook Reality Labs presenta investigación sobre neurosíntesis de audio binaural a partir de audio mono para sonido realista en realidad virtual.

2.-Capturaron datos de audio alrededor de un maniquí para entrenar un modelo de extremo a extremo con un componente de deformación temporal neuronal.

3.-El modelo deforma la señal mono en el tiempo basado en las posiciones del transmisor/receptor para sintetizar audio binaural que coincide con la verdad del terreno.

4.-Los componentes clave son la deformación temporal neuronal, una red tipo WaveNet, y una pérdida L2 modificada que equilibra la optimización de amplitud y fase.

5.-El enfoque supera las bases de procesamiento de señales digitales y permite una renderización de audio realista e inmersiva para aplicaciones de VR.

6.-Ian Gemp presenta Eigengame, reformulando PCA como la solución a un juego multi-jugador para hacerlo más naturalmente distribuido y descentralizado.

7.-Demuestran que la solución PCA top-k es un equilibrio de Nash del juego que construyen con una función de utilidad interpretable para cada jugador.

8.-Las actualizaciones distribuidas de Eigengame dependen solo de productos matriz-vector, permitiendo escalar a conjuntos de datos masivos en hardware TPU.

9.-En un gran conjunto de datos de un ResNet-200 preentrenado, Eigengame calcula los 32 componentes principales en 9 horas usando 32 TPUs.

10.-Eigengame permite aplicaciones novedosas como el análisis interpretable de redes neuronales y supera las bases como direcciones frecuentes.

11.-Yang Song presenta un modelo generativo basado en aprender a invertir una ecuación diferencial estocástica (SDE) que perturba datos en ruido.

12.-Una red neuronal se entrena para estimar la función de puntuación (gradiente de la probabilidad logarítmica) de la distribución de datos perturbados en cada nivel de ruido.

13.-Las muestras se generan dibujando ruido aleatorio y resolviendo numéricamente la SDE en tiempo inverso usando la red de puntuación.

14.-Se pueden calcular probabilidades exactas para el modelo transformando la SDE en tiempo inverso en una ODE y usando la fórmula de cambio instantáneo de variables.

15.-El modelo logra calidad de muestra de última generación y puntuaciones de probabilidad en conjuntos de datos de imágenes como CIFAR-10 y permite varias tareas de generación condicional.

16.-Tobias Pfaff presenta MeshGraphNets, un método para aprender simulaciones basadas en mallas usando redes neuronales de grafos.

17.-Los métodos de elementos finitos basados en mallas son cruciales para simulaciones físicas eficientes y adaptativas pero rara vez se usan en aprendizaje automático.

18.-Su modelo codifica un sistema físico como un gráfico con nodos/aristas que representan elementos de malla y su conectividad en el espacio físico y mundial.

19.-Se aplica una red neuronal de grafos aprendida al gráfico de entrada para predecir la evolución temporal de la malla de una manera que generaliza a escenarios complejos no vistos.

20.-La misma arquitectura puede modelar tela, fluidos y elasticidad simplemente cambiando las cantidades de malla de entrada y salida.

21.-El remallado adaptativo aprendido permite al modelo asignar más resolución a regiones importantes y generalizar a mallas mucho más grandes que las vistas durante el entrenamiento.

Bóveda de Conocimiento construida porDavid Vivancos 2024