Conocimiento Bóveda 2/76 - ICLR 2014-2023
Kate Saenko ICLR 2021 - Charla Invitada - ¿Está sesgado mi conjunto de datos?
<Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4 | Gemini Adv | Llama 3:

graph LR classDef bias fill:#f9d4d4, font-weight:bold, font-size:14px; classDef adaptation fill:#d4f9d4, font-weight:bold, font-size:14px; classDef alignment fill:#d4d4f9, font-weight:bold, font-size:14px; classDef challenges fill:#f9f9d4, font-weight:bold, font-size:14px; classDef future fill:#f9d4f9, font-weight:bold, font-size:14px; A[Kate Saenko
ICLR 2021] --> B[Sesgo en el conjunto de datos: cobertura
inadecuada de situaciones raras 1] A --> C[Recolectar más datos:
difícil, costoso 2] A --> D[Adaptación de dominio: de fuente
a objetivo 3] D --> E[Fuente etiquetada, objetivo
no etiquetado, diferencia de distribución 4] D --> F[El cambio de distribución causa
mal rendimiento 5] A --> G[Confusión de dominio alinea
distribuciones no supervisadas 6] A --> H[Alineación adversarial: discriminador
vs codificador 7] A --> I[Adaptación a nivel de píxel: GANs
condicionales traducen estilo 8] I --> J[Traducción de pocos disparos: COCO-FUNIT
de fuente a objetivo 9] A --> K[Compensaciones de alineación
de píxel vs característica 10] A --> L[Alineación condicional de clase: pérdida del
clasificador alinea características 11] A --> M[Adaptación de conjunto abierto:
clases objetivo desconocidas 12] M --> N[DANCE: agrupa, alinea,
rechaza desconocidos 13] A --> O[Auto-supervisión entre dominios: alineación
de vecinos más cercanos no supervisada 14] A --> P[Office-31, VisDA, DomainNet
progreso de referencia 15] B --> Q[Conjunto de datos no sesgado difícil:
cobertura igual difícil 16] B --> R[Atajos de recolección introducen
sesgo vs control 17] A --> S[Técnicas de adaptación aplicables
más allá de la visión 18] S --> T[Datos de noticias de PLN
enfrentan cambios de dominio 19] A --> U[Dominios de prueba desconocidos
sin objetivo más difíciles 20] A --> V[Series temporales: adaptación
continua en línea 21] A --> W[Desafíos de ajuste de hiperparámetros
sin etiquetas objetivo 22] A --> X[Superposición de sesgo/cambio justicia
pero matizada 23] X --> Y[Justicia más allá de la precisión:
igualando errores 24] X --> Z[Decisiones de personas: evaluar
cuidadosamente el rendimiento objetivo 25] A --> AA[Progreso en aprendizaje no supervisado
puede ayudar al cambio 26] A --> AB[Problemas abiertos: superposición
desconocida, generalización no vista 27] A --> AC[VisDA 2021: competencia de
adaptación universal 28] A --> AD[Investigación: conjunto abierto,
cambio, justicia, multi-dominio 29] A --> AE[El orador invita a la discusión,
preguntas en el chat 30] class A,B,C,Q,R bias; class D,E,F,G,H,I,J,K,L,M,N,O,P,S,T,U,V,W,AA,AB,AC adaptation; class X,Y,Z challenges; class AD,AE future;

Resumen:

1.-El sesgo en el conjunto de datos es un problema donde los conjuntos de datos no cubren adecuadamente situaciones raras o tienen una representación desigual de varios atributos.

2.-Recolectar más datos para abordar el sesgo puede ser muy difícil y costoso en la práctica debido al crecimiento exponencial del presupuesto de etiquetado.

3.-La adaptación de dominio es el problema de adaptar un modelo entrenado en un dominio fuente para que funcione bien en un dominio objetivo.

4.-El dominio fuente tiene datos etiquetados mientras que el dominio objetivo no está etiquetado, y hay una diferencia de distribución entre ellos.

5.-El mal rendimiento del modelo bajo cambio de distribución es causado por diferencias en la distribución de puntos de datos de entrenamiento y prueba.

6.-La confusión de dominio alinea las distribuciones de fuente y objetivo añadiendo una pérdida no supervisada para fomentar estadísticas similares entre dominios.

7.-La alineación de dominio adversarial utiliza una red de discriminador de dominio para distinguir dominios mientras que el codificador intenta confundirlo, alineando distribuciones.

8.-La adaptación de dominio a nivel de píxel utiliza GANs condicionales para traducir imágenes de fuente para que coincidan con el estilo del dominio objetivo.

9.-La traducción en el espacio de píxeles de pocos disparos, como COCO-FUNIT, traduce una imagen de fuente a un estilo objetivo dado algunos ejemplos objetivos.

10.-La alineación de píxeles hace que los efectos de adaptación sean más interpretables pero puede tener problemas de GAN; la alineación de características es más flexible pero puede fallar silenciosamente.

11.-La alineación condicional de clase utiliza la pérdida del clasificador de tareas para alinear características objetivo con la fuente y alejarlas de los límites de decisión.

12.-La adaptación de dominio de conjunto abierto maneja espacios de etiquetas diferentes entre fuente y objetivo detectando y rechazando clases objetivo desconocidas.

13.-DANCE agrupa datos objetivo, alinea clases conocidas con la fuente y aleja clases objetivo desconocidas mediante pérdida de separación de entropía.

14.-La auto-supervisión entre dominios encuentra vecinos más cercanos entre dominios para alinear representaciones sin etiquetas como un paso de pre-entrenamiento no supervisado.

15.-Conjuntos de datos con múltiples distribuciones como Office-31, VisDA y DomainNet permiten evaluar el progreso en algoritmos de adaptación.

16.-Es difícil tener un conjunto de datos no sesgado, ya que la cobertura igual de todas las variaciones y factores latentes en datos complejos es difícil.

17.-La recolección de conjuntos de datos toma atajos por costo/tiempo, como la extracción web, lo que introduce sesgos en comparación con una recolección más controlada.

18.-Algunas técnicas de adaptación como las pérdidas de alineación de distribución son aplicables más allá de la visión a dominios como el texto que enfrentan cambios similares.

19.-En PLN, los datos de noticias enfrentan cambios de dominio debido a diferencias en la inclinación política y el formato de las fuentes de noticias.

20.-Manejar dominios desconocidos en el momento de la prueba sin datos objetivo es mucho más difícil y requiere aprender a generalizar desde dominios de entrenamiento diversos.

21.-Para datos de series temporales, los dominios pueden cambiar continuamente con el tiempo, requiriendo métodos que puedan adaptarse de manera en línea.

22.-Aplicar métodos de adaptación en la práctica enfrenta desafíos en el ajuste de hiperparámetros cuando las etiquetas objetivo no están disponibles para guiar las elecciones.

23.-Existe cierta superposición entre los problemas de sesgo/cambio de conjunto de datos y los problemas de justicia, ya que ambos se relacionan con brechas de rendimiento en los atributos de datos.

24.-Sin embargo, la justicia involucra consideraciones adicionales más allá de la precisión, como igualar las tasas de error, que requieren más matices que la simple adaptación.

25.-Tomar decisiones sobre personas requiere evaluar y entender cuidadosamente el rendimiento en distribuciones objetivo, no solo una adaptación ingenua.

26.-El progreso reciente en aprendizaje no supervisado podría ayudar a abordar el cambio de dominio al aprender de datos no etiquetados a través de múltiples dominios.

27.-Quedan problemas abiertos en el manejo de la superposición de clases desconocidas entre dominios y la generalización a dominios completamente no vistos sin datos objetivo.

28.-Una competencia de adaptación de dominio visual llamada VisDA se presentará en NeurIPS 2021, centrada en el entorno de adaptación universal.

29.-Los intereses de investigación incluyen la intersección del reconocimiento de conjunto abierto, el cambio de dominio, la justicia y el aprendizaje de datos no etiquetados de múltiples dominios.

30.-El orador invita a una mayor discusión sobre estos temas y revisará el chat para cualquier pregunta adicional.

Bóveda del Conocimiento construida porDavid Vivancos 2024