Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4 | Gemini Adv | Llama 3:
Resumen:
1.-El sesgo en el conjunto de datos es un problema donde los conjuntos de datos no cubren adecuadamente situaciones raras o tienen una representación desigual de varios atributos.
2.-Recolectar más datos para abordar el sesgo puede ser muy difícil y costoso en la práctica debido al crecimiento exponencial del presupuesto de etiquetado.
3.-La adaptación de dominio es el problema de adaptar un modelo entrenado en un dominio fuente para que funcione bien en un dominio objetivo.
4.-El dominio fuente tiene datos etiquetados mientras que el dominio objetivo no está etiquetado, y hay una diferencia de distribución entre ellos.
5.-El mal rendimiento del modelo bajo cambio de distribución es causado por diferencias en la distribución de puntos de datos de entrenamiento y prueba.
6.-La confusión de dominio alinea las distribuciones de fuente y objetivo añadiendo una pérdida no supervisada para fomentar estadísticas similares entre dominios.
7.-La alineación de dominio adversarial utiliza una red de discriminador de dominio para distinguir dominios mientras que el codificador intenta confundirlo, alineando distribuciones.
8.-La adaptación de dominio a nivel de píxel utiliza GANs condicionales para traducir imágenes de fuente para que coincidan con el estilo del dominio objetivo.
9.-La traducción en el espacio de píxeles de pocos disparos, como COCO-FUNIT, traduce una imagen de fuente a un estilo objetivo dado algunos ejemplos objetivos.
10.-La alineación de píxeles hace que los efectos de adaptación sean más interpretables pero puede tener problemas de GAN; la alineación de características es más flexible pero puede fallar silenciosamente.
11.-La alineación condicional de clase utiliza la pérdida del clasificador de tareas para alinear características objetivo con la fuente y alejarlas de los límites de decisión.
12.-La adaptación de dominio de conjunto abierto maneja espacios de etiquetas diferentes entre fuente y objetivo detectando y rechazando clases objetivo desconocidas.
13.-DANCE agrupa datos objetivo, alinea clases conocidas con la fuente y aleja clases objetivo desconocidas mediante pérdida de separación de entropía.
14.-La auto-supervisión entre dominios encuentra vecinos más cercanos entre dominios para alinear representaciones sin etiquetas como un paso de pre-entrenamiento no supervisado.
15.-Conjuntos de datos con múltiples distribuciones como Office-31, VisDA y DomainNet permiten evaluar el progreso en algoritmos de adaptación.
16.-Es difícil tener un conjunto de datos no sesgado, ya que la cobertura igual de todas las variaciones y factores latentes en datos complejos es difícil.
17.-La recolección de conjuntos de datos toma atajos por costo/tiempo, como la extracción web, lo que introduce sesgos en comparación con una recolección más controlada.
18.-Algunas técnicas de adaptación como las pérdidas de alineación de distribución son aplicables más allá de la visión a dominios como el texto que enfrentan cambios similares.
19.-En PLN, los datos de noticias enfrentan cambios de dominio debido a diferencias en la inclinación política y el formato de las fuentes de noticias.
20.-Manejar dominios desconocidos en el momento de la prueba sin datos objetivo es mucho más difícil y requiere aprender a generalizar desde dominios de entrenamiento diversos.
21.-Para datos de series temporales, los dominios pueden cambiar continuamente con el tiempo, requiriendo métodos que puedan adaptarse de manera en línea.
22.-Aplicar métodos de adaptación en la práctica enfrenta desafíos en el ajuste de hiperparámetros cuando las etiquetas objetivo no están disponibles para guiar las elecciones.
23.-Existe cierta superposición entre los problemas de sesgo/cambio de conjunto de datos y los problemas de justicia, ya que ambos se relacionan con brechas de rendimiento en los atributos de datos.
24.-Sin embargo, la justicia involucra consideraciones adicionales más allá de la precisión, como igualar las tasas de error, que requieren más matices que la simple adaptación.
25.-Tomar decisiones sobre personas requiere evaluar y entender cuidadosamente el rendimiento en distribuciones objetivo, no solo una adaptación ingenua.
26.-El progreso reciente en aprendizaje no supervisado podría ayudar a abordar el cambio de dominio al aprender de datos no etiquetados a través de múltiples dominios.
27.-Quedan problemas abiertos en el manejo de la superposición de clases desconocidas entre dominios y la generalización a dominios completamente no vistos sin datos objetivo.
28.-Una competencia de adaptación de dominio visual llamada VisDA se presentará en NeurIPS 2021, centrada en el entorno de adaptación universal.
29.-Los intereses de investigación incluyen la intersección del reconocimiento de conjunto abierto, el cambio de dominio, la justicia y el aprendizaje de datos no etiquetados de múltiples dominios.
30.-El orador invita a una mayor discusión sobre estos temas y revisará el chat para cualquier pregunta adicional.
Bóveda del Conocimiento construida porDavid Vivancos 2024