El Fin Del Conocimiento - Bóveda 2 - ICLR (2014-2023)

graph LR classDef nlp fill:#f9d4d4, font-weight:bold, font-size:14px; classDef imitation fill:#d4f9d4, font-weight:bold, font-size:14px; classDef ilp fill:#d4d4f9, font-weight:bold, font-size:14px; classDef incomplete fill:#f9f9d4, font-weight:bold, font-size:14px; A[Hal Daumé III
ICLR 2015] --> B[NLP: comprensión
profunda de texto 1] B --> C[Idioma:
ambiguo, humorístico 2] B --> D[NLP rápido:
predictores entrenados 3] D --> E[Análisis:
analiza oraciones 4] E --> F[Características dinámicas:
acelera clasificación 5] A --> G[DAgger:
entrena políticas 6] G --> H[Oráculo: retroalimentación
incremental mejor 7] H --> I[Análisis:
acelerado, preciso 8] A --> J[Interpretación:
traducción en tiempo real 9] J --> K[Esperando, prediciendo,
tomando decisiones 10] A --> L[Cuestionario:
preguntas incrementales 11] L --> M[AI de Cuestionario:
predicción, zumbido 12] B --> N[Composicionalidad:
significados de frases 13] N --> O[Redes Neuronales Recursivas:
modelado semántico 14] O --> P[Modelos de Cuestionario:
mejor conjunto 15] A --> Q[NLP como ILPs:
búsqueda en tiempo de prueba 16] Q --> R[Búsqueda B&B: eficiencia 17] R --> S[Política B&B:
incumbente, no prometedor, adaptable 18] S --> T[B&B aprendido:
casi óptimo, pocos nodos 19] A --> U[Razonamiento incompleto:
observar, esperar 20] A --> V[Imitación: aprende
decisiones secuenciales 21] class B,C,D,E,F,N,O,P nlp; class G,H,I,J,K,L,M,V imitation; class Q,R,S,T ilp; class U incomplete;

Resumen:

1.-El Procesamiento de Lenguaje Natural (NLP) busca una comprensión profunda del texto para construir sistemas para tareas como traducción, extracción de información y respuesta a preguntas.

2.-El lenguaje es desafiante debido a la ambigüedad generalizada, como lo ilustran los titulares humorísticos de periódicos con múltiples interpretaciones.

3.-Se pueden construir sistemas de NLP rápidos entrenando algoritmos de aprendizaje sofisticados en datos para producir predictores optimizados que aproximan heurísticas hechas a mano.

4.-El análisis de dependencias analiza la estructura lingüística de las oraciones, pero los enfoques estándar que usan muchas características son computacionalmente costosos, especialmente para oraciones largas.

5.-La selección dinámica de características acelera la clasificación eligiendo secuencialmente un subconjunto de características para usar según el ejemplo que se está clasificando.

6.-El algoritmo DAgger entrena políticas agregando conjuntos de datos de trayectorias generadas por la política experta y políticas entrenadas a lo largo de múltiples iteraciones.

7.-Tener una política oráculo demasiado buena es problemático para el aprendizaje: un enfoque de entrenamiento que da retroalimentación incremental funciona mejor.

8.-Aplicar la selección dinámica de características y el aprendizaje por imitación al análisis de dependencias lo acelera sustancialmente manteniendo la precisión.

9.-La interpretación simultánea requiere traducir el habla de un idioma a otro en tiempo real, lo cual es desafiante debido a las diferencias de orden de palabras entre idiomas.

10.-Decidir cuándo esperar, predecir o comprometerse con una traducción puede formularse como un problema de toma de decisiones secuenciales resoluble mediante aprendizaje por imitación.

11.-En la competencia de trivia de cuestionarios, las preguntas se leen de manera incremental y los jugadores deben decidir cuándo presionar el botón con una respuesta.

12.-Un sistema de IA para jugar a los cuestionarios puede usar un modelo de predicción de respuestas combinado con una política de zumbido entrenada mediante aprendizaje por imitación.

13.-Capturar la semántica composicional, como inferir el significado de frases de varias palabras, es un desafío clave en la respuesta a preguntas.

14.-Las redes neuronales recursivas que combinan representaciones vectoriales de palabras y frases muestran potencial para modelar la composicionalidad semántica.

15.-En preguntas de historia y literatura, los modelos entrenados en datos de cuestionarios superan a los entrenados en Wikipedia, y los conjuntos de modelos funcionan mejor.

16.-Muchos problemas de NLP pueden formularse como programas lineales enteros (ILPs) para ser resueltos en tiempo de prueba usando búsqueda de ramificación y acotamiento.

17.-La estrategia de búsqueda utilizada en ramificación y acotamiento tiene un gran impacto en la eficiencia y puede optimizarse usando aprendizaje por imitación.

18.-Una política de ramificación y acotamiento aprendida debería encontrar buenas soluciones incumbentes temprano, identificar nodos no prometedores y adaptar su estrategia según la posición en el árbol.

19.-En los benchmarks de ILP, la ramificación y acotamiento con una política aprendida logra resultados casi óptimos mientras explora una fracción de los nodos expandidos por Gurobi.

20.-Razonar con información incompleta aprendiendo cuándo observar características o esperar más entradas puede mejorar la eficiencia y habilitar nuevas capacidades.

21.-El aprendizaje por imitación, al aprender políticas a partir de demostraciones de expertos, proporciona un marco general para aprender a tomar decisiones secuenciales en NLP y más allá.

Bóveda del Conocimiento construida porDavid Vivancos 2024