Conocimiento Bóveda 6 /37 - ICML 2018
Inteligencia sin Modelo, Basada en Modelo, y General
Hector Geffner
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef historical fill:#f9d4d4, font-weight:bold, font-size:14px classDef approaches fill:#d4f9d4, font-weight:bold, font-size:14px classDef techniques fill:#d4d4f9, font-weight:bold, font-size:14px classDef challenges fill:#f9f9d4, font-weight:bold, font-size:14px classDef societal fill:#f9d4f9, font-weight:bold, font-size:14px Main["Inteligencia sin Modelo, Basada en Modelo, y
General"] Main --> A["IA temprana: programas
de tareas específicas 1"] A --> B["Cambio a tareas
matemáticas bien definidas 2"] A --> C["Aprendices vs Solucionadores:
principales enfoques de IA 3"] Main --> D["Aprendices profundos: redes
neuronales para tareas 4"] D --> E["RL profundo: toma de decisiones
en entornos dinámicos 5"] Main --> F["Solucionadores: algoritmos con
modelos explícitos 6"] F --> G["Solucionadores: generales pero
computacionalmente intensivos 7"] F --> H["Relajación de problemas para
soluciones tratables 8"] H --> I["Relajación monotónica en
planificación 9"] F --> J["Reconocimiento de objetivos: inferir
intenciones de agentes 10"] F --> K["Planificación generalizada: estrategias
multi-instancia 11"] F --> L["IW1: búsqueda en anchura basada
en poda 12"] F --> M["Planificación en línea para
juegos de Atari 13"] Main --> N["Sistema 1 y 2:
teoría de la cognición de procesos duales 14"] N --> O["Paralelismos en IA: aprendices
y solucionadores 15"] O --> P["Desafío de integración: combinando
aprendices y solucionadores 16"] P --> Q["AlphaZero: integración de aprendizaje y
planificación 17"] Main --> R["Cuellos de botella de representación en
resolución de problemas 18"] R --> S["Aprendizaje de variables de estado
a partir de observaciones 19"] R --> T["Aprendizaje de características para
planificación y modelado 20"] R --> U["Aprendizaje de representaciones abstractas
para planificación general 21"] Main --> V["Impacto de la IA en la sociedad 22"] V --> W["Principios de IA de Asilomar:
directrices para un desarrollo beneficioso 23"] V --> X["Alineación de la tecnología con
valores humanos 24"] V --> Y["Sociedad moderna apunta a
pensamiento intuitivo 25"] Main --> Z["Poder de cómputo: no
es la única solución 26"] Z --> AA["Problemas de confianza en
sistemas de IA de caja negra 27"] Z --> AB["Desafíos en aprendizaje de modelos y
planificación 28"] Z --> AC["Dificultades en especificación de
objetivos complejos 29"] Z --> AD["Abordar dilemas éticos
en IA 30"] class A,B,C historical class D,E,F,G approaches class H,I,J,K,L,M,N,O,P,Q techniques class R,S,T,U,Z,AA,AB,AC challenges class V,W,X,Y,AD societal

Resumen:

1.- Programación de IA: La IA temprana se centró en escribir programas para tareas específicas, pero carecía de generalidad y robustez fuera de los escenarios previstos.

2.- Cambio metodológico: La investigación en IA pasó de escribir programas para problemas mal definidos a diseñar algoritmos para tareas matemáticas bien definidas.

3.- Aprendices vs. Solucionadores: Dos enfoques principales en IA - aprendices (por ejemplo, aprendizaje profundo) y solucionadores (por ejemplo, planificadores clásicos).

4.- Aprendices profundos: Redes neuronales con parámetros ajustables, entrenadas para minimizar funciones de error en tareas como el reconocimiento de imágenes.

5.- Aprendizaje por refuerzo profundo: Redes neuronales entrenadas para tomar decisiones en entornos dinámicos, logrando un rendimiento sobrehumano en juegos.

6.- Solucionadores: Algoritmos que mapean entradas a salidas basándose en modelos explícitos, como planificadores clásicos o solucionadores SAT.

7.- Generalidad de los solucionadores: Los solucionadores funcionan en varios dominios sin entrenamiento, pero pueden requerir un tiempo de cómputo significativo para cada entrada.

8.- Relajación de problemas: Simplificar problemas complejos para hacerlos tratables, luego usar soluciones para guiar la resolución del problema original.

9.- Relajación monotónica: Una técnica de planificación que hace que los efectos de las acciones sean monotónicos, permitiendo la solución eficiente de problemas simplificados.

10.- Reconocimiento de objetivos: Usar planificadores para inferir el objetivo de un agente a partir del comportamiento observado, aplicando la regla de Bayes y consideraciones de costo.

11.- Planificación generalizada: Crear estrategias que funcionen en múltiples instancias de problemas, no solo resolviendo casos individuales.

12.- Algoritmo IW1: Una variante de búsqueda en anchura que poda estados que no hacen nuevas características verdaderas, permitiendo una exploración eficiente.

13.- Planificación en línea para Atari: Usar algoritmos de planificación para jugar juegos de Atari directamente desde los píxeles de la pantalla, compitiendo con enfoques de aprendizaje profundo.

14.- Sistema 1 y Sistema 2: Teoría de procesos duales de la cognición, con el Sistema 1 rápido e intuitivo y el Sistema 2 lento y deliberativo.

15.- Paralelismos con la IA: Los aprendices se asemejan al Sistema 1 (rápido, intuitivo), mientras que los solucionadores se asemejan al Sistema 2 (lento, deliberativo).

16.- Desafío de integración: Combinar aprendices y solucionadores para abordar problemas más complejos, similar a la cognición humana.

17.- AlphaZero: Un ejemplo de integración de aprendizaje y planificación, usando búsqueda de árboles de Monte Carlo para guiar el aprendizaje por refuerzo.

18.- Cuellos de botella de representación: Desafíos en representar y resolver problemas aparentemente simples como el Mundo de Bloques para instancias arbitrarias.

19.- Aprendizaje de variables de estado: La necesidad de inferir variables de estado del problema a partir de flujos de acciones y observaciones.

20.- Aprendizaje de características: Desarrollar métodos para aprender características generales útiles para la planificación y el aprendizaje de modelos.

21.- Representaciones abstractas: Aprender abstracciones finitas de problemas para permitir la planificación general para entradas de tamaño arbitrario.

22.- Impacto de la IA: A pesar de no alcanzar la inteligencia a nivel humano, la IA puede tener efectos sociales significativos, positivos o negativos.

23.- Principios de IA de Asilomar: Directrices para un desarrollo beneficioso de la IA, aunque difíciles de aplicar en la práctica.

24.- Alineación social: La necesidad de alinear no solo la IA, sino también la tecnología, la política y la economía con los valores humanos.

25.- Enfoque en el Sistema 1: La sociedad moderna a menudo se centra en el pensamiento intuitivo (Sistema 1) en lugar del análisis razonado (Sistema 2).

26.- Impacto del poder de cómputo: Aumentar los recursos computacionales por sí solos puede no resolver todos los desafíos de la IA, especialmente para problemas novedosos.

27.- Confianza en la IA: Dificultad para confiar en sistemas de IA de caja negra para aplicaciones críticas como los coches autónomos.

28.- Desafíos en el aprendizaje de modelos: La necesidad de mejores técnicas para aprender modelos precisos y planificar con modelos imperfectos.

29.- Especificación de objetivos: El desafío de expresar objetivos complejos, especialmente para problemas que normalmente se resuelven con el pensamiento del Sistema 1.

30.- Consideraciones éticas: La importancia de abordar dilemas éticos en la IA, incluidos escenarios para los que carecemos de datos o deseamos evitar.

Bóveda del Conocimiento construida porDavid Vivancos 2024