Conocimiento Bóveda 6 /35 - ICML 2018
Modelos de Aprendizaje del Mundo: el Próximo Paso Hacia la IA.
Yann LeCun
< Imagen de Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef core fill:#f9d4d4, font-weight:bold, font-size:14px classDef techniques fill:#d4f9d4, font-weight:bold, font-size:14px classDef applications fill:#d4d4f9, font-weight:bold, font-size:14px classDef challenges fill:#f9f9d4, font-weight:bold, font-size:14px classDef future fill:#f9d4f9, font-weight:bold, font-size:14px Main["Modelos de Aprendizaje del Mundo:
el Próximo Paso
Hacia la IA."] Main --> A["Aprendizaje profundo: redes neuronales
multicapa 1"] A --> B["Aprendizaje supervisado: entrenamiento
con datos etiquetados 2"] A --> C["CNNs: especializadas para
datos tipo cuadrícula 3"] A --> D["Extracción de características: aprendizaje
de datos en bruto 4"] A --> E["Aprendizaje de extremo a extremo: de
entradas crudas a salidas 5"] Main --> F["Tecnologías habilitadoras"] F --> G["ImageNet: conjunto de datos
de imágenes a gran escala 6"] F --> H["Aceleración GPU: acelerar
el entrenamiento 7"] F --> I["Aprendizaje por transferencia: aplicar
conocimiento entre tareas 8"] F --> J["IA de código abierto: software
y modelos públicos 12"] Main --> K["Visión por Computadora"] K --> L["Segmentación semántica: etiquetado
de clases por píxel 9"] K --> M["Detección de objetos: identificar
y localizar objetos 10"] K --> N["Procesamiento en tiempo real: uso
inmediato de IA 11"] Main --> O["Procesamiento de Lenguaje Natural"] O --> P["PLN: entender y
generar lenguaje humano 13"] P --> Q["Traducción automática neuronal:
traducción de idiomas automatizada 14"] Main --> R["Aprendizaje por Refuerzo"] R --> S["AR: toma de decisiones a través de
interacción con el entorno 15"] S --> T["Eficiencia de muestra: aprender
de datos limitados 16"] S --> U["AR basado en modelos: usar
modelos del mundo 24"] Main --> V["Conceptos Avanzados"] V --> W["Razonamiento de sentido común:
desafío de conocimiento general 17"] V --> X["Modelos del mundo: representaciones
internas para predicción 18"] V --> Y["Aprendizaje auto-supervisado: aprender
de datos no etiquetados 19"] V --> Z["Entrenamiento adversarial: redes neuronales
en competencia 20"] V --> AA["Modelos generativos: crear
muestras de datos realistas 21"] V --> AB["Predicción de video: prever
futuras secuencias de video 22"] V --> AC["Modelos de variables latentes:
capturar incertidumbre 23"] Main --> AD["Aplicaciones"] AD --> AE["Conducción autónoma: navegación
de vehículos impulsada por IA 25"] AD --> AF["Aprendizaje multimodal: integrar
múltiples tipos de datos 26"] Main --> AG["Desafíos y Direcciones Futuras"] AG --> AH["IA explicable: procesos de toma de
decisiones interpretables 27"] AG --> AI["Aprendizaje de pocos disparos: aprender
de pocos ejemplos 28"] AG --> AJ["Ética de la IA: considerar
impactos sociales y morales 29"] AG --> AK["Ciencia de la inteligencia:
comprensión fundamental de la inteligencia 30"] class A,B,C,D,E core class F,G,H,I,J techniques class K,L,M,N,O,P,Q,R,S,T,U applications class V,W,X,Y,Z,AA,AB,AC challenges class AD,AE,AF,AG,AH,AI,AJ,AK future

Resumen:

1.- Aprendizaje profundo: Una rama del aprendizaje automático que utiliza redes neuronales con múltiples capas para aprender representaciones jerárquicas de datos.

2.- Aprendizaje supervisado: Entrenamiento de modelos de aprendizaje automático con datos etiquetados para hacer predicciones o clasificaciones.

3.- Redes Neuronales Convolucionales (CNNs): Arquitecturas de aprendizaje profundo especializadas en procesar datos tipo cuadrícula, particularmente efectivas para el análisis de imágenes.

4.- Extracción de características: El proceso de aprender automáticamente características relevantes de datos en bruto, reemplazando la ingeniería de características manual.

5.- Aprendizaje de extremo a extremo: Entrenamiento de modelos para mapear directamente desde entradas crudas a salidas deseadas sin representaciones intermedias diseñadas manualmente.

6.- ImageNet: Un conjunto de datos de imágenes a gran escala que catalizó avances en el aprendizaje profundo para tareas de visión por computadora.

7.- Aceleración GPU: Uso de unidades de procesamiento gráfico para acelerar significativamente el entrenamiento e inferencia de redes neuronales.

8.- Aprendizaje por transferencia: Aplicar el conocimiento adquirido de una tarea para mejorar el rendimiento en una tarea relacionada.

9.- Segmentación semántica: Asignación de etiquetas de clase a cada píxel en una imagen para una comprensión detallada de la escena.

10.- Detección de objetos: Identificación y localización de múltiples objetos en imágenes o secuencias de video.

11.- Procesamiento en tiempo real: Realización de tareas de IA lo suficientemente rápido para uso inmediato, como en aplicaciones móviles o vehículos autónomos.

12.- IA de código abierto: Software y modelos de IA disponibles públicamente que aceleran la investigación y el desarrollo en el campo.

13.- Procesamiento de Lenguaje Natural (PLN): Técnicas de IA para entender, interpretar y generar lenguaje humano.

14.- Traducción automática neuronal: Uso de redes neuronales para la traducción automatizada entre idiomas.

15.- Aprendizaje por refuerzo: Entrenamiento de agentes para tomar secuencias de decisiones interactuando con un entorno.

16.- Eficiencia de muestra: La capacidad de aprender efectivamente a partir de cantidades limitadas de datos de entrenamiento.

17.- Razonamiento de sentido común: El desafío de dotar a los sistemas de IA con conocimiento general que los humanos dan por sentado.

18.- Modelos del mundo: Representaciones internas de cómo funciona el mundo, permitiendo la predicción y la planificación.

19.- Aprendizaje auto-supervisado: Aprender representaciones útiles de datos no etiquetados prediciendo partes de la entrada.

20.- Entrenamiento adversarial: Una técnica donde dos redes neuronales compiten, una generando datos falsos y otra discriminando entre reales y falsos.

21.- Modelos generativos: Sistemas de IA que pueden crear nuevas muestras de datos realistas como imágenes o texto.

22.- Predicción de video: Previsión de futuros cuadros en una secuencia de video basada en observaciones pasadas.

23.- Modelos de variables latentes: Incorporación de variables no observadas para capturar incertidumbre y generar predicciones diversas.

24.- Aprendizaje por refuerzo basado en modelos: Uso de modelos del mundo aprendidos para planificar acciones y mejorar la eficiencia de muestra.

25.- Conducción autónoma: Aplicación de técnicas de IA para permitir que los vehículos naveguen y tomen decisiones sin intervención humana.

26.- Aprendizaje multimodal: Integración de información de múltiples tipos de datos (por ejemplo, visión y lenguaje) para sistemas de IA más robustos.

27.- IA explicable: Desarrollo de técnicas para hacer que los procesos de toma de decisiones de IA sean más interpretables y transparentes para los humanos.

28.- Aprendizaje de pocos disparos: La capacidad de aprender nuevas tareas o conceptos a partir de muy pocos ejemplos.

29.- Ética de la IA: Consideración de los impactos sociales y las implicaciones morales del desarrollo y despliegue de la IA.

30.- Ciencia de la inteligencia: La búsqueda de desarrollar una comprensión teórica fundamental de la inteligencia, tanto artificial como biológica.

Bóveda del Conocimiento construida por David Vivancos 2024