Conocimiento Bóveda 6 /94 - ICML 2024
Ciencia Abierta Sin Remordimientos
Soumith Chintala
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef trends fill:#f9d4d4, font-weight:bold, font-size:14px classDef concerns fill:#d4f9d4, font-weight:bold, font-size:14px classDef stakeholders fill:#d4d4f9, font-weight:bold, font-size:14px classDef solutions fill:#f9f9d4, font-weight:bold, font-size:14px classDef future fill:#f9d4f9, font-weight:bold, font-size:14px Main["Ciencia Abierta Sin Remordimientos"] --> T["Tendencias Históricas"] Main --> C["Preocupaciones Actuales"] Main --> S["Dinámica de Interesados"] Main --> P["Soluciones Propuestas"] Main --> F["Direcciones Futuras"] T --> T1["Tendencia de apertura en ML hasta
veinte-veinte 1"] T --> T2["Compartir crea valor global 2"] T --> T3["El código abierto acelera el desarrollo 3"] T --> T4["Las empresas comparten el crecimiento del ecosistema 4"] T --> T5["La mejor investigación se comparte abiertamente 6"] T --> T6["El desarrollo se vuelve cerrado ahora 7"] C --> C1["Las patentes temporales dañan el compartir 5"] C --> C2["Las necesidades de cómputo crecen extensamente 8"] C --> C3["La sociedad examina la IA de cerca 9"] C --> C4["Aumentan las preocupaciones legales sobre datos 10"] C --> C5["Aumentan las preocupaciones de seguridad 11"] C --> C6["El progreso necesita pruebas de implementación 16"] S --> S1["Diferentes grupos moldean el futuro 12"] S --> S2["Startups apuntan a tareas específicas 13"] S --> S3["Los usuarios demandan acceso abierto 14"] S --> S4["Los grupos tienen objetivos en competencia 15"] S --> S5["Las naciones mantienen ventajas privadas 18"] P --> P1["OpenSync recoge retroalimentación humana 22"] P --> P2["Los costos de almacenamiento de retroalimentación aumentan 23"] P --> P3["Los grupos de licencias deben formarse 24"] P --> P4["El capitalismo ayuda a mantener abierto 26"] P --> P5["Colaboración academia-industria 28"] F --> F1["La IA cerrada afecta el crecimiento 17"] F --> F2["La confianza afecta el éxito de la regulación 19"] F --> F3["La automatización completa sigue distante 20"] F --> F4["Se necesita investigación cuidadosa de productos 21"] F --> F5["La IA generativa necesita evaluación 25"] F5 --> F6["La codicia escala la ciencia abierta 27"] F4 --> F7["La investigación impacta profundamente en la sociedad 29"] F3 --> F8["La eficiencia frente al tamaño importa 30"] class Main,T,T1,T2,T3,T4,T5,T6 trends class C,C1,C2,C3,C4,C5,C6 concerns class S,S1,S2,S3,S4,S5 stakeholders class P,P1,P2,P3,P4,P5 solutions class F,F1,F2,F3,F4,F5,F6,F7,F8 future

Resumen:

1.- El campo del aprendizaje automático estaba tendiendo hacia la apertura hasta 2020

2.- Razones para ser abierto: dar valor, progreso global, crecimiento del ecosistema

3.- Beneficios del código abierto: desarrollo del ecosistema más rápido con menos recursos

4.- Las empresas abren el código para comoditizar complementos (ejemplos PyTorch, LLaMA)

5.- Razones contra la apertura: ventaja temporal, patentes, efectos potencialmente dañinos

6.- 2010-2020: La mejor investigación cada vez más abierta (de AlexNet a BERT)

7.- Regresión post-2020 hacia el desarrollo de IA cerrada

8.- Crecientes requisitos de cómputo y recursos de ingeniería

9.- Mayor escrutinio social de los modelos de IA y datos

10.- Las preocupaciones sobre la legalidad de los datos se vuelven más importantes

11.- Aumentan las preocupaciones sobre seguridad e impacto social

12.- Diferentes interesados: académicos, investigadores de la industria, startups de AGI

13.- Startups de IA verticales enfocadas en tareas específicas

14.- Investigadores de Reddit y usuarios regulares de IA queriendo acceso abierto

15.- Múltiples objetivos en competencia entre diferentes grupos de interesados

16.- Dificultad para medir el progreso de la IA sin implementación

17.- Debate sobre la IA cerrada y la proliferación segura

18.- Cuestión de la ventaja nacional al mantener la IA cerrada

19.- La efectividad de la regulación depende de la confianza en las instituciones

20.- Posición del orador: la automatización completa de la IA aún está lejos

21.- Necesidad de integración y investigación de productos lenta y cuidadosa

22.- Propuesta de OpenSync: centralizar la recopilación de retroalimentación humana

23.- Desafío de los costos de almacenamiento y distribución de retroalimentación

24.- Necesidad de consorcios de licencias de datos

25.- Desafíos de evaluación en la IA generativa

26.- Importancia de abrazar el capitalismo mientras se mantiene la apertura

27.- La codicia como factor potencial de escalado para la ciencia abierta

28.- Beneficios de la colaboración academia-industria

29.- Necesidad de comprender el impacto social de la investigación

30.- Áreas de investigación futura: eficiencia del modelo, inteligencia vs tamaño

Bóveda del Conocimiento construida porDavid Vivancos 2024