Conocimiento Bóveda 6 /51 - ICML 2020
Haciendo Algo Bueno con Aprendizaje Automático
Lester Mackey
< Imagen de Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef main fill:#f9d4f9, font-weight:bold, font-size:14px classDef motivation fill:#f9d4d4, font-weight:bold, font-size:14px classDef projects fill:#d4f9d4, font-weight:bold, font-size:14px classDef methods fill:#d4d4f9, font-weight:bold, font-size:14px classDef covid fill:#f9f9d4, font-weight:bold, font-size:14px classDef future fill:#d4f9f9, font-weight:bold, font-size:14px Main["Haciendo Algo Bueno
con Aprendizaje Automático"] --> A["Motivación y
Antecedentes"] Main --> B["Proyectos Notables"] Main --> C["Métodos y
Enfoques"] Main --> D["Respuesta a COVID-19"] Main --> E["Direcciones Futuras"] A --> A1["Usar la ciencia
computacional para un cambio
positivo en el mundo 1"] A --> A2["Mejorar la detección
sísmica para la proliferación
nuclear 2"] A --> A3["Inspirado para
abordar problemas sociales
con datos 6"] A --> A4["Inició Estadísticas
para el Bien Social
en Stanford 7"] A --> A5["Enfoque de divide y vencerás
para problemas sociales 8"] A --> A6["Colaboró con
organizaciones afines para
el bien social 13"] B --> B1["Premio de Predicción
de ALS: predecir la
progresión de la enfermedad 3"] B --> B2["La solución superó
a los clínicos, redujo el tamaño
de los ensayos 5"] B --> B3["Optimización del
coaching financiero para clientes
de bajos ingresos 9"] B --> B4["Predicción de individuos
con altos costos de
salud para intervenciones 10"] B --> B5["Creación del Atlas
de Opiáceos para la
investigación en cuidados paliativos 11"] B --> B6["Estudio de reseñas
de ONG, encontró críticas
severas 12"] C --> C1["Conjunto de datos ALS:
irregular, valores atípicos, faltantes,
características irrelevantes 4"] C --> C2["Mejoró las previsiones
climáticas subestacionales 15"] C --> C3["Competencia Sub-Seasonal Climate
Forecaster Rodeo 16"] C --> C4["Compilación del Conjunto
de Datos Sub-Seasonal Rodeo de
fuentes meteorológicas 17"] C --> C5["Desarrollo de modelos,
ensamblados para máxima
habilidad 18"] C --> C6["El ensamblaje superó
a los competidores, mejoró las
previsiones de temperatura 19"] D --> D1["Sugerencia de previsión
de COVID durante la pandemia 21"] D --> D2["Grupo DELPHI
encargado de la previsión
de COVID-19 22"] D --> D3["Recopilación y compartición
de indicadores de COVID en EE.UU.
para previsión 23"] D --> D4["Creación del sitio web
COVIDCast con datos diarios
a nivel de condado 24"] D --> D5["Mejoró las previsiones
de precipitación, margen para
mejorar la precisión 20"] D --> D6["Contribución a
sitio web comunitario para
proyectos sociales 14"] E --> E1["Oportunidades de voluntariado:
DataKind, DSSG, Estadísticas
Sin Fronteras 25"] E --> E2["Concursos de ciencia
de datos para el bien
social 26"] E --> E3["Becas de verano
DSSG para estudiantes
y postdoctorados 27"] E --> E4["Enseñar cursos de ML
con enfoque en impacto
social 28"] E --> E5["Incentivar ML
para el bien social
en organizaciones 29"] E --> E6["Dedicar tiempo
para un impacto positivo
en el cambio social 30"] class Main main class A,A1,A2,A3,A4,A5,A6 motivation class B,B1,B2,B3,B4,B5,B6 projects class C,C1,C2,C3,C4,C5,C6 methods class D,D1,D2,D3,D4,D5,D6 covid class E,E1,E2,E3,E4,E5,E6 future

Resumen:

1.- El autor esperaba usar la ciencia computacional para cambiar el mundo para mejor desde que comenzó la escuela de posgrado.

2.- Trabajó en combatir la proliferación nuclear mejorando la detección de eventos sísmicos para la Organización del Tratado de Prohibición Completa de Ensayos Nucleares.

3.- Después del doctorado, participó en el Premio de Predicción de ALS para predecir la tasa de progresión de la enfermedad y ayudar a los clínicos y ensayos clínicos.

4.- Los desafíos clave con el conjunto de datos de ALS incluyeron series temporales irregulares, valores atípicos, datos faltantes y muchas características irrelevantes.

5.- Su solución ocupó el primer lugar, superando a 12 clínicos. Se estima que reducirá el tamaño de los ensayos de medicamentos para ALS en un 20%.

6.- Como postdoctorado, inspirado por DataKind y el programa Data Science for Social Good para abordar problemas sociales con datos.

7.- Inició el grupo de trabajo Estadísticas para el Bien Social en Stanford para trabajar en problemas como la pobreza, el hambre, la educación, el tráfico.

8.- Adoptó un enfoque de divide y vencerás: los miembros identificaron socios problemáticos, conjuntos de datos, preguntas inferenciales y reportaron al grupo.

9.- Trabajó con SparkPoint en la optimización de servicios de coaching financiero para clientes de bajos ingresos basándose en datos detallados de interacción con el cliente.

10.- Con el Centro de Investigación de Excelencia Clínica, predijo individuos con altos costos futuros de atención médica en Dinamarca para intervenciones proactivas.

11.- Ayudó a la Iniciativa de Oncología Global a crear una visualización de datos de consumo de opiáceos llamada Atlas de Opiáceos para investigadores de cuidados paliativos.

12.- Estudió reseñas de ONG con Great Nonprofits, encontrando que los clientes dependientes de los servicios para necesidades básicas dieron algunas de las críticas más severas.

13.- Colaboró con otras organizaciones e individuos afines que trabajan para usar la ciencia de datos para el bien social.

14.- Contribuyó al sitio web comunitario statsforchange.github.io para compartir recursos, socios potenciales, conjuntos de datos e ideas para proyectos de bien social.

15.- Después de mudarse, comenzó a trabajar en mejorar las previsiones climáticas subestacionales (2-6 semanas) que son importantes pero muy inexactas.

16.- La Oficina de Reclamación de EE.UU. llevó a cabo una competencia de previsión subestacional en tiempo real de un año llamada Sub-Seasonal Climate Forecaster Rodeo.

17.- Compiló el Conjunto de Datos Sub-Seasonal Rodeo de muchas fuentes de datos meteorológicos públicos para permitir el entrenamiento de modelos de previsión subestacional.

18.- Desarrolló dos modelos (regresión lineal multitarea y k-NN autorregresivo) y los ensambló para maximizar la habilidad de similitud coseno.

19.- Su modelo ensamblado superó al principal competidor y mejoró sobre la previsión operativa de EE.UU. (CFSv2) en un 37-53% para la temperatura.

20.- Para la precipitación, su enfoque mejoró sobre CFSv2 en un 128-154%, pero aún hay un margen significativo para mejorar la precisión.

21.- Durante la pandemia de COVID-19, recibió la sugerencia de trabajar en la previsión de COVID dado el conocimiento de colegas en previsión de gripe.

22.- El grupo DELPHI en CMU, un Centro de Excelencia en Previsión de Influenza de los CDC, fue encargado de la previsión de COVID-19.

23.- El equipo de respuesta a COVID-19 de DELPHI primero se centró en recopilar y compartir indicadores de COVID en EE.UU. para su uso en previsión.

24.- Creó el sitio web COVIDCast con datos diarios a nivel de condado sobre síntomas, búsquedas, visitas al médico. Datos disponibles a través de API para previsión.

25.- Existen muchas oportunidades para ofrecer habilidades de ciencia de datos a través de DataKind, la plataforma Solve de Data Science for Social Good, Estadísticas Sin Fronteras.

26.- Participar en concursos de ciencia de datos como los de Innocent Applies, DrivenData, Dream Challenges, Kaggle es otra vía.

27.- Las becas de verano de Data Science for Social Good están disponibles para estudiantes/postdoctorados en CMU, Stanford, UW para aprender habilidades en proyectos reales.

28.- Deberíamos enseñar más cursos de ML con impacto social real, publicar más trabajos de ML para el bien social, proporcionar lugares dedicados.

29.- Las empresas y universidades deberían incentivar ML para el bien social a través de metas, apoyo y recompensas como lo hacen los bufetes de abogados para el trabajo pro bono.

30.- Si todos dedicaran incluso el 1-5% de su tiempo a ser una fuerza positiva para el cambio social a través de su trabajo, imagina el impacto.

Bóveda de Conocimiento construida porDavid Vivancos 2024