Conocimiento Bóveda 6 /65 - ICML 2021
Fontaneros y Mecánicos: Cómo el ML puede complementar el RCT en experimentos de política
Esther Duflo
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef trials fill:#f9d4d4, font-weight:bold, font-size:14px classDef ML fill:#d4f9d4, font-weight:bold, font-size:14px classDef policy fill:#d4d4f9, font-weight:bold, font-size:14px classDef data fill:#f9f9d4, font-weight:bold, font-size:14px A["Fontaneros y Mecánicos:
Cómo el ML puede
complementar el RCT en
experimentos de política"] --> B["Ensayos
Controlados
Aleatorizados"] A --> C["Aprendizaje
Automático"] A --> D["Diseño de
Políticas"] A --> E["Gestión de
Datos"] A --> F["Evaluación de
Impacto"] B --> B1["Probar intervenciones
efectos
causales. 1"] B --> B2["Variaciones en la respuesta
de subgrupos. 6"] B --> B3["Probar varias
intervenciones. 7"] B --> B4["Análisis eficiente de
múltiples tratamientos. 8"] B --> B5["Planificación de análisis
pre-experimento. 9"] B --> B6["Ajustar experimentos
basados en
resultados. 16"] C --> C1["ML para
mejora de
políticas. 2"] C --> C2["Experimentación vs
ajuste
analítico. 3"] C --> C3["ML con
econometría. 4"] C --> C4["Hacer modelos de ML
comprensibles. 17"] C --> C5["Problemas de prueba de
hipótesis
estadísticas. 19"] C --> C6["Evitar
sobreajuste. 23"] D --> D1["Determinar relaciones
causa-efecto. 5"] D --> D2["Fomentar comportamientos
deseados. 10"] D --> D3["Aprovechar conexiones
comunitarias. 11"] D --> D4["Recordatorios por
mensaje de texto. 12"] D --> D5["Evaluación de impacto vs
costo. 14"] D --> D6["Efectos de intervención
específicos del individuo. 20"] E --> E1["Obtener datos de alta
calidad. 15"] E --> E2["Usar registros del
gobierno. 18"] E --> E3["Problemas con conjuntos
de datos pequeños. 28"] E --> E4["Expandir pequeños
experimentos. 26"] E --> E5["Trabajo en equipo
interdisciplinario. 25"] E --> E6["Resultados medibles
predictivos. 22"] F --> F1["Mejorar políticas
del mundo real. 27"] F --> F2["Evaluar efectos de
programas de desarrollo. 30"] F --> F3["Efectividad
sobreestimada. 24"] F --> F4["Estructurar estudios
efectivamente. 29"] F --> F5["Aumentar tasas de
vacunación. 21"] F --> F6["Resultados
proxy. 22"] class A,B,B1,B2,B3,B4,B5,B6 trials class C,C1,C2,C3,C4,C5,C6 ML class D,D1,D2,D3,D4,D5,D6 policy class E,E1,E2,E3,E4,E5,E6 data class F,F1,F2,F3,F4,F5,F6 impact

Resumen:

1.- Ensayos Controlados Aleatorizados (RCTs): Método experimental para probar efectos causales de intervenciones asignando tratamientos aleatoriamente a grupos.

2.- Aprendizaje Automático en Políticas: Uso de técnicas de ML para analizar y mejorar experimentos de política, especialmente en economía del desarrollo.

3.- Fontaneros vs Mecánicos: Economistas como "fontaneros" experimentando con políticas; expertos en ML como "mecánicos" ajustando herramientas analíticas.

4.- Aprendizaje Automático Doble: Técnica que combina ML con métodos econométricos para estimar efectos de tratamiento controlando muchas variables.

5.- Inferencia Causal: Determinar relaciones de causa y efecto, un objetivo clave en experimentos de política y econometría.

6.- Heterogeneidad del Efecto del Tratamiento: Variaciones en cómo diferentes subgrupos responden a intervenciones, importante para adaptar políticas.

7.- Múltiples Tratamientos: Experimentar con varias intervenciones simultáneamente para encontrar combinaciones óptimas de políticas.

8.- Agrupación y Poda Inteligente: Método para analizar eficientemente experimentos con muchos brazos de tratamiento agrupando tratamientos similares.

9.- Planes de Pre-análisis: Planes detallados que especifican análisis antes de realizar experimentos para prevenir la minería de datos y aumentar la transparencia.

10.- Incentivos en Desarrollo: Uso de incentivos financieros u otros para fomentar comportamientos deseados, como la inmunización.

11.- Intervenciones en Redes Sociales: Aprovechar conexiones comunitarias para difundir información e influir en el comportamiento.

12.- Recordatorios por SMS: Uso de mensajes de texto para recordar a las personas acciones importantes, como vacunarse.

13.- Efecto Promedio Condicional del Tratamiento (CATE): Estimar cómo varían los efectos del tratamiento según características observables.

14.- Análisis de Costo-efectividad: Evaluar intervenciones basándose en su impacto relativo a su costo.

15.- Desafíos en la Recolección de Datos: Dificultades para obtener datos de alta calidad en contextos de desarrollo, a menudo requiriendo soluciones personalizadas.

16.- Ensayos Adaptativos: Experimentos que ajustan tratamientos basados en resultados intermedios para optimizar resultados.

17.- Explicabilidad en ML: El desafío de hacer comprensibles los modelos complejos de ML para los responsables de políticas y el público.

18.- Datos Administrativos: Utilizar registros gubernamentales existentes para investigación, a menudo requiriendo limpieza y procesamiento extensivos.

19.- Problema de Inferencia Múltiple: Desafíos estadísticos al probar muchas hipótesis simultáneamente, requiriendo ajuste de niveles de significancia.

20.- Efectos de Tratamiento Personalizados: Estimar cómo las intervenciones afectan de manera diferente a los individuos según sus características.

21.- Promoción de la Inmunización: Estrategias para aumentar las tasas de vacunación infantil en países en desarrollo.

22.- Resultados Proxy: Uso de resultados fácilmente medibles para predecir o representar impactos más difíciles de medir de interés.

23.- División de Muestras: Técnica para evitar el sobreajuste utilizando datos separados para el entrenamiento y evaluación del modelo.

24.- Maldición del Ganador: Fenómeno estadístico donde el tratamiento con mejor desempeño en un estudio puede parecer más efectivo de lo que realmente es.

25.- Colaboración Interdisciplinaria: Importancia de que economistas y expertos en ML trabajen juntos para resolver problemas complejos de política.

26.- Ampliación de Intervenciones: Desafíos en expandir experimentos exitosos a pequeña escala a poblaciones más grandes.

27.- Relevancia de Políticas: Asegurar que la investigación informe directamente y mejore las políticas y prácticas del mundo real.

28.- Limitaciones de Datos: Trabajar con conjuntos de datos más pequeños comunes en economía del desarrollo, a diferencia de los grandes datos en aplicaciones comerciales de ML.

29.- Diseño Experimental: Estructurar cuidadosamente los estudios para equilibrar múltiples objetivos de investigación y restricciones prácticas.

30.- Evaluación de Impacto: Evaluar los efectos de los programas de desarrollo en la vida de las personas, con el objetivo de mejorar las decisiones de política.

Bóveda del Conocimiento construida porDavid Vivancos 2024