Conocimiento Bóveda 6 /13 - ICML 2016
Inferencia Causal para Evaluación de Políticas
Susan Athey
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef main fill:#f9d4d4, font-weight:bold, font-size:14px classDef intro fill:#d4f9d4, font-weight:bold, font-size:14px classDef causal fill:#d4d4f9, font-weight:bold, font-size:14px classDef ml fill:#f9f9d4, font-weight:bold, font-size:14px classDef methods fill:#f9d4f9, font-weight:bold, font-size:14px classDef future fill:#d4f9f9, font-weight:bold, font-size:14px Main["Inferencia Causal para
Evaluación de Políticas"] Main --> A["Introducción a la Inferencia Causal"] A --> A1["Athey: economista, tecnología, investigadora de
aprendizaje automático 1"] A --> A2["La inferencia causal estima efectos,
responde preguntas 2"] A --> A3["Preguntas causales: políticas, publicidad,
impactos de subastas 3"] A --> A4["El paradigma de entrenamiento-prueba falla para
la inferencia causal 4"] A --> A5["Predicción de efectos de tratamiento, no
sólo resultados 5"] Main --> B["Conceptos de Inferencia Causal"] B --> B1["Correlación ≠ causalidad, ejemplo de
confusión explicado 6"] B --> B2["Experimentos aleatorizados estiman efectos de
vínculo causal 7"] B --> B3["Empíricos encuentran variación en la
asignación de tratamiento aleatorio 8"] B --> B4["Resultados potenciales definen efectos causales
a nivel de unidad 9"] B --> B5["Problema fundamental: resultados potenciales
no observados 10"] B --> B6["La aleatorización permite estimación imparcial de
efectos 11"] Main --> C["Aprendizaje Automático en Inferencia Causal"] C --> C1["ML reduce la varianza en
estimación de efectos 13"] C --> C2["Los árboles causales se dividen por
heterogeneidad de efectos 14"] C --> C3["Estimación honesta: dividir datos
para árbol/efectos 15"] C --> C4["Los árboles honestos permiten inferencia
estadística válida 16"] C --> C5["La validación cruzada de árboles causales recompensa
heterogeneidad de efectos 17"] C --> C6["Los bosques causales promedian árboles
para predicciones personalizadas 20"] Main --> D["Métodos y Aplicaciones"] D --> D1["Enfoques: experimentos naturales, preferencias
reveladas 12"] D --> D2["Experimento de búsqueda: tipo de consulta
afecta CTR 18"] D --> D3["La estimación honesta reduce la varianza
en hojas 19"] D --> D4["Los bosques causales mejoran sobre
k-vecinos más cercanos 21"] D --> D5["Probar propiedades estadísticas cruciales
para causalidad 22"] D --> D6["Métodos de ML adaptados para
inferencia causal 23"] Main --> E["Direcciones Futuras y Desafíos"] E --> E1["Economía y ML se benefician
de la colaboración 24"] E --> E2["Áreas de colaboración: redes, efectos a
largo plazo 25"] E --> E3["Suposiciones clave: ignorabilidad, restricciones
de exclusión 26"] E --> E4["Suposiciones de confusión sustantiva más
críticas 27"] E --> E5["El aprendizaje en línea maximiza la ganancia
de información 28"] E --> E6["Las estimaciones causales permiten decisiones
de política óptimas 29"] class Main main class A,A1,A2,A3,A4,A5 intro class B,B1,B2,B3,B4,B5,B6 causal class C,C1,C2,C3,C4,C5,C6 ml class D,D1,D2,D3,D4,D5,D6 methods class E,E1,E2,E3,E4,E5,E6 future

Resumen:

1.- Susan Athey es profesora de economía en Stanford que investiga la intersección de economía, tecnología y aprendizaje automático.

2.- El trabajo empírico en estadística es casi equivalente a la inferencia causal en ciencias sociales. El objetivo es estimar efectos causales para responder preguntas.

3.- Ejemplos de preguntas causales incluyen impactos de políticas, campañas publicitarias, subastas y fusiones en resultados, bienestar, beneficios.

4.- El paradigma de entrenamiento-prueba se rompe para la inferencia causal ya que no se observa la verdad fundamental del resultado de cada unidad bajo diferentes tratamientos.

5.- El objetivo en la inferencia causal es predecir efectos de tratamiento, no solo resultados. Las propiedades estadísticas de las estimaciones son críticas dado que no hay verdad fundamental.

6.- La correlación no es igual a causalidad, por ejemplo, la confusión ocurre cuando la posición del enlace está correlacionada tanto con la calidad del enlace como con las tasas de clics.

7.- Los experimentos aleatorizados permiten estimar el efecto causal de la posición del enlace en los clics asignando la posición independientemente de la calidad del enlace.

8.- Los empíricos económicos se centran en identificar efectos causales encontrando fuentes de variación aleatoria o cuasi-aleatoria en la asignación de tratamientos.

9.- La notación de resultados potenciales define efectos causales a nivel de unidad como la diferencia en el resultado de una unidad si se asigna al tratamiento versus control.

10.- El problema fundamental de la inferencia causal es que el resultado potencial de una unidad solo se observa bajo el tratamiento realmente recibido, nunca ambos.

11.- Bajo aleatorización, los resultados potenciales no observados son independientes de la asignación de tratamiento, permitiendo una estimación imparcial de los efectos promedio del tratamiento.

12.- Los enfoques más allá de los experimentos incluyen encontrar experimentos naturales, usar preferencias reveladas para inferir valoraciones de agentes e imponer suposiciones estructurales sobre el comportamiento.

13.- El aprendizaje automático puede ayudar a reducir la varianza en la estimación de efectos promedio del tratamiento estratificando aleatoriamente de manera óptima en función de la heterogeneidad de efectos predicha.

14.- Los árboles causales modifican los árboles de decisión para dividir unidades en función de la heterogeneidad en los efectos del tratamiento en lugar de los resultados.

15.- La estimación honesta en árboles causales utiliza la mitad de los datos para construir el árbol y la otra mitad para estimar efectos dentro de las hojas.

16.- Los árboles honestos permiten intervalos de confianza válidos y valores p para efectos de tratamiento a nivel de hoja con muchas covariables al evitar el sobreajuste.

17.- La validación cruzada de árboles causales recompensa la heterogeneidad de efectos y penaliza la varianza de hojas, anticipando la estimación de efectos en datos retenidos.

18.- En experimentos de búsqueda, los árboles causales encontraron que las consultas informativas tenían mayores efectos de la posición del enlace en CTR que las consultas de imagen de celebridad.

19.- La estimación honesta redujo la varianza de los efectos a través de las hojas en 2.5x en comparación con la estimación adaptativa, aunque tiene menos poder.

20.- Los bosques causales promedian muchos árboles causales honestos para predicciones personalizadas, permitiendo estimaciones asintóticamente normales sin mucha pérdida en el rendimiento.

21.- Los bosques causales mejoran sobre k-vecinos más cercanos al coincidir solo en covariables relevantes para la heterogeneidad de efectos en lugar de todas las covariables.

22.- A diferencia de las tareas puramente predictivas, la falta de verdad fundamental requiere probar propiedades estadísticas de los estimadores causales para confiar en las estimaciones.

23.- Los métodos de aprendizaje automático pueden adaptarse para la inferencia causal modificando funciones objetivo y proporcionando nuevas avenidas para una inferencia válida.

24.- La economía se está beneficiando de importar métodos de ML, mientras que ML puede aprender del enfoque de la literatura de inferencia causal en aplicaciones, identificación e inferencia.

25.- Las áreas de colaboración incluyen la inferencia causal con redes, conectando pruebas AB a corto plazo con efectos a largo plazo y bandidos contextuales.

26.- Las suposiciones clave incluyen ignorabilidad (asignación de tratamiento como si fuera aleatoria), restricciones de exclusión en instrumentos, y preferencia revelada para modelos estructurales.

27.- Las suposiciones sustantivas sobre confusión son las más críticas. Las suposiciones de forma funcional anteriormente comunes pero ahora ya sea explícitas en modelos bayesianos o evitadas.

28.- El aprendizaje en línea podría permitir elegir tratamientos adaptativamente para maximizar la ganancia de información, con algunos métodos existentes que equilibran validez y rendimiento.

29.- Las estimaciones de efectos causales permiten decisiones de política óptimas, pero la eficacia puede decaer con el tiempo, siendo necesario medir factores que podrían cambiar.

30.- Comprender los impulsores de las brechas entre correlación y causalidad al desentrañar la confusión es un ejercicio clave en la economía empírica.

Bóveda del Conocimiento construida porDavid Vivancos 2024