Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:
Resumen:
1.- Susan Athey es profesora de economía en Stanford que investiga la intersección de economía, tecnología y aprendizaje automático.
2.- El trabajo empírico en estadística es casi equivalente a la inferencia causal en ciencias sociales. El objetivo es estimar efectos causales para responder preguntas.
3.- Ejemplos de preguntas causales incluyen impactos de políticas, campañas publicitarias, subastas y fusiones en resultados, bienestar, beneficios.
4.- El paradigma de entrenamiento-prueba se rompe para la inferencia causal ya que no se observa la verdad fundamental del resultado de cada unidad bajo diferentes tratamientos.
5.- El objetivo en la inferencia causal es predecir efectos de tratamiento, no solo resultados. Las propiedades estadísticas de las estimaciones son críticas dado que no hay verdad fundamental.
6.- La correlación no es igual a causalidad, por ejemplo, la confusión ocurre cuando la posición del enlace está correlacionada tanto con la calidad del enlace como con las tasas de clics.
7.- Los experimentos aleatorizados permiten estimar el efecto causal de la posición del enlace en los clics asignando la posición independientemente de la calidad del enlace.
8.- Los empíricos económicos se centran en identificar efectos causales encontrando fuentes de variación aleatoria o cuasi-aleatoria en la asignación de tratamientos.
9.- La notación de resultados potenciales define efectos causales a nivel de unidad como la diferencia en el resultado de una unidad si se asigna al tratamiento versus control.
10.- El problema fundamental de la inferencia causal es que el resultado potencial de una unidad solo se observa bajo el tratamiento realmente recibido, nunca ambos.
11.- Bajo aleatorización, los resultados potenciales no observados son independientes de la asignación de tratamiento, permitiendo una estimación imparcial de los efectos promedio del tratamiento.
12.- Los enfoques más allá de los experimentos incluyen encontrar experimentos naturales, usar preferencias reveladas para inferir valoraciones de agentes e imponer suposiciones estructurales sobre el comportamiento.
13.- El aprendizaje automático puede ayudar a reducir la varianza en la estimación de efectos promedio del tratamiento estratificando aleatoriamente de manera óptima en función de la heterogeneidad de efectos predicha.
14.- Los árboles causales modifican los árboles de decisión para dividir unidades en función de la heterogeneidad en los efectos del tratamiento en lugar de los resultados.
15.- La estimación honesta en árboles causales utiliza la mitad de los datos para construir el árbol y la otra mitad para estimar efectos dentro de las hojas.
16.- Los árboles honestos permiten intervalos de confianza válidos y valores p para efectos de tratamiento a nivel de hoja con muchas covariables al evitar el sobreajuste.
17.- La validación cruzada de árboles causales recompensa la heterogeneidad de efectos y penaliza la varianza de hojas, anticipando la estimación de efectos en datos retenidos.
18.- En experimentos de búsqueda, los árboles causales encontraron que las consultas informativas tenían mayores efectos de la posición del enlace en CTR que las consultas de imagen de celebridad.
19.- La estimación honesta redujo la varianza de los efectos a través de las hojas en 2.5x en comparación con la estimación adaptativa, aunque tiene menos poder.
20.- Los bosques causales promedian muchos árboles causales honestos para predicciones personalizadas, permitiendo estimaciones asintóticamente normales sin mucha pérdida en el rendimiento.
21.- Los bosques causales mejoran sobre k-vecinos más cercanos al coincidir solo en covariables relevantes para la heterogeneidad de efectos en lugar de todas las covariables.
22.- A diferencia de las tareas puramente predictivas, la falta de verdad fundamental requiere probar propiedades estadísticas de los estimadores causales para confiar en las estimaciones.
23.- Los métodos de aprendizaje automático pueden adaptarse para la inferencia causal modificando funciones objetivo y proporcionando nuevas avenidas para una inferencia válida.
24.- La economía se está beneficiando de importar métodos de ML, mientras que ML puede aprender del enfoque de la literatura de inferencia causal en aplicaciones, identificación e inferencia.
25.- Las áreas de colaboración incluyen la inferencia causal con redes, conectando pruebas AB a corto plazo con efectos a largo plazo y bandidos contextuales.
26.- Las suposiciones clave incluyen ignorabilidad (asignación de tratamiento como si fuera aleatoria), restricciones de exclusión en instrumentos, y preferencia revelada para modelos estructurales.
27.- Las suposiciones sustantivas sobre confusión son las más críticas. Las suposiciones de forma funcional anteriormente comunes pero ahora ya sea explícitas en modelos bayesianos o evitadas.
28.- El aprendizaje en línea podría permitir elegir tratamientos adaptativamente para maximizar la ganancia de información, con algunos métodos existentes que equilibran validez y rendimiento.
29.- Las estimaciones de efectos causales permiten decisiones de política óptimas, pero la eficacia puede decaer con el tiempo, siendo necesario medir factores que podrían cambiar.
30.- Comprender los impulsores de las brechas entre correlación y causalidad al desentrañar la confusión es un ejercicio clave en la economía empírica.
Bóveda del Conocimiento construida porDavid Vivancos 2024