Conocimiento Bóveda 6 /6 - ICML 2015
Ciencia Social Computacional
Hanna Wallach
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef main fill:#f9d4d4, font-weight:bold, font-size:14px classDef intro fill:#d4f9d4, font-weight:bold, font-size:14px classDef methods fill:#d4d4f9, font-weight:bold, font-size:14px classDef models fill:#f9f9d4, font-weight:bold, font-size:14px classDef inference fill:#f9d4f9, font-weight:bold, font-size:14px classDef applications fill:#d4f9f9, font-weight:bold, font-size:14px Main["Ciencia Social Computacional"] Main --> A["Introducción a la Ciencia Social Computacional"] A --> A1["Ciencia social computacional: datos digitales,
métodos computacionales 1"] A --> A2["Ejemplos de investigación: sistemas de recomendación,
posiciones ideológicas, redes 2"] A --> A3["CS vs ciencias sociales:
objetos de estudio, métodos 3"] A --> A4["Intersección: combinando CS y
ciencias sociales 4"] A --> A5["Explicación vs predicción: teorías causales,
predicciones 5"] Main --> B["Métodos de Investigación"] B --> B1["Análisis exploratorio: descubriendo patrones,
informando investigación 6"] B --> B2["Modelos exploratorios: constructos no observables,
técnicas adaptadas 7"] B --> B3["Modelado bayesiano: variables latentes,
métodos probabilísticos 8"] B --> B4["Blys loop: especificar, inferir,
evaluar, revisar 9"] B --> B5["Variables del modelo: observadas, latentes,
teóricamente justificadas 10"] B --> B6["Justificación teórica: operacionalizar teoría
para explicación 11"] Main --> C["Modelos y Componentes"] C --> C1["Ejemplo: inferir proporciones de temas
de palabras 12"] C --> C2["Modelos gráficos: visualizar variables,
relaciones, replicación 13"] C --> C3["Componentes comunes: regresión, mezcla,
admixture, factorización 14"] Main --> D["Inferencia Estadística"] D --> D1["Inferencia estadística: computar distribución
posterior 15"] D --> D2["Inferencia posterior: desafío computacional,
aproximación 16"] D --> D3["Muestreo MCMC: extrae muestras posteriores 17"] D --> D4["Prueba de Geweke: valida implementación
de MCMC 18"] D --> D5["Inferencia variacional: aproximación posterior,
optimización 19"] D --> D6["MCMC vs VI: edad,
fundamentos, exactitud 20"] Main --> E["Validación del Modelo y Teoría"] E --> E1["Validación del modelo: evaluar, mejorar
usando posterior 21"] E --> E2["Validación de constructo: adecuación de
variables 22"] E --> E3["Verificación del modelo: ajuste, comparación,
selección 23"] E --> E4["Rol de la teoría: guía preguntas,
construcción, validación 24"] E --> E5["Equilibrio entre cálculo y teoría:
colaboración 25"] Main --> F["Aplicaciones y Colaboración"] F --> F1["Ejemplos de ciencia política: autores
investigación 26"] F --> F2["Modelos de punto ideal: medir
posiciones ideológicas 27"] F --> F3["Investigación de representación: datos de texto,
prioridades de legisladores 28"] F --> F4["Investigación de partidismo: datos de encuestas,
identidades sociales 29"] F --> F5["Colaboración interdisciplinaria: combinando métodos,
teoría 30"] class Main main class A,A1,A2,A3,A4,A5 intro class B,B1,B2,B3,B4,B5,B6 methods class C,C1,C2,C3 models class D,D1,D2,D3,D4,D5,D6 inference class E,E1,E2,E3,E4,E5,F,F1,F2,F3,F4,F5 applications

Resumen:

1.- Introducción a la ciencia social computacional: Estudio de fenómenos sociales utilizando información digitalizada y métodos computacionales/estadísticos.

2.- Ejemplos de investigación en ciencia social computacional: Estimación del impacto causal de sistemas de recomendación, posiciones ideológicas ajustadas a temas, redes de contratación de profesores.

3.- Diferencias entre ciencias de la computación y ciencias sociales: Objeto de estudio, fuerza motriz (métodos vs preguntas), tipos de datos, objetivos de investigación.

4.- Ciencia social computacional en la intersección: Combinación de elementos de ciencias de la computación y ciencias sociales de maneras específicas.

5.- Explicación vs predicción en investigación: Teorías causales y evidencia vs hacer predicciones; modelos interpretables, validación, elección de variables.

6.- Análisis exploratorio de datos: Descubrimiento de patrones, información para análisis explicativo o predictivo; difiere para científicos de la computación y científicos sociales.

7.- Modelos exploratorios y de medición en ciencias sociales: Manejo de constructos teóricos no observables; a menudo adaptados de modelos de ciencias de la computación.

8.- Marco de modelado bayesiano de variables latentes: Representa patrones no observados utilizando variables latentes; combina modelos probabilísticos, métodos bayesianos, validación.

9.- Bucle de Bly para modelado bayesiano de variables latentes: Proceso iterativo - especificar modelo, realizar inferencia, evaluar validez, revisar. Basado en teoría.

10.- Especificación de variables en modelos bayesianos de variables latentes: Observadas (datos, covariables), latentes (parámetros del modelo, cantidades de interés), justificadas teóricamente.

11.- Justificación teórica de elecciones de modelos para análisis explicativo: Las variables y relaciones deben operacionalizar la teoría; innecesario para predicción/exploración.

12.- Ejemplo de modelo bayesiano de variables latentes: Inferir proporciones latentes de temas en proyectos de ley del congreso a partir de palabras observadas. Define variables, relaciones.

13.- Modelos gráficos: Representación visual de variables (nodos), relaciones (aristas) y replicación (placas). Equivalente a ecuaciones de probabilidad conjunta.

14.- Componentes comunes de modelos en ciencia social computacional: Regresión lineal, modelos de mezcla, modelos de admixture, factorización de matrices. Independientes o combinados.

15.- Inferencia estadística en modelos bayesianos de variables latentes: Cálculo de distribución posterior de variables latentes dados los datos. Permite estimar cantidades de interés.

16.- Inferencia posterior como desafío computacional clave: El posterior es conjunto dividido por evidencia marginal intratable. Requiere métodos de aproximación.

17.- Muestreo de Monte Carlo por cadenas de Markov (MCMC): Extrae muestras del posterior para aproximarlo. Conceptualmente simple pero la implementación puede ser complicada.

18.- Prueba "Getting it Right" de Geweke para MCMC: Compara muestras del proceso generativo vs muestras que involucran algoritmo de inferencia. Valida implementación.

19.- Algoritmos de inferencia variacional: Aproximación del posterior intratable con distribución tratable. Convierte la inferencia en optimización de divergencia/límite inferior.

20.- Diferencias entre MCMC e inferencia variacional: Edad, fundamentos teóricos, exactitud, convergencia, velocidad. VI es más nuevo, rápido, mejor para grandes volúmenes de datos.

21.- Validación y crítica del modelo: Uso del posterior, teoría, otros datos para evaluar y mejorar el modelo. Paso importante en el bucle de Bly.

22.- Validación de constructo: Asegurar la adecuación de variables para representar constructos teóricos. Crucial para modelos explicativos, innecesario para modelos predictivos.

23.- Verificación, comparación, selección de modelos: Evaluar ajuste del modelo, comparar con modelos alternativos, seleccionar el mejor. Métodos difieren para predicción vs explicación.

24.- Rol de la teoría en ciencia social computacional: Guía preguntas de investigación, construcción de modelos, validación. Crucial para explicación, menos para predicción.

25.- Equilibrio entre cálculo y teoría: Técnicas computacionales permiten análisis de nuevos datos; teorías sociales proporcionan significado y contexto. Requieren colaboración.

26.- Introducción a ejemplos de ciencia política: La investigación del autor involucra preguntas políticas y datos; se demostrará un modelo en detalle.

27.- Modelos de punto ideal: Miden posiciones ideológicas de legisladores a partir de votos. Ejemplo de modelo de ciencia política basado en técnicas de CS.

28.- Investigación del autor sobre representación y agendas políticas: Usa datos de texto para entender cómo se presentan los legisladores y sus prioridades.

29.- Investigación del autor sobre partidismo e identidad social: Usa datos de encuestas para explorar el papel evolutivo del partidismo en identidades sociales.

30.- Importancia de la colaboración interdisciplinaria: La combinación de métodos computacionales y teoría de ciencias sociales requiere que los investigadores trabajen juntos de cerca.

Bóveda del Conocimiento construida por David Vivancos 2024