Conocimiento Bóveda 6 /3 - ICML 2015
Aprendiendo Políticas de Tratamiento en Salud Móvil
Susan Murphy
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef main fill:#f9d4d4, font-weight:bold, font-size:14px classDef overview fill:#d4f9d4, font-weight:bold, font-size:14px classDef data fill:#d4d4f9, font-weight:bold, font-size:14px classDef trials fill:#f9f9d4, font-weight:bold, font-size:14px classDef policy fill:#f9d4f9, font-weight:bold, font-size:14px classDef challenges fill:#d4f9f9, font-weight:bold, font-size:14px Main["Aprendiendo Políticas de Tratamiento
en Salud Móvil"] Main --> A["Visión General de Intervenciones de Salud Móvil"] A --> A1["Intervención móvil adaptativa de salud
para comportamientos 1"] A --> A2["Estudios: cesación del tabaquismo, reducción
de comportamiento sedentario 2"] A --> A3["Determinar contexto para intervenciones
intrusivas 3"] A --> A4["Varias intervenciones, enfoque en
provisión de tratamiento 7"] A --> A5["Ejemplo de sugerencia de actividad
en smartphone contextual 8"] A --> A6["Tratamientos requieren disponibilidad de
persona 9"] Main --> B["Recolección y Estructura de Datos"] B --> B1["Datos de series temporales: observaciones,
acciones, respuestas 4"] B --> B2["Tiempos de decisión: intervalos regulares
o solicitudes 5"] B --> B3["Observaciones: sensores pasivos, mínimos
autoinformes 6"] B --> B4["Disponibilidad permite intervención, no disponibilidad
informativa 16"] Main --> C["Ensayos Micro-aleatorizados"] C --> C1["Ensayos micro-aleatorizados evalúan efectos
de intervención 10"] C --> C2["Aleatorización previene confusión en
datos observacionales 11"] C --> C3["Evaluar señal de efecto de intervención
con el tiempo 12"] C --> C4["Permitir abordar varias preguntas de
investigación 13"] C --> C5["Efectos principales: diferencia en
respuestas proximales 14"] C --> C6["Cambios en efectos: habituación, carga,
disponibilidad 15"] Main --> D["Consideraciones Estadísticas"] D --> D1["Efecto marginal estimado, promediado
sobre contexto 17"] D --> D2["Hipótesis de baja dimensión permiten ensayos
más pequeños 18"] D --> D3["Contrastes dentro de la persona aumentan
poder estadístico 19"] D --> D4["HeartSteps: 40 personas, 80% poder,
0.1 efecto 20"] Main --> E["Aprendizaje de Políticas"] E --> E1["Aprender cuándo impulsar intervenciones 21"] E --> E2["Políticas actuales usan teorías de dominio 22"] E --> E3["Políticas interpretables, estocásticas mejoran
compromiso 23"] E --> E4["Recompensa promedio se alinea con
objetivos de intervención 24"] E --> E5["Ecuación de Bellman permite aprendizaje
fuera de política 25"] E --> E6["Estimadores usan pesos de muestreo
de importancia invertidos 26"] Main --> F["Estudios de Caso y Desafíos"] F --> F1["Estudio de cesación del tabaquismo: intervenciones
dos veces al día 27"] F --> F2["Política de mindfulness basada en
autocontrol, carga 28"] F --> F3["Intervenciones: sin aumento de autocontrol,
sin carga 29"] F --> F4["Problemas abiertos: datos faltantes,
sensores, causalidad 30"] class Main main class A,A1,A2,A3,A4,A5,A6 overview class B,B1,B2,B3,B4 data class C,C1,C2,C3,C4,C5,C6,D,D1,D2,D3,D4 trials class E,E1,E2,E3,E4,E5,E6 policy class F,F1,F2,F3,F4 challenges

Resumen:

1.- El objetivo es construir una intervención de salud móvil que aprenda continuamente y ayude a las personas a mantener comportamientos saludables y se ajuste a los desafíos.

2.- Dos estudios de ejemplo: entrenador de cesación del tabaquismo usando dispositivos portátiles y reducción de comportamiento sedentario para pacientes con infarto usando smartphones.

3.- Las intervenciones en dispositivos móviles/portátiles pueden ser intrusivas, por lo que es importante determinar el contexto adecuado para entregar sugerencias.

4.- Los estudios de salud móvil generan datos de series temporales para cada persona con observaciones, acciones (intervenciones) y medidas de respuesta proximal.

5.- Los tiempos de decisión pueden ser en intervalos regulares (por ejemplo, cada minuto o pocas horas) o cuando la persona solicita apoyo.

6.- Las observaciones incluyen datos de sensores recolectados pasivamente y datos de autoinforme recolectados activamente. El objetivo es minimizar la carga de autoinforme.

7.- Gran variedad de acciones de intervención posibles (cognitivas, conductuales, sociales, etc). El enfoque aquí es si proporcionar un tratamiento.

8.- Ejemplo de una sugerencia de actividad en smartphone, adaptada al contexto. La persona puede aceptar, rechazar o posponer la sugerencia.

9.- Proporcionar tratamientos requiere que la persona esté disponible (por ejemplo, no conduciendo, ya caminando o habiendo desactivado intervenciones).

10.- Los ensayos micro-aleatorizados aleatorizan a cada individuo en cada punto de decisión. Permiten evaluar los efectos causales de impulsar intervenciones.

11.- Sin aleatorización, los efectos de las intervenciones se confunden con las razones por las que los individuos eligen acceder a ellas en datos observacionales.

12.- Los objetivos incluyen evaluar si hay alguna señal de que impulsar intervenciones tiene un efecto, cómo cambia eso con el tiempo.

13.- También se quiere permitir que se aborden una variedad de otras preguntas con los datos resultantes más allá de solo los efectos del tratamiento.

14.- Los efectos principales son la diferencia en la respuesta proximal promedio entre individuos disponibles que recibieron la intervención vs no.

15.- Los efectos pueden cambiar con el tiempo debido a la habituación, la carga y la composición cambiante de las personas que permanecen disponibles.

16.- La disponibilidad significa que una persona puede recibir la intervención en ese momento. La no disponibilidad puede proporcionar información útil.

17.- Se estima un efecto marginal a nivel de población, promediado sobre el contexto actual. Permite un análisis inicial relativamente simple.

18.- Se propone usar hipótesis alternativas de baja dimensión y suaves para permitir dimensionar el ensayo con menos participantes manteniendo el poder.

19.- Los contrastes dentro de la persona de la respuesta cuando se trata vs no aumentan el poder y reducen el tamaño de muestra requerido en comparación con los contrastes entre personas.

20.- En HeartSteps, un estudio de 40 personas proporciona un 80% de poder para detectar un tamaño de efecto estandarizado de 0.1 con un 40% de disponibilidad.

21.- ¿Cómo usar los datos de ensayos micro-aleatorizados para aprender una política de tratamiento de cuándo impulsar intervenciones en cada contexto?

22.- Los enfoques actuales especifican completamente las políticas de tratamiento usando teorías de dominio. El objetivo es usar datos para informar la política.

23.- Se desean políticas interpretables que los expertos puedan evaluar. Las políticas estocásticas pueden mejorar el compromiso al retrasar la habituación a los mensajes.

24.- La formulación de recompensa promedio se alinea con el objetivo de mantener a las personas en estados con menor carga para permitir la respuesta a las intervenciones.

25.- La ecuación de Bellman forma la base para el aprendizaje fuera de política, ya que la expectativa no depende de la distribución estacionaria inducida por la política.

26.- Esto permite formar estimadores con pesos de muestreo de importancia invertidos, aproximando la función de valor diferencial y maximizando sobre los parámetros de la política.

27.- Análisis del estudio de cesación del tabaquismo sin datos de sensores y con autoinformes e intervenciones dos veces al día durante 14 días.

28.- Estimación de política para cuándo proporcionar intervenciones de mindfulness basadas en demandas de autocontrol y carga indicada, a pesar de la pequeña muestra.

29.- Los resultados sugieren proporcionar intervenciones con mayor frecuencia cuando no hay aumento en las demandas de autocontrol y no hay carga indicada.

30.- Quedan muchos problemas abiertos, incluyendo datos faltantes, reducción de autoinformes a favor de sensores, problemas de inferencia causal y intervalos de confianza.

Bóveda del Conocimiento construida porDavid Vivancos 2024