Conocimiento Bóveda 2/35 - ICLR 2014-2023
Regina Barzilay ICLR 2017 - Charla Invitada - MÁS ALLÁ DEL ÁMBITO SUPERVISADO
<Imagen de Resumen >

Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4 | Gemini Adv | Llama 3:

graph LR classDef speaker fill:#f9d4d4, font-weight:bold, font-size:14px; classDef nlp fill:#d4f9d4, font-weight:bold, font-size:14px; classDef medical fill:#d4d4f9, font-weight:bold, font-size:14px; classDef learning fill:#f9f9d4, font-weight:bold, font-size:14px; classDef vision fill:#f9d4f9, font-weight:bold, font-size:14px; A[Regina Barzilay
ICLR 2017 ] --> B[Oradora: Artículos de ICLEAR NLP
temas limitados, datos amplios. 1] A --> C[Oradora: Falta de datos,
deseo de buen rendimiento. 2] C --> D[Problema común en dominios médicos. 3] D --> E[Experiencia de la oradora con cáncer de mama:
ML infrautilizado a pesar de los datos. 4] A --> F[Ensayos: pequeño subconjunto sesgado
de decisiones oncológicas. 5] A --> G[Oradora impulsada a trabajar
en problemas NLP impactantes. 6] G --> H[Desafíos en la extracción de información de registros médicos
sin datos etiquetados. 7] H --> I[Sistemas médicos basados en reglas
debido a la falta de datos. 8] A --> J[Objetivo: Alta precisión con
supervisión limitada de médicos. 9] J --> K[Enfoque: Codificaciones específicas de tareas
usando supervisión de palabras clave. 10] K --> L[Entrenamiento adversarial alinea
codificaciones, clasificador único. 11] L --> M[Experimentos: Rivalizó datos en dominio,
superó líneas base. 12] A --> N[Sistema MGH extrae
atributos de cáncer de mama. 13] N --> O[Interpretabilidad clave para
confianza y uso del médico. 14] O --> P[Objetivo: Razonamientos extractivos
sin anotaciones. 15] P --> Q[Experimentos de reseñas de cerveza:
Mantuvo precisión, superó. 16] A --> R[Médicos de MGH usan
sistema de razonamiento. 17] A --> S[Más allá de NLP: Analizar
mediciones crudas, imágenes. 18] S --> T[Mamografías para detectar
signos tempranos de cáncer. 19] S --> U[Igualar habilidad del radiólogo
para predecir BI-RADS. 20] U --> V[Predicción de densidad mamaria
92% precisión, resuelto. 21] U --> W[BI-RADS muy desafiante,
por debajo de precisión del radiólogo. 22] W --> X[Estudio de NYU corroboró
dificultad a pesar de los datos. 23] A --> Y[Anotación de anormalidades mejoró
a 0.85 AUC. 24] A --> Z[Modelo de visión necesita
mejora antes de los informes. 25] A --> AA[Oradora solicita ideas
para predecir riesgo. 26] A --> AB[Oradora motivada por
experiencia, problemas impactantes. 27] A --> AC[La audiencia puede abordar
desafíos de bajos recursos. 28] class A,B,C,AB,AC speaker; class D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R nlp; class S,T,U,V,W,X,Y,Z,AA vision; class D,E,F,N,T,U,V,W,X,Y medical; class J,K,L,M learning;

Resumen:

1.-La oradora se sorprendió por muchos artículos interesantes de NLP en la conferencia ICLEAR, pero la mayoría se centraron en temas limitados con abundantes datos de entrenamiento.

2.-La oradora se preguntó qué hacer cuando faltan datos de entrenamiento y aún se desea un buen rendimiento, un problema común en los dominios médicos.

3.-La experiencia de la oradora con el cáncer de mama y su tratamiento reveló que el aprendizaje automático no se estaba utilizando mucho a pesar de los abundantes datos.

4.-Solo el 3% de las decisiones oncológicas en EE.UU. se basan en pacientes en ensayos clínicos, un subconjunto pequeño y sesgado.

5.-Después del tratamiento, la oradora se sintió obligada a trabajar en problemas impactantes donde NLP podría marcar la diferencia, a pesar de los datos de entrenamiento limitados.

6.-Colaborar con médicos reveló desafíos en la extracción de información de registros médicos cuando faltan datos etiquetados para cada condición.

7.-Muchos sistemas de extracción de información médica siguen siendo basados en reglas hoy en día debido a la falta de datos de entrenamiento etiquetados.

8.-El objetivo se convirtió en lograr alta precisión con la supervisión limitada que los médicos podían proporcionar en minutos, transfiriendo conocimiento entre tareas relacionadas.

9.-Enfoque: Generar codificaciones específicas de tareas de registros médicos usando supervisión limitada de palabras clave que indican la relevancia de la oración para la condición.

10.-El entrenamiento adversarial alinea las codificaciones entre las tareas fuente y objetivo para habilitar un único clasificador, junto con la reconstrucción para preservar el contexto.

11.-Los experimentos mostraron que el enfoque rivalizó con el uso de datos en dominio y superó las líneas base, descubriendo representaciones transferibles de sentimiento a través de dominios.

12.-El sistema ahora está implementado y se utiliza en el Hospital General de Massachusetts (MGH) para extraer atributos de cáncer de mama de informes de patología.

13.-Agregar interpretabilidad es clave para que los médicos confíen y utilicen las predicciones de aprendizaje automático en entornos médicos.

14.-Objetivo: Aprender a proporcionar razonamientos extractivos para clasificaciones, sin anotaciones de razonamiento, mediante el entrenamiento conjunto de generador y predictor.

15.-Los experimentos de reseñas de cerveza mostraron que los razonamientos extractivos mantuvieron la precisión mientras se alineaban bien con los razonamientos humanos y superaban las líneas base.

16.-El sistema de razonamiento es utilizado por médicos en MGH para ver rápidamente explicaciones de clasificación, hacer correcciones y volver a entrenar el modelo.

17.-La oradora se dio cuenta de que el mayor impacto requiere ir más allá de NLP para analizar mediciones crudas como mamografías para potencialmente detectar signos tempranos de cáncer.

18.-Los estudios muestran el potencial de identificar patrones de cambio de tejido en mamografías antes de que aparezca el cáncer, posiblemente previniendo el cáncer con quimioprevención.

19.-Primer paso: Igualar la habilidad del radiólogo humano para predecir la densidad mamaria y el riesgo de cáncer (puntuación BI-RADS) a partir de mamografías.

20.-La predicción de densidad mamaria a partir de mamografías logró un 92% de precisión frente al 86% de acuerdo humano, una tarea resuelta.

21.-La predicción de la puntuación BI-RADS para identificar al 1% de las mujeres que necesitan reexaminación fue muy desafiante, con precisión muy por debajo de los radiólogos.

22.-Los malos resultados fueron corroborados por un estudio reciente de NYU, sugiriendo una tarea muy difícil a pesar de los grandes conjuntos de datos.

23.-Anotar ubicaciones de anormalidades en mil mamografías mejoró el rendimiento a 0.85 AUC, mejor pero aún no excelente.

24.-La oradora esperaba usar informes de radiología para guiar el modelo de visión hacia las anormalidades, pero el modelo de visión necesita mejora primero.

25.-La oradora solicita ideas de la audiencia sobre cómo mejorar la interpretación de mamografías para predecir el riesgo de cáncer.

26.-La oradora se motivó por su experiencia personal para trabajar en problemas impactantes sin muchos datos etiquetados.

27.-La oradora dice que la audiencia no necesita pasar por una experiencia similar para estar motivada a abordar desafíos de bajos recursos.

Bóveda del Conocimiento construida porDavid Vivancos 2024