Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4 | Gemini Adv | Llama 3:
Resumen:
1.-La oradora se sorprendió por muchos artículos interesantes de NLP en la conferencia ICLEAR, pero la mayoría se centraron en temas limitados con abundantes datos de entrenamiento.
2.-La oradora se preguntó qué hacer cuando faltan datos de entrenamiento y aún se desea un buen rendimiento, un problema común en los dominios médicos.
3.-La experiencia de la oradora con el cáncer de mama y su tratamiento reveló que el aprendizaje automático no se estaba utilizando mucho a pesar de los abundantes datos.
4.-Solo el 3% de las decisiones oncológicas en EE.UU. se basan en pacientes en ensayos clínicos, un subconjunto pequeño y sesgado.
5.-Después del tratamiento, la oradora se sintió obligada a trabajar en problemas impactantes donde NLP podría marcar la diferencia, a pesar de los datos de entrenamiento limitados.
6.-Colaborar con médicos reveló desafíos en la extracción de información de registros médicos cuando faltan datos etiquetados para cada condición.
7.-Muchos sistemas de extracción de información médica siguen siendo basados en reglas hoy en día debido a la falta de datos de entrenamiento etiquetados.
8.-El objetivo se convirtió en lograr alta precisión con la supervisión limitada que los médicos podían proporcionar en minutos, transfiriendo conocimiento entre tareas relacionadas.
9.-Enfoque: Generar codificaciones específicas de tareas de registros médicos usando supervisión limitada de palabras clave que indican la relevancia de la oración para la condición.
10.-El entrenamiento adversarial alinea las codificaciones entre las tareas fuente y objetivo para habilitar un único clasificador, junto con la reconstrucción para preservar el contexto.
11.-Los experimentos mostraron que el enfoque rivalizó con el uso de datos en dominio y superó las líneas base, descubriendo representaciones transferibles de sentimiento a través de dominios.
12.-El sistema ahora está implementado y se utiliza en el Hospital General de Massachusetts (MGH) para extraer atributos de cáncer de mama de informes de patología.
13.-Agregar interpretabilidad es clave para que los médicos confíen y utilicen las predicciones de aprendizaje automático en entornos médicos.
14.-Objetivo: Aprender a proporcionar razonamientos extractivos para clasificaciones, sin anotaciones de razonamiento, mediante el entrenamiento conjunto de generador y predictor.
15.-Los experimentos de reseñas de cerveza mostraron que los razonamientos extractivos mantuvieron la precisión mientras se alineaban bien con los razonamientos humanos y superaban las líneas base.
16.-El sistema de razonamiento es utilizado por médicos en MGH para ver rápidamente explicaciones de clasificación, hacer correcciones y volver a entrenar el modelo.
17.-La oradora se dio cuenta de que el mayor impacto requiere ir más allá de NLP para analizar mediciones crudas como mamografías para potencialmente detectar signos tempranos de cáncer.
18.-Los estudios muestran el potencial de identificar patrones de cambio de tejido en mamografías antes de que aparezca el cáncer, posiblemente previniendo el cáncer con quimioprevención.
19.-Primer paso: Igualar la habilidad del radiólogo humano para predecir la densidad mamaria y el riesgo de cáncer (puntuación BI-RADS) a partir de mamografías.
20.-La predicción de densidad mamaria a partir de mamografías logró un 92% de precisión frente al 86% de acuerdo humano, una tarea resuelta.
21.-La predicción de la puntuación BI-RADS para identificar al 1% de las mujeres que necesitan reexaminación fue muy desafiante, con precisión muy por debajo de los radiólogos.
22.-Los malos resultados fueron corroborados por un estudio reciente de NYU, sugiriendo una tarea muy difícil a pesar de los grandes conjuntos de datos.
23.-Anotar ubicaciones de anormalidades en mil mamografías mejoró el rendimiento a 0.85 AUC, mejor pero aún no excelente.
24.-La oradora esperaba usar informes de radiología para guiar el modelo de visión hacia las anormalidades, pero el modelo de visión necesita mejora primero.
25.-La oradora solicita ideas de la audiencia sobre cómo mejorar la interpretación de mamografías para predecir el riesgo de cáncer.
26.-La oradora se motivó por su experiencia personal para trabajar en problemas impactantes sin muchos datos etiquetados.
27.-La oradora dice que la audiencia no necesita pasar por una experiencia similar para estar motivada a abordar desafíos de bajos recursos.
Bóveda del Conocimiento construida porDavid Vivancos 2024