Conocimiento Bóveda 6 /23 - ICML 2017
Genómica, Big Data y Aprendizaje Automático
Peter Donnelly
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3.5 Sonnet | Chat GPT4o | Llama 3:

graph LR classDef main fill:#f9d9c9, font-weight:bold, font-size:14px classDef basics fill:#d4f9d4, font-weight:bold, font-size:14px classDef analysis fill:#d4d4f9, font-weight:bold, font-size:14px classDef applications fill:#f9f9d4, font-weight:bold, font-size:14px classDef future fill:#f9d4f9, font-weight:bold, font-size:14px Main["Genómica, Big Data,
y Aprendizaje Automático"] Main --> A["Fundamentos de Genética"] Main --> B["Análisis Genético"] Main --> C["Aplicaciones en Salud"] Main --> D["Direcciones Futuras"] A --> A1["La genética entusiasma, ofrece ideas sobre biología,
transforma la salud 1"] A --> A2["ADN, genes, cromosomas, SNPs
fundamentos explicados 2"] A --> A3["Patrones de herencia del ADN humano
muestran correlación 7"] A --> A4["Costo de secuenciación del genoma disminuido,
datos en expansión 20"] B --> B1["La genética del ornitorrinco revela diferencias
poblacionales 3"] B --> B2["PCA separa poblaciones de ornitorrincos de Tasmania
y del continente 4"] B --> B3["STRUCTURE revela estructura genética más fina
en ornitorrincos 5"] B --> B4["El modelo STRUCTURE es similar al
modelo de temas 6"] B --> B5["Métodos estadísticos imputan marcadores,
infieren cromosomas 8"] B --> B6["HMMs capturan patrones de correlación
de datos genéticos 9"] C --> C1["Diferencias genéticas en el Reino Unido estudiadas,
2000 individuos 10"] C --> C2["Los clústeres genéticos del Reino Unido coinciden
con patrones históricos 11"] C --> C3["Los datos genéticos revelan migración desconocida
en Inglaterra 12"] C --> C4["La genética influye en el riesgo de enfermedades
simples y complejas 13"] C --> C5["GWAS compara frecuencias de variantes,
encuentra riesgos 14"] C --> C6["Las variantes de GWAS tienen pequeños
efectos en enfermedades complejas 15"] D --> D1["Las variantes genéticas informan el desarrollo
de medicamentos, efectos 16"] D --> D2["La aleatorización mendeliana establece relaciones
causales 17"] D --> D3["La genética identifica tipos de tejido
relevantes para enfermedades 18"] D --> D4["Las correlaciones genéticas proporcionan
ideas biológicas 19"] D --> D5["La aplicación predice riesgos de enfermedades,
desglose de ascendencia 21"] D --> D6["Las puntuaciones de riesgo particionadas informan
intervenciones 22"] E["Consideraciones Adicionales"] --> E1["La genética juega un papel menor
en la predicción de enfermedades 23"] E --> E2["Los datos genéticos y de salud mejoran
la predicción de riesgos 24"] E --> E3["Informe de la Royal Society: datos,
recomendaciones educativas 25"] E --> E4["Genomics plc: los datos genéticos
mejoran la salud 26"] E --> E5["Discriminación genética prohibida o
evitada 27"] E --> E6["Equilibrar privacidad, beneficios de investigación
es crucial 28"] Main --> E class Main main class A,A1,A2,A3,A4 basics class B,B1,B2,B3,B4,B5,B6 analysis class C,C1,C2,C3,C4,C5,C6 applications class D,D1,D2,D3,D4,D5,D6,E,E1,E2,E3,E4,E5,E6 future

Resumen:

1.- Peter Donnelly discute la emocion en la genética y la genómica, proporcionando ideas sobre la biología humana y transformando la salud.

2.- Ofrece una visión general de los fundamentos de la genética, incluyendo ADN, genes, cromosomas y polimorfismos de nucleótido único (SNPs).

3.- Donnelly estudia los ornitorrincos, mamíferos únicos encontrados en Australia, utilizando información genética para entender su historia natural y diferencias poblacionales.

4.- El análisis de componentes principales de los datos genéticos del ornitorrinco separa los ornitorrincos de Tasmania de los del continente y muestra un gradiente de norte a sur.

5.- STRUCTURE, un enfoque de agrupamiento basado en modelos, revela una estructura genética más fina en las poblaciones de ornitorrincos en Australia.

6.- El modelo STRUCTURE es similar al modelo de temas/LDA, desarrollado independientemente en genética y aprendizaje automático.

7.- Los datos genéticos humanos muestran patrones de correlación debido a la herencia de fragmentos de ADN y eventos de recombinación.

8.- Los métodos estadísticos pueden imputar marcadores genéticos faltantes e inferir cromosomas separados (faseado) a partir de datos genéticos.

9.- Los modelos ocultos de Markov pueden capturar la estructura en mosaico y los patrones de correlación en los datos genéticos.

10.- Donnelly estudió las diferencias genéticas en el Reino Unido, muestreando 2000 individuos en 500,000 SNPs.

11.- Los clústeres genéticos a escala fina en el Reino Unido coinciden con patrones históricos de migración, reinos y divisiones culturales/lingüísticas.

12.- Los datos genéticos revelan una migración sustancial previamente desconocida en Inglaterra que mejor coincide con el ADN de la Francia moderna.

13.- La genética juega un papel en las enfermedades mendelianas simples y en los trastornos complejos influenciados por muchas variantes genéticas y el ambiente.

14.- Los estudios de asociación del genoma completo (GWAS) comparan las frecuencias de variantes genéticas entre casos de enfermedad y controles para encontrar loci de riesgo.

15.- La mayoría de las variantes de GWAS tienen pequeños efectos en enfermedades complejas, ya que la selección natural limita la frecuencia de variantes de gran efecto.

16.- Las variantes genéticas pueden informar el desarrollo de medicamentos al imitar el efecto de los medicamentos y predecir la eficacia y los efectos secundarios.

17.- La genética puede establecer relaciones causales entre factores de riesgo y enfermedades utilizando la aleatorización mendeliana.

18.- Los datos genéticos pueden identificar qué tipos de tejido son relevantes para una enfermedad, como la importancia de los tejidos inmunes en el Alzheimer.

19.- Las correlaciones genéticas entre rasgos, como la inteligencia fluida y el logro educativo o la longevidad, pueden proporcionar ideas biológicas.

20.- El costo de la secuenciación del genoma ha disminuido drásticamente, y la cantidad de datos genéticos disponibles está aumentando rápidamente.

21.- Donnelly demuestra un prototipo de aplicación que predice riesgos de enfermedades y desglose de ascendencia a partir de los datos genéticos de un individuo.

22.- Las puntuaciones de riesgo particionadas pueden informar intervenciones al separar factores de riesgo modificables y no modificables.

23.- Es probable que la genética por sí sola juegue un papel menor en la predicción del riesgo de enfermedades en comparación con otros datos de salud.

24.- La combinación de datos genéticos y otros datos de salud puede mejorar la predicción del riesgo de enfermedades a nivel individual y poblacional.

25.- Un informe de aprendizaje automático de la Royal Society hace recomendaciones sobre datos abiertos, educación en habilidades digitales, prioridades de investigación y desarrollo ético de algoritmos.

26.- La empresa de Donnelly, Genomics plc, tiene como objetivo utilizar datos genéticos para entender la biología y transformar la salud.

27.- La discriminación genética en seguros está prohibida por ley en los EE.UU. y evitada voluntariamente por los aseguradores del Reino Unido.

28.- Equilibrar las preocupaciones de privacidad con los beneficios de la investigación genética a gran escala para el desarrollo de medicamentos y la predicción de riesgos es crucial.

29.- Integrar datos genéticos con otros datos ómicos (ADN mitocondrial, microbioma) puede proporcionar una imagen biológica más completa.

30.- Las prácticas estadísticas rigurosas, como la replicación en conjuntos de datos independientes, son esenciales para evitar descubrimientos falsos en estudios genéticos a gran escala.

Bóveda del Conocimiento construida porDavid Vivancos 2024