Conocimiento Bóveda 5 /94 - CVPR 2024
Las Imágenes de Hoy, Los Datos de Entrenamiento de Mañana: La Sinergia Entre la Creatividad Humana y la IA
Andrea Gagliano
< Imagen de Resumen >

Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4o | Llama 3:

graph LR classDef getty fill:#f9d4d4, font-weight:bold, font-size:14px classDef ai fill:#d4f9d4, font-weight:bold, font-size:14px classDef trends fill:#d4d4f9, font-weight:bold, font-size:14px classDef ethics fill:#f9f9d4, font-weight:bold, font-size:14px classDef tech fill:#f9d4f9, font-weight:bold, font-size:14px Main --> A["Imágenes Getty"] Main --> B["IA en Imágenes"] Main --> C["Tendencias Visuales"] Main --> D["Consideraciones Éticas"] Main --> E["Tecnología e Innovación"] A --> A1["Proveedor de imágenes de alta calidad
para diversas necesidades 1"] A --> A2["Programa de investigación que informa
sobre tendencias visuales 2"] A --> A3["Modelo de IA de Getty aborda
preocupaciones de los clientes 6"] A --> A4["El modelo utiliza imágenes con licencia
para el entrenamiento 7"] A --> A5["Las leyendas de alta calidad mejoran
el entrenamiento del modelo 8"] A --> A6["El modelo evita generar
contenido de marca 9"] B --> B1["Aumento del uso de IA en
creación de imágenes 4"] B --> B2["Explicación del proceso de
generación de imágenes 12"] B --> B3["Las imágenes generadas muestran
calidad superior 14"] B --> B4["Método para comparar el atractivo visual 15"] B --> B5["Puntos de referencia para calidad,
adherencia semántica 16"] B --> B6["IA visualiza conceptos difíciles de capturar 18"] C --> C1["Evolución de la imagen en la última década 3"] C --> C2["El conjunto de datos incluye conceptos contemporáneos 13"] C --> C3["Evolución de la imagen del lugar de trabajo 25"] C --> C4["Cambio en la representación de energía 26"] C --> C5["La representación emocional se vuelve matizada 27"] C --> C6["Las representaciones familiares se vuelven más diversas 29"] D --> D1["Preocupaciones legales y éticas
sobre imágenes de IA 5"] D --> D2["Objetivos para una producción de imágenes
diversa e inclusiva 10"] D --> D3["Énfasis en pagar a los creadores por su trabajo 11"] D --> D4["Importancia de compensar a los
creadores de contenido 23"] D --> D5["Fomento de datos de entrenamiento de IA con licencia 24"] D --> D6["Cambios en la visualización de la salud mental 28"] E --> E1["La creatividad humana se encuentra con
tecnología innovadora 17"] E --> E2["La fotografía tradicional sigue siendo esencial 19"] E --> E3["La creación continua refleja
cambios sociales 20"] E --> E4["Riesgo de que los modelos se vuelvan obsoletos 21"] E --> E5["Ilustra las limitaciones actuales de los modelos de IA 22"] E --> E6["La IA potencia la visualización
de conceptos complejos 30"] class A,A1,A2,A3,A4,A5,A6 getty class B,B1,B2,B3,B4,B5,B6 ai class C,C1,C2,C3,C4,C5,C6 trends class D,D1,D2,D3,D4,D5,D6 ethics class E,E1,E2,E3,E4,E5,E6 tech

Resumen:

1.- Imágenes Getty: Una empresa que proporciona imágenes y videos de alta calidad, sirviendo a clientes desde pequeñas empresas hasta grandes corporaciones para diversas necesidades de contenido.

2.- GPS Visual: El programa de investigación de Getty Images que informa sobre tendencias visuales, combinando encuestas de la industria y datos sobre el comportamiento de búsqueda y descarga.

3.- Evolución de las tendencias visuales: Cómo ha cambiado la representación de conceptos como el trabajo, la energía y la familia en la última década.

4.- IA en imágenes: El uso creciente de IA generativa en la creación de imágenes, con el 66% de los clientes de Getty Images utilizándola.

5.- Preocupaciones de los clientes: Cuestiones legales, de autenticidad, compensación y éticas en torno al uso de imágenes generadas por IA.

6.- IA generativa por Getty Images: Un modelo construido para abordar las preocupaciones de los clientes, impulsado por NVIDIA Picasso y disponible en Getty Images e iStock.

7.- Datos de entrenamiento con licencia: El modelo de Getty Images utiliza solo imágenes con licencia (alrededor de 200 millones) para el entrenamiento, asegurando un uso ético y legal.

8.- Leyendas y palabras clave de alta calidad: El conjunto de datos de Getty Images incluye leyendas y palabras clave añadidas, revisadas y editadas manualmente para un mejor entrenamiento del modelo.

9.- Evitación de marcas y logotipos: El modelo de Getty Images no genera contenido de marca ni logotipos, reduciendo los riesgos legales para los clientes.

10.- Autenticidad y representación: El modelo busca producir imágenes más diversas e inclusivas en comparación con otros generadores.

11.- Compensación a fotógrafos: Getty Images enfatiza la importancia de pagar a los creadores por su trabajo y su uso en el entrenamiento de IA.

12.- Modelo de difusión: Explicación de cómo funcionan los modelos de generación de imágenes, destacando la importancia de las imágenes de entrenamiento originales.

13.- Temas contemporáneos en datos de entrenamiento: El conjunto de datos de Getty Images incluye conceptos más recientes como sostenibilidad y trabajo remoto en comparación con los datos extraídos de la web.

14.- Comparación de calidad: Las imágenes generadas por Getty Images muestran mayor calidad y realismo en comparación con otros generadores de la industria.

15.- Puntuación de calidad estética: Un método utilizado para comparar el atractivo visual de las imágenes generadas en diferentes modelos.

16.- Gráfico FID vs CLIP: Puntos de referencia de la industria utilizados para comparar la calidad y adherencia semántica de las imágenes generadas con respecto a las imágenes reales.

17.- Magia creativa: La combinación de la creatividad humana y la tecnología innovadora en la producción de imágenes impactantes.

18.- IA generativa para visualizar conceptos: Uso de IA para crear imágenes que serían difíciles o imposibles de capturar con una cámara.

19.- Importancia de las imágenes capturadas con cámara: Algunos conceptos aún requieren personas reales y emociones capturadas por la fotografía tradicional.

20.- Futuro del contenido visual: La necesidad de una creación continua de nuevas imágenes para reflejar los cambios sociales y proporcionar datos de entrenamiento frescos.

21.- Colapso del modelo: El riesgo de que los modelos de IA se vuelvan obsoletos sin nuevos datos de entrenamiento del mundo real.

22.- Ejemplo de cuatro generaciones: Ilustra las limitaciones de los modelos de IA actuales en la generación de imágenes de conceptos no bien representados en los datos de entrenamiento.

23.- Pago a los creadores: La importancia de compensar a los fotógrafos y creadores por su trabajo y su uso en el entrenamiento de IA.

24.- Licenciamiento de datos de entrenamiento: Fomentar que las empresas licencien y paguen por los datos utilizados para entrenar sus modelos de IA.

25.- Evolución de los entornos de trabajo: Cómo ha cambiado la representación de los lugares de trabajo, desde entornos de oficina formales hasta trabajo remoto y equipos diversos.

26.- Cambio en la representación de la energía: Cambio en la imagen popular de plataformas petroleras a estaciones de carga de vehículos eléctricos.

27.- Evolución de la representación emocional: Movimiento de emociones exageradas y cursis a representaciones más matizadas y realistas de los sentimientos.

28.- Visualización de la salud mental: Cambios en cómo se representan visualmente los problemas de salud mental, especialmente en contextos laborales.

29.- Representación familiar: Cambio hacia representaciones familiares más diversas, incluyendo familias multigeneracionales, multirraciales y LGBTQ+.

30.- Impacto tecnológico en la creatividad: Cómo las herramientas de IA están permitiendo a los creadores iterar rápidamente y visualizar conceptos complejos o futuristas.

Bóveda de Conocimiento construida porDavid Vivancos 2024