Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4o | Llama 3:
Resumen:
1.- Reconocimiento de acciones humanas: Reconociendo acciones en secuencias de video
2.- Acciones como movimientos corporales estructurados: Espacial, temporal, jerárquico
3.- Enfoques anteriores: Bolsa de palabras descarta estructura, pirámides espacio-temporales solo la capturan débilmente
4.- Árboles espacio-temporales modelan acciones: Nodos raíz para todo el cuerpo, nodos de parte para partes del cuerpo
5.- Aristas del árbol representan tiempo, espacio, jerarquía
6.- Colección de árboles por acción para variación y coincidencia parcial
7.- Árboles eficientes para inferir, colecciones aproximan gráficos
8.- Componentes del árbol (nodos, aristas, pesos) aprendidos de datos
9.- Palabras de acción comparten parámetros entre árboles, reduciendo complejidad
10.- Conjunto de árboles utilizado para clasificar acciones
11.- Aprendizaje de palabras de acción: Agrupamiento discriminativo de segmentos espacio-temporales de raíz/parte
12.- Aprendizaje de árboles: Gráficos de segmentos espacio-temporales jerárquicos minados para subárboles frecuentes
13.- Minería de árboles, agrupamiento, clasificación para obtener conjunto compacto
14.- Coincidencia de árbol a gráfico permite coincidencias parciales, usa DP
15.- Experimentos en conjuntos de datos UCF Sports y Hi5
16.- Supera bolsa de palabras con las mismas características por ~80%
17.- Supera métodos de estructura predefinida que necesitan etiquetas de bbox
18.- Árboles más grandes capturando estructuras más complejas son más discriminativos
19.- Ejemplo de inferencia coincide nodos de árbol con regiones de video a lo largo del tiempo
20.- Generalización entre conjuntos de datos: Árboles Hi5 superan métodos recientes en Hollywood3D sin usar profundidad
21.- Método descubre automáticamente árboles de acción espacio-temporales
22.- Conjunto de árboles captura rica estructura para clasificación
23.- Resultados prometedores y generalización entre conjuntos de datos mostrada
24.- Modelo es sensible a la calidad de segmentación de video
25.- Experimentos en videos de buena resolución 400x600
26.- Enfoque de aprendizaje proporciona robustez a cierto ruido
27.- Póster demostrará más resultados
28.- Pregunta sobre sensibilidad al ruido de segmentación
29.- Usa método de segmentación ICSU 2013
30.- Resolución y calidad impactan segmentación, pero el aprendizaje proporciona cierta robustez
Bóveda del Conocimiento construida por David Vivancos 2024