Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4o | Llama 3:
Resumen:
1.- Microsoft ha patrocinado CVPR durante los últimos 25 años, mostrando su compromiso a largo plazo con la investigación en visión por computadora.
2.- En 1991, Bill Gates creó Microsoft Research y planteó el desafío de crear computadoras que pudieran ver, oír, hablar y entender a los humanos.
3.- Microsoft cree que la investigación es clave para comercializar la visión por computadora, viéndola como un ciclo de investigación a producto a negocio.
4.- Microsoft da a los investigadores la libertad de seguir investigaciones impulsadas por la curiosidad, impulsadas por la implementación u otros estilos según el impacto que quieran tener.
5.- Ejemplos de investigación impulsada por la curiosidad en Microsoft incluyen trabajos en panoramas, mosaicos concéntricos y video panorámico en los primeros días de CVPR.
6.- En 2015-2016, Microsoft ganó categorías principales en los desafíos ImageNet y COCO con redes residuales muy profundas de 152 capas (ResNets) y redes completamente convolucionales basadas en regiones.
7.- La investigación impulsada por la implementación implica comprender los segmentos de clientes, necesidades y puntos de dolor, luego diseñar sistemas y productos para abordarlos a través de iteraciones rápidas.
8.- Microsoft Pix es una aplicación de cámara iOS impulsada por IA que incorpora tecnología de más de 20 artículos de CVPR/ICCV/ECCV para ofrecer características como la selección de la mejor toma.
9.- La última actualización de Pix agregó transferencia de estilo artístico basada en un artículo de CVPR 2017, mostrando la rápida implementación de nuevas investigaciones en productos.
10.- Microsoft desarrolla productos para muchos segmentos de clientes, incluidos consumidores, desarrolladores, trabajadores de la información y usuarios empresariales.
11.- Microsoft Cognitive Services proporciona un conjunto de APIs basadas en la nube para visión, habla, lenguaje, conocimiento y búsqueda para permitir a cualquier desarrollador construir aplicaciones inteligentes.
12.- La subtitulación de imágenes en Cognitive Services comenzó a partir del algoritmo de primer lugar de Microsoft en el desafío de subtitulación COCO 2015 que pasó la prueba de Turing el 32% del tiempo.
13.- Lanzar captionbot.ai permitió recopilar retroalimentación de usuarios para mejorar los modelos de subtitulación, aumentando la satisfacción del usuario y permitiendo la implementación en productos de Office.
14.- El Servicio de Visión Personalizada permite a los desarrolladores construir fácilmente sus propios clasificadores de imágenes robustos con un pequeño número de imágenes de entrenamiento.
15.- El Servicio de Visión Personalizada expone todas sus APIs para que los desarrolladores puedan mejorar programáticamente los modelos, como usar servicios de etiquetado de datos de terceros.
16.- La misión de Microsoft es empoderar a cada persona y organización para lograr más, incluidos los trabajadores de primera línea y de primera línea.
17.- Microsoft HoloLens es una computadora holográfica sin cables que permite la interacción con contenido digital y el mundo real.
18.- HoloLens ha sido utilizado por empresas como Japan Airlines para innovar en la capacitación y aumentar la satisfacción del cliente.
19.- HoloLens incorpora muchos años de investigación en visión por computadora de Microsoft, desde Kinect hasta Kinect Fusion y Holoportation.
20.- HoloLens utiliza visión por computadora a bordo para un seguimiento de cabeza robusto, mapeo de entornos 3D y reconocimiento de gestos.
21.- La última investigación de HoloLens mejora el seguimiento y los gestos utilizando redes neuronales profundas de última generación que se ejecutan localmente en el dispositivo.
22.- Microsoft desarrolló silicio personalizado, la Unidad de Procesamiento Holográfico, para ejecutar redes neuronales profundas con alta velocidad y bajo consumo de energía en HoloLens.
23.- La segunda versión de la HPU incorpora un coprocesador de IA para implementar de manera nativa y flexible redes neuronales profundas totalmente programables por Microsoft.
24.- Una demostración en vivo mostró el coprocesador de IA HPU 2.0 realizando segmentación y seguimiento de manos en tiempo real utilizando modelos de aprendizaje profundo como ResNet-18.
25.- Las oportunidades para comercializar la visión por computadora abarcan servicios en la nube inteligentes y dispositivos de borde inteligentes que son cada vez más potentes.
26.- Las lecciones aprendidas en Microsoft sobre la aceleración de la comercialización incluyen la importancia de los elementos humanos y la iteración entre los equipos de investigación y producto.
27.- Más empresas están reconociendo la importancia de la visión por computadora, pero necesitan invertir más en investigación para construir grandes productos.
28.- Una anécdota ilustró cómo la inversión en investigación fundamental, incluso si no es directamente aplicable, hace que el mundo sea más digno de defender.
29.- Microsoft Research ha realizado inversiones increíblemente exitosas que han beneficiado a Microsoft mientras avanzan en el campo de la visión por computadora.
30.- El orador expresó orgullo por las contribuciones de Microsoft y gratitud por la comunidad CVPR y sus fundadores al permitir este progreso durante décadas.
Bóveda de Conocimiento construida porDavid Vivancos 2024