Conocimiento Bóveda 5 /23 - CVPR 2017
Comercialización de la visión por computadora: Historias de éxito y lecciones aprendidas
Harry Shum
< Imagen del Resumen >

Gráfico de Conceptos & Resumen usando Claude 3 Opus | Chat GPT4o | Llama 3:

graph LR classDef microsoft fill:#f9d4d4, font-weight:bold, font-size:14px classDef research fill:#d4f9d4, font-weight:bold, font-size:14px classDef products fill:#d4d4f9, font-weight:bold, font-size:14px classDef hololens fill:#f9f9d4, font-weight:bold, font-size:14px classDef future fill:#f9d4f9, font-weight:bold, font-size:14px A["Comercialización de la visión por computadora:
Historias de éxito y
lecciones aprendidas"] --> B["Microsoft patrocina CVPR,
compromiso de 25 años. 1"] A --> C["Microsoft Research creado,
desafío de visión por computadora planteado. 2"] C --> D["Investigación clave para comercializar
visión por computadora. 3"] C --> E["Libertad para investigadores de
seguir varios estilos. 4"] C --> F["Investigación impulsada por curiosidad: panoramas,
mosaicos, video. 5"] C --> G["Microsoft gana ImageNet,
COCO con ResNets, FCNs. 6"] A --> H["Investigación impulsada por implementación: necesidades del
cliente, iteraciones rápidas. 7"] H --> I["Microsoft Pix: aplicación de cámara
iOS impulsada por IA. 8"] I --> J["Actualizaciones de Pix: transferencia de estilo
de artículo de CVPR. 9"] A --> K["Productos para varios
segmentos de clientes. 10"] K --> L["Servicios Cognitivos: APIs en la nube
para aplicaciones inteligentes. 11"] L --> M["Subtitulación de imágenes del
ganador del desafío COCO. 12"] M --> N["Captionbot.ai: retroalimentación de usuarios,
implementación en Office. 13"] L --> O["Servicio de Visión Personalizada:
clasificadores de imágenes fáciles. 14"] O --> P["APIs de Visión Personalizada para
mejora programática de modelos. 15"] A --> Q["Misión: empoderar a cada
persona y organización. 16"] Q --> R["HoloLens: computadora holográfica
sin cables. 17"] R --> S["HoloLens utilizado para
entrenamiento, satisfacción del cliente. 18"] R --> T["HoloLens incorpora años
de investigación en visión por computadora de MS. 19"] R --> U["HoloLens: CV a bordo para
seguimiento, mapeo, gestos. 20"] U --> V["Última investigación de HoloLens:
aprendizaje profundo para seguimiento, gestos. 21"] R --> W["Silicio personalizado HPU para
aprendizaje profundo en HoloLens. 22"] W --> X["HPU 2.0: coprocesador de IA,
programable por Microsoft. 23"] X --> Y["Demostración: HPU 2.0 segmentación
y seguimiento de manos en tiempo real. 24"] A --> Z["Oportunidades abarcan servicios en la nube
y dispositivos de borde. 25"] A --> AA["Lecciones: elementos humanos,
iteración investigación-producto. 26"] A --> AB["Más empresas reconocen
importancia de la visión por computadora. 27"] AB --> AC["Inversión en investigación fundamental
hace que el mundo valga la pena defender. 28"] A --> AD["Microsoft Research: inversiones exitosas,
avance en el campo. 29"] A --> AE["Orgullo en contribuciones,
gratitud por la comunidad CVPR. 30"] class A,B,K,Q,Z,AA,AB,AC,AD,AE microsoft class C,D,E,F,G research class H,I,J,L,M,N,O,P products class R,S,T,U,V,W,X,Y hololens

Resumen:

1.- Microsoft ha patrocinado CVPR durante los últimos 25 años, mostrando su compromiso a largo plazo con la investigación en visión por computadora.

2.- En 1991, Bill Gates creó Microsoft Research y planteó el desafío de crear computadoras que pudieran ver, oír, hablar y entender a los humanos.

3.- Microsoft cree que la investigación es clave para comercializar la visión por computadora, viéndola como un ciclo de investigación a producto a negocio.

4.- Microsoft da a los investigadores la libertad de seguir investigaciones impulsadas por la curiosidad, impulsadas por la implementación u otros estilos según el impacto que quieran tener.

5.- Ejemplos de investigación impulsada por la curiosidad en Microsoft incluyen trabajos en panoramas, mosaicos concéntricos y video panorámico en los primeros días de CVPR.

6.- En 2015-2016, Microsoft ganó categorías principales en los desafíos ImageNet y COCO con redes residuales muy profundas de 152 capas (ResNets) y redes completamente convolucionales basadas en regiones.

7.- La investigación impulsada por la implementación implica comprender los segmentos de clientes, necesidades y puntos de dolor, luego diseñar sistemas y productos para abordarlos a través de iteraciones rápidas.

8.- Microsoft Pix es una aplicación de cámara iOS impulsada por IA que incorpora tecnología de más de 20 artículos de CVPR/ICCV/ECCV para ofrecer características como la selección de la mejor toma.

9.- La última actualización de Pix agregó transferencia de estilo artístico basada en un artículo de CVPR 2017, mostrando la rápida implementación de nuevas investigaciones en productos.

10.- Microsoft desarrolla productos para muchos segmentos de clientes, incluidos consumidores, desarrolladores, trabajadores de la información y usuarios empresariales.

11.- Microsoft Cognitive Services proporciona un conjunto de APIs basadas en la nube para visión, habla, lenguaje, conocimiento y búsqueda para permitir a cualquier desarrollador construir aplicaciones inteligentes.

12.- La subtitulación de imágenes en Cognitive Services comenzó a partir del algoritmo de primer lugar de Microsoft en el desafío de subtitulación COCO 2015 que pasó la prueba de Turing el 32% del tiempo.

13.- Lanzar captionbot.ai permitió recopilar retroalimentación de usuarios para mejorar los modelos de subtitulación, aumentando la satisfacción del usuario y permitiendo la implementación en productos de Office.

14.- El Servicio de Visión Personalizada permite a los desarrolladores construir fácilmente sus propios clasificadores de imágenes robustos con un pequeño número de imágenes de entrenamiento.

15.- El Servicio de Visión Personalizada expone todas sus APIs para que los desarrolladores puedan mejorar programáticamente los modelos, como usar servicios de etiquetado de datos de terceros.

16.- La misión de Microsoft es empoderar a cada persona y organización para lograr más, incluidos los trabajadores de primera línea y de primera línea.

17.- Microsoft HoloLens es una computadora holográfica sin cables que permite la interacción con contenido digital y el mundo real.

18.- HoloLens ha sido utilizado por empresas como Japan Airlines para innovar en la capacitación y aumentar la satisfacción del cliente.

19.- HoloLens incorpora muchos años de investigación en visión por computadora de Microsoft, desde Kinect hasta Kinect Fusion y Holoportation.

20.- HoloLens utiliza visión por computadora a bordo para un seguimiento de cabeza robusto, mapeo de entornos 3D y reconocimiento de gestos.

21.- La última investigación de HoloLens mejora el seguimiento y los gestos utilizando redes neuronales profundas de última generación que se ejecutan localmente en el dispositivo.

22.- Microsoft desarrolló silicio personalizado, la Unidad de Procesamiento Holográfico, para ejecutar redes neuronales profundas con alta velocidad y bajo consumo de energía en HoloLens.

23.- La segunda versión de la HPU incorpora un coprocesador de IA para implementar de manera nativa y flexible redes neuronales profundas totalmente programables por Microsoft.

24.- Una demostración en vivo mostró el coprocesador de IA HPU 2.0 realizando segmentación y seguimiento de manos en tiempo real utilizando modelos de aprendizaje profundo como ResNet-18.

25.- Las oportunidades para comercializar la visión por computadora abarcan servicios en la nube inteligentes y dispositivos de borde inteligentes que son cada vez más potentes.

26.- Las lecciones aprendidas en Microsoft sobre la aceleración de la comercialización incluyen la importancia de los elementos humanos y la iteración entre los equipos de investigación y producto.

27.- Más empresas están reconociendo la importancia de la visión por computadora, pero necesitan invertir más en investigación para construir grandes productos.

28.- Una anécdota ilustró cómo la inversión en investigación fundamental, incluso si no es directamente aplicable, hace que el mundo sea más digno de defender.

29.- Microsoft Research ha realizado inversiones increíblemente exitosas que han beneficiado a Microsoft mientras avanzan en el campo de la visión por computadora.

30.- El orador expresó orgullo por las contribuciones de Microsoft y gratitud por la comunidad CVPR y sus fundadores al permitir este progreso durante décadas.

Bóveda de Conocimiento construida porDavid Vivancos 2024