Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

YouTube

Transformando Gafas en Asistentes Inteligentes: Open Source Vision Language Models

PyCon US via YouTube

Overview

Coursera Flash Sale
40% Off Coursera Plus for 3 Months!
Grab it
Aprende a convertir gafas comunes en asistentes inteligentes por menos de 30 dólares en esta charla de PyCon US de 30 minutos. Descubre cómo utilizar hardware accesible y modelos de código abierto para crear dispositivos que integran visión por computadora y procesamiento del lenguaje natural. Explora el origen, desarrollo e impacto de los Vision Language Models (VLM), tecnología que permite crear inteligencia artificial multimodal capaz de analizar imágenes y texto simultáneamente. Profundiza en la arquitectura y componentes esenciales de estos sistemas mientras aprendes los requisitos técnicos para construir tus propias gafas inteligentes. Interactúa con prototipos funcionales disponibles durante la presentación y experimenta en tiempo real cómo estos modelos responden a diversos escenarios. Obtén una guía práctica para configurar modelos, realizar inferencias en tu computadora y optimizarlos para funcionar con menos de 3 GB de memoria. Analiza los desafíos actuales en la implementación de estos sistemas, incluyendo la optimización de memoria y técnicas de cuantización más eficientes. Reflexiona sobre el futuro de estas tecnologías y el papel clave de la colaboración en la comunidad Open Source, destacando su potencial para transformar nuestra interacción con el entorno en la vida cotidiana.

Syllabus

Transformando Gafas en Asistentes Inteligentes: Open Source Vision Language Models

Taught by

PyCon US

Reviews

Start your review of Transformando Gafas en Asistentes Inteligentes: Open Source Vision Language Models

Never Stop Learning.

Get personalized course recommendations, track subjects and courses with reminders, and more.

Someone learning on their laptop while sitting on the floor.