Extracción de Información Estructurada de Imágenes con LangChain y LLMs Multimodales
The Machine Learning Engineer via YouTube
Gain a Splash of New Skills - Coursera+ Annual Nearly 45% Off
Free AI-powered learning to build in-demand skills
Overview
Coursera Flash Sale
40% Off Coursera Plus for 3 Months!
Grab it
Aprende a extraer información estructurada de archivos PDF utilizando LangChain y modelos de lenguaje multimodales en este tutorial técnico de 51 minutos. Explora dos implementaciones diferentes: una solución local empleando OLLAMA con LLama 3.2 Vision 11B y otra utilizando el modelo comercial Gemini Pro 1.5 flash. Accede al código fuente completo a través del notebook proporcionado en GitHub para seguir paso a paso la implementación de estas técnicas de procesamiento de documentos con capacidades de visión artificial.
Syllabus
RAG: Como Extraer Información Estructurada de Imágenes LangChain y Multimodal LLM #machinelearning
Taught by
The Machine Learning Engineer